4s特价车值得买吗:SAS常用程序(3)

来源:百度文库 编辑:偶看新闻 时间:2024/10/04 23:33:30

2.4  单因素方差分析的SAS程序

 

在阅读以下内容之前,请先阅读第一章"SAS软件基本操作"

 

单因素实验设计又称为完全随机化实验设计。该实验设计要求实验条件或实验环境的同质性很高。例如,比较a个作物品种的产量,每一品种设置n个重复,全部实验共有an次。根据完全随机化实验设计的要求,试验田中的an个试验小区的土质、肥力、含水量、小气候、田间管理等条件必须完全一致。至于哪一个品种的哪一次重复安排在哪一个小区,完全是随机的,因此得到了“完全随机化实验设计”这一名称。

 

2.9  下面以课本中例8.1的数据为例,给出单因素方差分析的SAS程序。

    解:先按以下输入方式建立一个称为a:\2-5data.dat的外部数据文件。

1

64.6

1

65.3

1

64.8

1

66.0

1

65.8

2

64.5

2

65.3

2

64.6

2

63.7

2

63.9

3

67.8

3

66.3

3

67.1

3

66.8

3

68.5

4

71.8

4

72.1

4

70.0

4

69.1

4

71.0

5

69.2

5

68.2

5

69.8

5

68.3

5

67.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SAS程序如下:

options  linesize=76;

data wheat;

infile  ‘a:\2-5data.dat’;

 input  strain  hight  @@;

run;

proc  anova;

        class  strain;

        model  hight=strain;

        means  strain / duncan;

        means  strain / lsd  cldiff;

run;

PROC ANOVA过程中的CLASS语句(分类语句)是必须的,而且一定要放在MODEL语句之前。在方差分析中要使用的分类变量(因素),首先要在CLASS语句中说明。分类变量可以是数值型的,也可以是字符型的。MODEL语句用来规定因素对实验结果的效应,一般形式为,因变量=因素效应。本例即为株高=品系效应。

MEANS语句应放在MODEL语句之后,MEANS语句后列出希望得到均值的那些变量。MEANS语句有很多选项,下面列出几个与本教材有关的选项,将选项写在MEANS语句的“/”之后。

       DUNCAN MEANS语句列出的所有主效应均值进行DUNCAN检验。

SNK MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。

T | LSD MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含           量相同时的LSD检验。

ALPHA  均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能取0.010.050.10,对于其它选项,α可取0.00010.9999之间的任何值。

CLDIFF 在选项TLSD时,过程将两个均值之差以置信区间的形式输出。

CLM 在选项TLSD时,过程把变量的每一水平均值以置信区间的形式输出。

执行上述程序,输出结果见表213

 

213 2.9方差分析输出结果

                                                                            

                                 

The SAS System

 

                           Analysis of Variance Procedure

                              Class Level Information

 

Class

Levels

Values

STRAIN

5

1 2 3 4 5

 

 

 

                  Number of observations in data set = 25

 

                                 The SAS System                              

 

                           Analysis of Variance Procedure

 

Dependent Variable: HIGHT

 

 

 

Sum of

Mean

 

 

Source

DF

Squares

Square

F Value

Pr > F

 

 

 

 

 

 

Model

4

131.740000

32.935000

42.28

0.0001

Error

20

15.580000

0.779000

 

 

Corrected Total

24

147.320000

 

 

 

 

R-Square

C.V.

Root MSE

HIGHT Mean

0.894244

1.311846

0.88261

67.2800

 

Source

DF

Anova SS

Mean Square

F Value

Pr > F

STRAIN

4

131.740000

32.935000

42.28

0.0001

 

                                  The SAS System                             

 

                            Analysis of Variance Procedure

 

                  Duncan's Multiple Range Test for variable: HIGHT

 

            NOTE: This test controls the type I comparisonwise error rate, not

                   the experimentwise error rate

 

                          Alpha= 0.05  df= 20  MSE= 0.779

 

Number of Means

2

3

4

5

Critical Range

1.164

1.222

1.259

1.285

 

        Means with the same letter are not significantly different.

 

Duncan Grouping

Mean

N

STRAIN

A

70.8000

5

4

B

68.6000

5

5

C

67.3000

5

3

D

65.3000

5

1

D

64.4000

5

2

 

                                  The SAS System                             

 

                           Analysis of Variance Procedure

 

                         T tests (LSD) for variable: HIGHT

 

            NOTE: This test controls the type I comparisonwise error rate not

                  the experimentwise error rate.

 

                 Alpha= 0.05  Confidence= 0.95  df= 20  MSE= 0.779

                            Critical Value of T= 2.08596

                        Least Significant Difference= 1.1644

 

     Comparisons significant at the 0.05 level are indicated by '***'.

 

Lower

Difference

Upper

 

 

STRAIN

Confidence

Between

Confidence

 

Comparison

Limit

Means

Limit

 

 

 

 

 

 

4  -  5

1.0356

2.2000

3.3644

***

4  -  3

2.3356

3.5000

4.6644

***

4  -  1

4.3356

5.5000

6.6644

***

4  -  2

5.2356

6.4000

7.5644

***

 

 

 

 

 

5  -  4

-3.3644

-2.2000

-1.0356

***

5  -  3

0.1356

1.3000

2.4644

***

5  -  1

2.1356

3.3000

4.4644

***

5  -  2

3.0356

4.2000

5.3644

***

 

 

 

 

 

3  -  4

-4.6644

-3.5000

-2.3356

***

3  -  5

-2.4644

-1.3000

-0.1356

***

3  -  1

0.8356

2.0000

3.1644

***

3  -  2

1.7356

2.9000

4.0644

***

 

 

 

 

 

1  -  4

-6.6644

-5.5000

-4.3356

***

1  -  5

-4.4644

-3.3000

-2.1356

***

1  -  3

-3.1644

-2.0000

-0.8356

***

1  -  2

-0.2644

0.9000

2.0644

 

 

 

 

 

 

2  -  4

-7.5644

-6.4000

-5.2356

***

2  -  5

-5.3644

-4.2000

-3.0356

***

2  -  3

-4.0644

-2.9000

-1.7356

***

2  -  1

-2.0644

-0.9000

0.2644

 

 

表中的各项内容都是很明确的,这里不再赘述。只有R2以前没有见过,请参阅课本11.2.1

    方差分析应具备三个条件,有时这三个条件并不能够得到满足,这时对原始数据就要进行变换,见课本§ 9.7。对原始数据进行变换,只需加上一个赋值语句即可,可参考配对数据t检验的SAS程序。