4s特价车值得买吗:SAS常用程序(3)
来源:百度文库 编辑:偶看新闻 时间:2024/10/04 23:33:30
2.4 单因素方差分析的SAS程序
在阅读以下内容之前,请先阅读第一章"SAS软件基本操作"。
单因素实验设计又称为完全随机化实验设计。该实验设计要求实验条件或实验环境的同质性很高。例如,比较a个作物品种的产量,每一品种设置n个重复,全部实验共有an次。根据完全随机化实验设计的要求,试验田中的an个试验小区的土质、肥力、含水量、小气候、田间管理等条件必须完全一致。至于哪一个品种的哪一次重复安排在哪一个小区,完全是随机的,因此得到了“完全随机化实验设计”这一名称。
例2.9 下面以课本中例8.1的数据为例,给出单因素方差分析的SAS程序。
解:先按以下输入方式建立一个称为a:\2-5data.dat的外部数据文件。
1
64.6
1
65.3
1
64.8
1
66.0
1
65.8
2
64.5
2
65.3
2
64.6
2
63.7
2
63.9
3
67.8
3
66.3
3
67.1
3
66.8
3
68.5
4
71.8
4
72.1
4
70.0
4
69.1
4
71.0
5
69.2
5
68.2
5
69.8
5
68.3
5
67.5
SAS程序如下:
options linesize=76;
data wheat;
infile ‘a:\2-5data.dat’;
input strain hight @@;
run;
proc anova;
class strain;
model hight=strain;
means strain / duncan;
means strain / lsd cldiff;
run;
在PROC ANOVA过程中的CLASS语句(分类语句)是必须的,而且一定要放在MODEL语句之前。在方差分析中要使用的分类变量(因素),首先要在CLASS语句中说明。分类变量可以是数值型的,也可以是字符型的。MODEL语句用来规定因素对实验结果的效应,一般形式为,因变量=因素效应。本例即为株高=品系效应。
MEANS语句应放在MODEL语句之后,MEANS语句后列出希望得到均值的那些变量。MEANS语句有很多选项,下面列出几个与本教材有关的选项,将选项写在MEANS语句的“/”之后。
DUNCAN: 对MEANS语句列出的所有主效应均值进行DUNCAN检验。
SNK: 对MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。
T | LSD: 对MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含 量相同时的LSD检验。
ALPHA= 均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能取0.01、0.05和0.10,对于其它选项,α可取0.0001到0.9999之间的任何值。
CLDIFF: 在选项T和LSD时,过程将两个均值之差以置信区间的形式输出。
CLM: 在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。
执行上述程序,输出结果见表2-13。
表 2-13: 例2.9方差分析输出结果
The SAS System
Analysis of Variance Procedure
Class Level Information
Class
Levels
Values
STRAIN
5
1 2 3 4 5
Number of observations in data set = 25
The SAS System
Analysis of Variance Procedure
Dependent Variable: HIGHT
Sum of
Mean
Source
DF
Squares
Square
F Value
Pr > F
Model
4
131.740000
32.935000
42.28
0.0001
Error
20
15.580000
0.779000
Corrected Total
24
147.320000
R-Square
C.V.
Root MSE
HIGHT Mean
0.894244
1.311846
0.88261
67.2800
Source
DF
Anova SS
Mean Square
F Value
Pr > F
STRAIN
4
131.740000
32.935000
42.28
0.0001
The SAS System
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: HIGHT
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Alpha= 0.05 df= 20 MSE= 0.779
Number of Means
2
3
4
5
Critical Range
1.164
1.222
1.259
1.285
Means with the same letter are not significantly different.
Duncan Grouping
Mean
N
STRAIN
A
70.8000
5
4
B
68.6000
5
5
C
67.3000
5
3
D
65.3000
5
1
D
64.4000
5
2
The SAS System
Analysis of Variance Procedure
T tests (LSD) for variable: HIGHT
NOTE: This test controls the type I comparisonwise error rate not
the experimentwise error rate.
Alpha= 0.05 Confidence= 0.95 df= 20 MSE= 0.779
Critical Value of T= 2.08596
Least Significant Difference= 1.1644
Comparisons significant at the 0.05 level are indicated by '***'.
Lower
Difference
Upper
STRAIN
Confidence
Between
Confidence
Comparison
Limit
Means
Limit
4 - 5
1.0356
2.2000
3.3644
***
4 - 3
2.3356
3.5000
4.6644
***
4 - 1
4.3356
5.5000
6.6644
***
4 - 2
5.2356
6.4000
7.5644
***
5 - 4
-3.3644
-2.2000
-1.0356
***
5 - 3
0.1356
1.3000
2.4644
***
5 - 1
2.1356
3.3000
4.4644
***
5 - 2
3.0356
4.2000
5.3644
***
3 - 4
-4.6644
-3.5000
-2.3356
***
3 - 5
-2.4644
-1.3000
-0.1356
***
3 - 1
0.8356
2.0000
3.1644
***
3 - 2
1.7356
2.9000
4.0644
***
1 - 4
-6.6644
-5.5000
-4.3356
***
1 - 5
-4.4644
-3.3000
-2.1356
***
1 - 3
-3.1644
-2.0000
-0.8356
***
1 - 2
-0.2644
0.9000
2.0644
2 - 4
-7.5644
-6.4000
-5.2356
***
2 - 5
-5.3644
-4.2000
-3.0356
***
2 - 3
-4.0644
-2.9000
-1.7356
***
2 - 1
-2.0644
-0.9000
0.2644
表中的各项内容都是很明确的,这里不再赘述。只有R2以前没有见过,请参阅课本11.2.1。
方差分析应具备三个条件,有时这三个条件并不能够得到满足,这时对原始数据就要进行变换,见课本§ 9.7。对原始数据进行变换,只需加上一个赋值语句即可,可参考配对数据t检验的SAS程序。