四川消防学校邮编:SPSS操作
第四节 统计推断的SPSS操作
一、 平均数的显著性检验与总体平均数的估计
1.数据
例1:某区英语测验平均成绩为65分,先从某中学随机抽取20份试卷,其分数为:
72 76 68 78 62 59 64 85 70 75
61 74 87 83 54 76 56 66 68 62
问该校初三英语水平与全区是否基本一致(α=0.05)。
将上面的数据输为一列,命名为score,保存到文件“
2.理论分析:
本例题数据是成绩,其总体为正态分布,总体方差未知,符合总体平均数显著性检验条件。
3. SPSS菜单可直接提供平均数显著性检验
⑴单击主菜单Analyze/Compare Means/One-Sample T Test…,进入主对话框,如下图5-17所示:
图7-1:单样本总体平均数检验主对话框 图5-18:单样本t检验Options窗口
① 把指定分析的变量score从左侧的矩形框选入到右边的检验变量表列(TestVariable(s))中;
② 在主对话框右下方的检验值(Test Value)后面的方框中填入指定检验的总体均值,此处应为65。
⑵点击Options…选项出现单样本t检验的选择窗口(图5-18),
① 在此窗口可以定义输出的置信区间(Confidence lnlerval),系统默认设置为95%的置信区间,用户可以按照需要改变这一数据。
② 在Options窗口还可定义处理缺失值(Missing Values)的方法。一般情况下大多保持默认(Exclude cases analysis by analysis)即可。
③ 设置完成后,点击continue返回主对话框。
(3)在主对话框中点击OK,得到此程序运行结果。
4.结果及解释
(1) 输出样本统计量的基本描述信息
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
20
69.8000
9.4735
2.1183
上表提供所分析变量的基本描述统计量的信息,依次为样本容量(N)、均值(Mean)、标准差(Std. Deviation)、标准误(Std. Error Mean),本例中所调查的样本容量N=20,样本平均值为69.80(Mean=69.80),标准差为9.4735(Std. Deviation=9.4735),标准误为2.1183(Std. Error Mean)。
(2)输出样本均值与总体均值差异性检验结果
One-Sample Test
Test Value = 65
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
2.266
19
.035
4.8000
.3663
9.2337
上表显示了单样本t检验的结果,最上面一栏为所检验的总体均值(Test Value=65),下面依次为指定分析的变量(SCORE)、t值(t=2.266)、自由度(df=19)、双侧检验的显著性水平(Sig. (2-tailed=0.035)、样本均值与总体均值之差(Mean Difference=4.8000)、两均值之差95%的置信区间(95% Confidence Interval of the Difference):(0.3663,9.2337)。上面例1检验结果表明,在0.05的显著性水平下,该校初三英语水平与全区存在显著差异。即指某校初三样本平均数与全区总体平均数有显著性差异,或者说样本平均数与总体平均数的差异不是抽样误差所致,而是该样本来自另一总体。作此结论犯错误的概率小于5%。 样本均值69.8与总体均值65差异4.8的95%的置信区间为(0.3663,9.2337),该区间不包含零,所以根据这一结果也可得到样本均值与总体均值存在显著差异的结论。
二、两独立样本的平均数差异的显著性检验
SPSS菜单提供的直接分析程序适于两总体都是正态分布、两总体方差都未知的独立样本情况(相关样本的程序随后介绍)。下面结合实例简单说明如何应用SPSS进行两个独立样本的平均数差异的显著性检验。
1.数据
例2:采用第二章中学生考试成绩的数据(文件
2.理论分析
上面例2中的数据,学生考试成绩按照性别分成两组,每组可以看成是服从正态分布的连续性变量,并且方差未知,对于不同性别学生样本可以看成是相互独立的。
3.用SPSS进行独立样本t检验
(1)打开数据文件“
图5-19 独立样本t检验主对话框 图5-20 数字型变量组定义窗口
(2)单击主对话框中的定义组(define groups…)按钮进入定义组别对话框,对于分组变量为数值型的变量,定义分组有两种方式:
·Use Specified Values. 由用户指定分组的值,这是默认的情况。输入与分组变量两个分类相对应的第一组和第二组的值,具有其它值的观测不被分析。
·Cut Point 用户指定分割点,所有大于或等于分割点值的观测被分到一个组,其余的分到另外一个组。
应该注意,对于字符型的分组变量,定义分组只有Use Specified Values一种方式。
这里数据中性别男女分别用数字0和1表示,所以这里在第一组(Group 1)后的方框中输入数字0,在第一组(Group 2)后的方框中输入数字1,我们指明了用以区分两组数据的变量值分别为0与1。如图5-20所示。点击Continue返回主对话框
(3)在主对话框中点击Options…选项,出现独立样本t检验的选择窗口,该窗口与单样本t检验的选择窗口(图5-18)类似,在此窗口可以定义输出的置信区间和处理缺失值的方法。这里我们采用系统默认设置。
(4)点击OK得到程序运行结果。
4.结果及解释
(1)输出分组描述统计量表
Group Statistics
SEX
N
Mean
Std. Deviation
Std. Error Mean
男生
52
79.731
7.826
1.085
女生
48
79.625
6.127
.884
(2)输出独立样本检验结果
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
F
Sig.
t
df
Sig. (2-tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the Difference
Lower
Upper
Equal variances assumed
3.982
.049
.075
98
.941
.106
1.414
-2.699
2.911
Equal variances not assumed
.076
95.517
.940
.106
1.400
-2.673
2.885
三、相关样本的平均数差异的T检验
适用条件为两总体正态分布、两总体方差都未知,且两个样本之间存在一一对应关系。
1.数据
例3:对12名被试进行两种夹角(15度,30度)的缪勒—莱尔错觉实验,结果如下(数据在下面程序中),问两种夹角的情况下错觉量是否有显著差异?
上面所有的例子都是直接在SPSS数据编辑窗口(SPSS Data Editor)将数据输入,这里我们介绍另一种输入数据的方法,在SPSS句法编辑窗口(SPSS Syntax Editor)输入数据。在SPSS主窗口选择菜单File/New/Syntax,即打开一个新的句法编辑窗口,在该窗口输入下列程序(有关语句的具体说明可以参考过关专门介绍SPSS的文献),然后在句法编辑窗口选择菜单Run/All(也可以先用鼠标选中要执行的语句,然后选择Run/Selection),便可以在数据编辑窗口得到类似于上面例题中介绍过的数据文件。
data list free/ subject first second.
begin data.
1 12 13
2 13 13
3 14 15
4 12 15
5 12 16
6 13 16
7 12 12
8 11 11
9 13 13
10 14 14
11 13 13
12 14 16
end data.
在新生成的数据文件中,第一列“subject”为被试编号,第二列“first” 为15度夹角时的错觉量,第三列“second”为30度夹角时的错觉量。将生成的数据文件保存为“
2.理论分析
上述数据为12个被试前后两次在不同条件下测量的结果,因为两次的测量结果受同一被试特征的影响,所以可以看成是相关样本。对于第一次和第二次的错觉试验结果可以看成是从总体上服从正态分布的连续性资料,两样本总体方差未知,所以对这样两组数据平均数之间差异性的检验应用配对样本的t检验。
3.相关样本t检验过程
(1)单击主菜单Analyze/Compare Means / Paired-Samples T Test…进入主对话框,将所要比较的两个变量“first”和“second”同时从左边的矩形框选入右边的配对变量表列(Paired Variables)下的矩形框,如图5-21所示(把相关变量选入到分析变量表中去):
图5-21:配对样本t检验对话框
(2)Options…选项与前面独立样本中检验选项相同,可以提供差异的置信区间估计和处理缺失值的方法,这里我们采用系统默认的设置。
(3)点击OK得到结果。
4.结果及解释
(1)输出配对样本描述统计量
Paired Samples Statistics
Mean
N
Std. Deviation
Std. Error Mean
FIRST
12.7500
12
.9653
.2787
SECOND
13.9167
12
1.6765
.4840
Paired Samples Correlations
N
Correlation
Sig.
FIRST & SECOND
12
.492
.105
(3)输出配对样本t检验结果
Paired Samples Test
Paired Differences
95% Confidence Interval of the Difference
t
df
Sig.
(2-tailed)
Mean
Std. Deviation
Std. Error Mean
Lower
Upper
Pair 1
first - second
-1.1667
1.4668
.4234
-2.0986
-.2347
-2.755
11
.019
上表依次提供了两样本差的平均数、标准误、置信区间、t值、自由度及双侧检验的显著性水平。例3中数据的检验结果表明: 15度与30度缪勒—莱尔错觉实验结果平均值的差异为-1.1667,标准差为1.4668,标准误为0.4234;两组平均数差异的95%的置信区间为(-2.0986,-0.2347),不包含0在内,说明两组均值的差异显著;两样本差异性检验t统计量的值为-2.755,自由度11,对应P=.019<.05,同样说明两种条件下的错觉量差异显著。
四、方差齐性的显著性检验
适合于独立样本的方差齐性的检验,根据前面的独立样本的平均值的检验结果中提供的Levene检验统计量的F值和P值来判断两组独立样本的方差是否相等。
对于总体标准差、总体方差差异性的检验和相关样本的方差齐性的检验,SPSS不能直接进行检验。
五、相关系数的显著性检验
SPSS可以通过点击Analyze/Correlate/Bivariate…,得到斯皮尔曼积差相关系数、斯皮尔曼等级相关系数和肯德尔τ系数,并且给出相关系数显著性检验的结果(具体内容见第三章第五节)。但是应该特别注意,由SPSS提供的相关系数显著性检验的结果,只是用来检验相关系数与零的差异是否显著,至于两个相关系数之间差异的显著性检验和相关系数与一个非零常数的差异的显著性检验,不能直接通过SPSS菜单操作完成。