甘孜武警支队:配对t-test

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 13:20:56
 

配对t-检验

组内变异

目的

假设

数据的排列

t-检验矩阵

多组间比较

组内变异

    上文所述,通过两组均值的差别体现两变量关联的大小,很大程度上依赖于组内观察值变异程度。一定的组间均值差异体现自变量与因变量间是强关联还是弱关联依赖于每组中值的变异程度。例如男性WCC的平均值为102,女性为104。如果男性的WCC值都在101-103之间,女性都在103-105之间,那么这差别2就很能说明问题。即我们就可从性别上较好地预测WCC值。 但同样差别为2,如果观察值变异很大(范围是0-200),我们认为这点差异是极其微小。换句话说,组内变异的减小增强了检验的敏感性。

目的

      非独立样本(配对样本)的t-检验能够帮助我们使用一类特定的设计,这类设计中,可容易地辨别出组内变异的来源并剔除出分析。统计学上两次测量同一观察对象的两组资料(如治疗前与治疗后),那么组内变异中的一大部分是由于个体观察对象的差异所致。注意这与完全独立的两组间比较不同(成组t检验 )。在此个体差异也导致误差变异,独立样本中我们对此无能为力,因为我们无鉴别(或提取)观察对象差异的方差。但是对同一样本检测两次,我们可容易地鉴别(提取)出这部分的方差。统计学上我们并不要对每一组进行单独处理,分析原始数据,而是对每个观察对象两次测量的变化进行分析。将对象中第二次的值减去第一次的值,分析这些纯差异而排除了数据中由于观察对象的不同基线所产生的变异。这就是配对t-检验所要做的,与成组t-检验比较结果更准确(更敏感或检验效率更高)。

假设

    成组t-检验理论假设也可用于配对样本检验;配对的差异须正态分布。如果不满足条件,只能用非参数检验。    

数据的排列

    统计学上,可以用非独立样本t-检验分析数据集中的任意两个变量。但是当数据集中的两变量逻辑上或方法学上不可比,使用这种方法就无意义了。例如比较病人治疗前后收缩压均值时,使用不同计数方法或不同的计量单位,可因此得到高度显著性的t-检验值。下面是一个可用非独立t-检验分析的例子。

 

治疗后血压

治疗前血压

对象 1
对象 2
对象 3
对象 4
对象 5
...

111.9
109
143
101
80
...

113
110
144
102
80.9
...

 

治疗前后血压差值为1

    与原始数据的范围比较(第一样本中80-143)两种情况下的均值差别相当小(为1)。但是配对t-检验只对纯差别进行分析,而不是原始数据以及潜在的差异。因此,此处1不是与原始数据中的方差比较而是与治疗前后差异的方差进行比较,这个方差很小为0.2。与这个方差相比,差别为1效应是相当大的了,具有统计学意义。     

t-检验矩阵

    非独立样本的t-检验可用于多个变量的统计计算,并以缺失值casewise or pairwise 删除后的矩阵显示,很象相关矩阵。因此相关矩阵中的注意事项也适用与t-检验矩阵。

  1. 注意由于对缺失值配对删除引起的反常现象。

  2. 注意偶然性的显著性检验值问题。           

复杂的组间比较

    如果有两个以上的相关样本(如治疗前,治疗后1,治疗后2),需要比较就要使用重复测量的方差分析。这种方法是非独立t-检验的推广,具有增加分析敏感性的特性。例如不仅可以同时控制因变量的基线,还可以控制设计中的其他因素或(和)多个相互作用的因变量。(MANOVA;详细情况见方差分析)。