浙江消防总队地址:三种常用的不同变量之间相关系数的计算方法

来源:百度文库 编辑:偶看新闻 时间:2024/03/28 18:53:40
1.定类变量之间的相关系数.
定类变量之间的相关系数,只能以变量值的次数来计算,常用系数法,
其计算公式为:
                                             (3.2.12)
式中,为每一类x中y分布的众数次数;为变量y各分类次数的众数次数;n为总次数。一般来说,入系数在0~1之间取值,值越大表明相关程度越高。
例如,性别与对吸烟的态度资料见表3—2。
表3--2                        性别与对吸烟态度
态度y
性别x


合计(Fy)
容忍
反对
37
15
8
42
45
57
合计(Fx)
52
50
102
从y的分布来看,对吸烟的态度众数是“反对”,众数次数为57,即Fym=57。再从x的每一个分组(男、女)中y的次数分布来看,男性中y的分布众数是“容忍”,次数为37(f1m);女性中y的分布众数是“反对”,次数为42(f2m);总次数为102(n)。于是,

从计算结果可知,性别与对吸烟态度的相关程度为0.49,属于中等相关。
2.定序变量之间的相关系数
定序变量之间的相关测量常用Gamma系数法和Spearman系数法。Gamma系数法计算公式为:
                         (3.2.13)
式中,G为系数;Ns为同序对数目;Nd为异序对数目。
所谓序对是指表明高低位次的两两配对,如果一对个案在变量x,y的分类表现位次一致,则为同序对;如果位次相反,则为异序对。
G系数取值在—1--十1之间。G=1,表示完全正相关;G=-1,表示完全负相关;G=0,表示完全不相关;-1                                      (3.2.14)
式中,P为系数;D为所测定的两个数列中每对项目之间的登记差,这个差的正值之和等于负值之和;N为项数。系数p主要代表两个定序变量的等级相关程度,其取值范围和相关程度含义与G系数相同。
3.定距变量之间的相关系数
定距变量之间的相关测量常用Pearson系数法。对于未分组资料,Pearson系数法计算公式为:

对于已分组资料,Pearson系数法计算公式为

r 系数取值范围和相关程度的含义与G系数相同。