罂粟籽 有毒有害:回归模型检验、假定
来源:百度文库 编辑:偶看新闻 时间:2024/04/28 06:57:34
简单线性回归和多元线性回归的模型假定、诊断与检验
回归模型假定检验
含义
检验方法
操作步骤
判断结果
线性假定
Y与Xi之间的关系呈线性
1、散点图
2、残差与自变量的散点图
1、scatterplot
2、zpred—zresid(横—纵)
1、观察
2、无明显趋势则为线性,长方形区域内随机分布
残差e随机分布
均值为0,方差为 s2的随机变量
残差图:学生化残差与标准化预测值
(SRESID,Y轴)(ZPRED,X轴)做散点图
残差序列点随机地分布在经过0的直线上下
异常点,outlier
对既定模型偏离很大的数据点
同上
同上
同上
强影响点
对统计量的取值有非常大的影响力的点,标准化残差大于2或3
1、库克距离
2、威尔士距离
1、Cook距离
2、Welsch-Kuh距离
1、当Ci大于1时为强影响点
残差e正态分布
反应观察值与模拟值的差异
1、标准化残差直方图
2、PP图
1、Plots-Histogram
2、Normal Probability Plots
1、观察
2、残差呈直线分布
残差e齐次性
残差的方差一致性,残差值不随所有变量取值水平而改变
残差与自变量的散点图
zpred—zresid(横—纵)
(同线性假定)
残差分布在±2个标准差之间,表示无异常点和强影响点
多重共线性
各自变量之间呈强相关
1、杜宾-沃特森检验
2、容忍度检验
3、方差膨胀因子
4、条件参数
5、变异构成
1、Durbin—Watson检验,
2、Tolerance
3、VIF
4、condition index
5、variance proportion
1、D.W值越接近于2,越倾向于无自相关。 D.W值接近于零,正的自相关;D.W值接近4,负自相关
2、容忍度越小共线性越严重
3、大于10时共线性严重
4、大于30存在共线性
5、大于0.5存在共线性
回归模型显著检验
含义
检验方法
操作步骤
判断结果
相关系数检验
Y与Xi之间的线性相关显著
F检验
Model summary
看显著性水平
回归系数检验
各个回归系数是否显著
t检验
Coefficients
看显著性水平
拟合优度检验
回归模型的拟合程度
F检验
方差分析表
看显著性水平
如何删除显著但贡献不大的自变量
有些自变量虽然显著,但是边际贡献较小
偏误差散点图
Produce all partial plots
没有明显的趋势
在箱形图中,最底部的水平线段表示数据的最小值(奇异点除外),顶部的水平线段是数据的最大值(奇异点除外),中间矩形箱子的底部线段是数据的第一个四分位数的值(即P25),箱子顶部线段是数据的第三个四分位数的值(即P75)。箱子中间的水平线段是数据的中位值(即Md)。
奇异值是指大于P75+1.5(P75 – P25)或小于P25 - 1.5(P75 – P25)的数值,标记为o
而对大于P75+3(P75 – P25)或小于P25 – 3(P75 – P25)的数值称为极值,标记为*