(1)离群点
如何识别离群点?
1、Q-Q图,落在置信区间带外的点即可被认为是离群点。
2、一个粗糙的判断准则:标准化残差值大于2或者小于2的点可能是离群
3、library(car)
outlierTest(fit) 显示离群点
rstudent unadjusted p-value Bonferonni p
Nevada 3.542929 0.00095088 0.047544
(2)高杠杆值点
它们是由许多异常的预测变量值组合起来的,与响应变量值没有关系
高杠杆值的观测点可通过帽子统计量(hat statistic)判断
hat.plot <- function(fit){
p <

本文介绍了离群点、高杠杆值点及强影响点的识别方法,并提出了通过删除异常观测值、变量变换等手段来改进线性模型的有效策略。


被折叠的 条评论
为什么被折叠?



