R语言plot(lm)绘图结果解读

最新推荐文章于 2025-04-13 01:00:00 发布

原创

最新推荐文章于 2025-04-13 01:00:00 发布 · 1.8w 阅读

169

标签

#数据分析 #r语言 #统计学

本文探讨了线性模型的有效性和优化方法，强调了模型诊断的重要性。通过五个关键假设的验证，包括正态误差、恒定误差方差、无影响案例、线性关系和共线性，以及R语言的模型诊断图，如残差与拟合值的关系、正态QQ图、尺度位置图和残差与杠杆图，来确保模型的准确性和可靠性。

在任何线性模型中，能够直接“lm”（模型有意义），既要考虑各个参数的t-test所得出的p-value，也要考虑总体模型F-检验得出的p-value。在这之后，还要清楚一个线性模型是建立在以下五个假设的基础上的。如果不满足以下五个假设，那么模型即使通过了t-test和F-test，其预测效果也大打折扣。同时，也可以通过对这五个指标的研究，进一步优化模型（比如使用其他非参数统计方法，Box-Cox等变换方法，基于AIC,BIC，Adjusted-R^2,Cpd等方法的特征选择，Lasso，Ridge-regression，Elastic Net等等）。

• Normal i.i.d. errors
• Constant error variance
• Absence of influential cases
• Linear relationship between predictors and outcome variable
• Collinearity

而针对这五个假设进行验证，最直观和简单的方法就是用R语言自带的模型诊断图。