【发布时间】:2018-04-15 07:21:46
【问题描述】:
我正在使用波士顿房价数据进行一些线性回归。
看Influence Plot,有多个高残差点和几个高杠杆点。
如何去除高残差和高杠杆点,以便重新运行线性回归模型并重新绘制影响图和 Q-Q 图?
输入:
m = ols('PRICE ~ CRIM + RM + PTRATIO',bos).fit()
print(m.summary())
截断输出:
coef std err t P>|t| [0.025 0.975]
Intercept -3.3066 4.038 -0.819 0.413 -11.240 4.627
CRIM -0.2021 0.032 -6.301 0.000 -0.265 -0.139
RM 7.3816 0.402 18.360 0.000 6.592 8.171
PTRATIO -1.0742 0.133 -8.081 0.000 -1.335 -0.813
影响图:
QQ图:
【问题讨论】:
标签: python plot regression linear-regression outliers