【发布时间】:2018-02-28 11:30:29
【问题描述】:
我正在寻找拟合线性回归后的影响统计数据。在 R 中,我可以像这样(例如)获得它们:
hatvalues(fitted_model) #hatvalues (leverage)
cooks.distance(fitted_model) #Cook's D values
rstandard(fitted_model) #standardized residuals
rstudent(fitted_model) #studentized residuals
等等
在拟合这样的模型后,如何在 Python 中使用 statsmodels 时获得相同的统计数据:
#import statsmodels
import statsmodels.api as sm
#Fit linear model to any dataset
model = sm.OLS(Y,X)
results = model.fit()
#Creating a dataframe that includes the studentized residuals
sm.regression.linear_model.OLSResults.outlier_test(results)
编辑:请参阅下面的答案...
【问题讨论】:
标签: python scikit-learn linear-regression statsmodels