【发布时间】:2016-02-03 20:33:05
【问题描述】:
我创建了一个 3 位邮政编码数据的 OLS 模型:
x = nsaid_df[['Segment', 'FTE_A', 'FTE_B', 'FTE_C', 'inc100k']]
y = nsaid_df['Sales']
model = sm.OLS(y, x, missing='drop').fit()
model.summary()
该模型将人口统计数据(在 3 位邮政编码级别)与产品的销售额联系起来。我现在想使用该模型来预测 5 位数邮政编码级别的销售额。我有一个 DataFrame 包含与 3 位模型完全相同的系列,但每个 5 位邮政编码。我原以为我可以简单地写:
predict5 = model.predict(alx5)
这给出了一个有点神秘的错误信息:
“形状 (33678,15) 和 (5,) 未对齐:15 (dim 1) != 5 (dim 0)”
我的问题是,我如何使用我的模型来预测数据框中的值,该值不同于用于拟合原始模型的值?
【问题讨论】:
-
@WoodChopper - 不同的错误
标签: python pandas regression statsmodels