【发布时间】:2015-07-08 04:03:51
【问题描述】:
我是 Python 新手,正在尝试在 pandas 数据帧上使用 sklearn 执行线性回归。这就是我所做的:
data = pd.read_csv('xxxx.csv')
之后,我得到了一个包含两列的 DataFrame,我们称它们为“c1”、“c2”。现在我想对 (c1,c2) 的集合做线性回归,所以我输入了
X=data['c1'].values
Y=data['c2'].values
linear_model.LinearRegression().fit(X,Y)
导致以下错误
IndexError: tuple index out of range
这里有什么问题?还有,我想知道
- 可视化结果
- 根据结果进行预测?
我搜索并浏览了大量网站,但似乎没有一个网站可以指导初学者正确的语法。也许对专家来说显而易见的事情对于像我这样的新手来说并不那么明显。
你能帮忙吗?非常感谢您的宝贵时间。
PS:我注意到大量初学者问题在 stackoverflow 中被否决。请考虑这样一个事实,对于专家用户来说似乎很明显的事情可能需要初学者几天才能弄清楚。在按下向下箭头时请谨慎行事,以免损害此讨论社区的活力。
【问题讨论】:
-
可能是数据问题。提供 csv 的代表性样本可能会有所帮助。另外,查看scikit-learn.org/stable/auto_examples/linear_model/…,在底部创建回归对象 (regr = linear_model.LinearRegression()),然后调用 rers.fit(X, Y)。
-
关于你的 PS:我注意到许多初学者的问题由于没有根据 SO 实践格式化他们的问题而被否决:stackoverflow.com/help/how-to-ask
标签: python pandas scikit-learn dataframe linear-regression