【发布时间】:2017-12-01 06:45:58
【问题描述】:
我已经从sklearn 导入了LogisticRegression 模型。我的数据集有 785 列,其中第一列是我要训练预测的标签。
这是我的代码。
clf = LogisticRegression()
clf = clf.fit(train[[1:785]], train['label'])
我收到以下错误,
File "<ipython-input-22-1c2c333722ad>", line 2
clf = clf.fit(train[[1:785]], train['label'])
^
SyntaxError: invalid syntax
如何在不明确提及所有列名的情况下选择除第一列之外的所有列。
【问题讨论】:
-
请打印出
train.__class__。 -
pandas.core.frame.DataFrame -
clf = clf.fit(train.ix[:, 1:], train['label'])。这将选择除第一列之外的每一列。 -
@E.Z.请注意,从 0.20 向上,ix is deprecated。推荐
iloc和loc。 -
pandas Dataframe 中的方括号
[[不接受切片作为索引。他们接受列或列索引的列表。除了@E.Z。的评论,也可以使用clf = clf.fit(train[[i for i in range(785)]], train['label'])。
标签: python-3.x pandas scikit-learn