【发布时间】:2021-04-04 09:49:17
【问题描述】:
我正在尝试创建一个模型来预测下面的结果列:
Date Open High Close Result
1/22/2010 25.95 31.29 30.89 0.176104
2/19/2010 23.98 24.22 23.60 -0.343760
3/19/2010 21.46 23.16 22.50 0.124994
4/23/2010 21.32 21.77 21.06 -0.765601
5/21/2010 55.41 55.85 49.06 0.302556
我使用的代码是:
import pandas
from sklearn.tree import DecisionTreeClassifier
dataset = pandas.read_csv('data.csv')
X = dataset.drop(columns=['Date','Result'])
y = dataset.drop(columns=['Date', 'Open', 'High', 'Close'])
model = DecisionTreeClassifier()
model.fit(X, y)
但我收到一个错误:
ValueError: Unknown label type: 'continuous'
也欢迎提出使用其他算法的建议。
【问题讨论】:
-
顺便说一句,标签中有连续值(用于回归任务)。但是您正在执行分类器。这将采用离散值(二进制或多类)使用
DecisionTreeRegressor
标签: python pandas machine-learning scikit-learn decision-tree