【发布时间】:2018-01-29 10:20:33
【问题描述】:
我正在尝试使用 SciKitLearn 构建决策树,它告诉我: 输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。
对输入数据运行 .isnull().any() 会为每一列返回 False。
有四个 float64 类型的输入列;其中的数据格式正确,保留小数点后两位,没有疯狂的值。
罪魁祸首可能是什么,我该如何解决?
y = df["CutoffValue"]
X = df_new
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,y)
【问题讨论】:
-
你能展示 'df_new' 和 df 本身的结构/快照吗?
标签: python machine-learning scikit-learn decision-tree