【发布时间】:2017-05-03 15:20:15
【问题描述】:
我在“scikit learn/decision tree/export graphviz”的决策树中得到错误的类名。程序如下:
import matplotlib.pyplot as plt
import matplotlib.image as img
import pydot
from sklearn import tree
digital_table = [[0, 0], [0, 1], [1, 0], [1, 1]]
digital_label = ['zero', 'one', 'two', 'three']
digital_name = ['idx-1', 'idx-2']
digital_tree = tree.DecisionTreeClassifier()
digital_tree.fit(digital_table, digital_label)
with open("digital.dot", 'w') as f:
f = tree.export_graphviz(digital_tree,
feature_names=digital_name,
class_names=digital_label,
filled=True, rounded=True,
out_file=f)
(graph,) = pydot.graph_from_dot_file("digital.dot")
graph.write_png("digital.png")
plt.imshow(img.imread('digital.png'))
plt.show()
输出如下:
问题在于叶子中显示的类名。例如,如果 idx-1 为 1 且 idx-2 为 1,则绿色框应标记为“三”。但是,图像显示标签为“一”。谁能给你的cmets?
【问题讨论】:
-
万一还有人有疑问,问题是模型是针对字符串标签
['zero', 'one', 'two', 'three']进行训练的。该函数不知道哪一个调用零,哪一个调用一。所以它最终以字母顺序使用它们one变为 0,three变为 2,依此类推。处理这个问题的最好方法是将标签转换为整数类[0, 1, 2, 3]
标签: scikit-learn graphviz decision-tree