【发布时间】:2018-10-08 12:42:38
【问题描述】:
我似乎无法将 ID3 分类算法应用于 Mushroom.arff 数据集。该数据集仅包含名义属性。我认为我需要对其进行预处理才能使其正常工作,但我不知道如何操作。我该如何进行?
【问题讨论】:
-
感谢编辑和回答问题。
标签: machine-learning classification weka decision-tree
我似乎无法将 ID3 分类算法应用于 Mushroom.arff 数据集。该数据集仅包含名义属性。我认为我需要对其进行预处理才能使其正常工作,但我不知道如何操作。我该如何进行?
【问题讨论】:
标签: machine-learning classification weka decision-tree
ID3 算法是一种未经修剪的决策树生成算法,具有以下properties:
Mushroom dataset 包含 22 个标称属性并满足第一个条件,但检查后您会发现属性 'stalk-root' 有 2480 (31 %) 缺失值。这就是当你尝试分类时默认情况下在 Weka 中无法选择它的原因。
为了解决这个问题,您可以继续使用这两种解决方案。
您可以删除该属性。
您可以使用技术来处理缺失值。
【讨论】: