【发布时间】:2012-11-05 17:13:10
【问题描述】:
使用 Weka 的 C4.5 (J48) 决策树处理缺失特征属性值的最佳方法是什么?在训练和分类过程中都会出现缺失值的问题。
如果训练实例中缺少值,我是否正确假设我放置了一个“?”该功能的价值?
假设我能够成功构建决策树,然后从 Weka 的树结构中用 C++ 或 Java 创建自己的树代码。在分类期间,如果我尝试对新实例进行分类,我应该为具有缺失值的特征赋予什么值?如果我有一个未知值的决策节点,我将如何下降树?
使用朴素贝叶斯会更好地处理缺失值吗?我只会为他们分配一个非常小的非零概率,对吗?
【问题讨论】:
标签: machine-learning data-mining weka decision-tree classification