【发布时间】:2012-11-19 13:18:27
【问题描述】:
我正在使用 J48 对由数值和标称值组成的实例进行分类。 我的问题是我不知道在我的程序中会遇到哪个名义价值。 因此,我需要“即时”更新模型的名义属性数据。
例如,假设我只有 2 个属性,职业和年龄,运行如下: OccuptaionAttribute = {}。
输入:[钢琴老师,22 岁]。
OccuptaionAttribute = {钢琴老师}。
输入:[学校老师,30]
OccuptaionAttribute = {钢琴老师,学校老师}。
输入:[钢琴老师,40]
OccuptaionAttribute = {钢琴老师,学校老师}。
等等
现在我尝试通过复制以前的属性、添加新属性然后更新模型的数据来手动执行此操作。 训练模型时效果很好。
但是! 当我想分类一个新实例时,比如 [SW 工程师,52],OccuptaionAttribute 已更新: OccuptaionAttribute = {钢琴老师,学校老师,软件工程师},但树本身之前从未“遇到”“软件工程师”,因此无法满足分类并抛出异常。
您能指导如何处理上述情况吗? Weka 是否有任何机制支持上述问题?
谢谢!
【问题讨论】:
标签: machine-learning data-mining weka