【发布时间】:2015-09-20 12:27:49
【问题描述】:
我有一个庞大的数据集,并且想做一个多标签分类,其中每个对象都可以分配给多个类。我在 Apache Mahout 中使用 Naive Bayer 分类器来做到这一点。然而,它不是为多标签分类而设计的,只是将具有最高概率的类分配给每个对象。如何将此分类器扩展到我的场景?
我正在考虑的一个解决方案是设置一个阈值并分配概率大于阈值的类。但是找到阈值并不容易,所以它不起作用。不知道有没有人知道?
【问题讨论】:
标签: machine-learning classification mahout document-classification