【发布时间】:2013-07-17 07:56:06
【问题描述】:
我正在 Weka 中处理一项分类任务,但遇到的问题是我的类要预测的值非常频繁(大约 85%)。这导致许多学习算法只是为新数据集预测此类的这个频繁值。
我该如何处理这个问题?这是否只是意味着我没有找到能够很好地预测更好的东西的功能?或者我可以做些什么来解决这个问题?
我想这是一个很常见的问题,但我无法在这里找到解决方案。
【问题讨论】:
-
非常感谢您的快速帮助!这些问题给了我关于如何命名该问题(以及如何解决它)的提示。如果我混淆了条款,对不起。 Weka 使用它们的方式与我第一次学习它们时的方式不同。
-
是的,Weka 对术语的使用有些奇怪。 (而且更广泛的 ML 社区有时在选择术语时遇到问题......)
标签: machine-learning data-mining classification weka supervised-learning