【发布时间】:2015-11-10 10:39:16
【问题描述】:
我想知道文本分类的最佳可用算法。我想根据体育、银行、技术等对文档进行分类。请建议好的算法以获得最高的准确性。
【问题讨论】:
-
机器学习没那么容易。我建议你从 Andrew Ng 的 MOOC 开始,大致了解它的全部内容
标签: machine-learning nlp classification text-mining document-classification
我想知道文本分类的最佳可用算法。我想根据体育、银行、技术等对文档进行分类。请建议好的算法以获得最高的准确性。
【问题讨论】:
标签: machine-learning nlp classification text-mining document-classification
没有最好的算法。请参阅“数据挖掘第四定律 – “NFL-DM”http://khabaza.codimension.net/index_files/9laws.htm
您确实需要一种可以处理多列的算法。如果需要,列多于行。这排除了基于矩阵的算法。
朴素贝叶斯和 SVM 是文本分类的热门选择。
【讨论】:
良好的准确性不仅基于机器学习算法。也是基于特征选择。 尝试定义特定于任务的功能或分析您的功能空间。
【讨论】: