【发布时间】:2011-04-22 21:19:11
【问题描述】:
我有数百万个简短(最多 30 个字)的文档,我需要将它们分成几个已知的类别。一个文档可能匹配多个类别(很少,但可能)。文档也可能不匹配任何类别(也很少)。我也有数以百万计的文件已经被分类。我应该使用什么算法来完成这项工作。我不需要做的很快。我需要确保算法正确分类(尽可能)。
我应该使用什么算法?在 C# 中是否有 in 的实现?
感谢您的帮助!
【问题讨论】:
标签: c# artificial-intelligence machine-learning text-processing