【发布时间】:2010-10-31 07:11:01
【问题描述】:
我们今天在课堂上设置了一个算法问题,作为“如果你找到了解决方案,你就不必做这门课”。所以当然,我们都认为我们会试一试。
基本上,我们提供了一个包含 100 个单词和 10 个类别的数据库。单词或类别之间不匹配。所以它基本上是一个 100 个单词和 10 个类别的列表。
我们必须将单词“放置”到正确的类别中——也就是说,我们必须“弄清楚”如何将单词放入正确的类别中。因此,我们必须“理解”这个词,然后在算法上把它放在最合适的类别中。
即其中一个词是“钓鱼”类别“运动”->所以这将进入这一类别。单词和类别之间存在一些重叠,因此某些单词可能属于多个类别。
如果我们想通了,我们必须增加样本量,并且匹配“最佳”百分比的人获胜。
有人知道如何开始这样的事情吗?或者任何资源?最好在 C# 中?
即使是关键字数据库或其他东西也可能会有所帮助?有谁知道免费的吗?
【问题讨论】:
-
听起来你们很多人毕竟会做这个主题:P
-
:D 是的 - 但我很想尝试一下。有什么想法吗?
-
如果我可以问一下,你在哪个学校上学?因为我在我的同事中进行了一项快速调查,他们知道如何比我更好地解决问题,没有人知道你怎么能弄清楚你的算法中的“钓鱼”是一项“运动”,只有这两个单词?
-
它是澳大利亚大学的 PHD prob :) 可以使用外部数据
-
如果没有谷歌 - 在某处建立人类数据农场怎么样 ;-p