【发布时间】:2018-10-17 05:46:31
【问题描述】:
我们如何使用 ANN 找到一些类似的文档?我知道这是一个愚蠢的问题,但我是这个 NLP 领域的新手。 我使用 kNN 和词袋方法制作了一个模型来解决我的问题。使用它,我可以获得与输入有些相似的 n 个文档(以及它们的紧密度),但现在我想使用 ANN 实现相同的结果,但我不知道。
提前感谢您的任何帮助或建议。
【问题讨论】:
-
为什么要使用ANN?您的数据大小是多少?出于教育目的,您想探索解决问题的多种方法?或者这是一个真正的专业问题?如果是后者,为什么要远离 kNN 而不是尝试提高 kNN 本身的准确性?
-
我想用 ANN 做这个的主要原因是因为使用带有词袋的 kNN 不会考虑词序。通过使用 n-gram,我们可以以某种方式解决这个问题,但它不如带有 LSTM 的 RNN 有效。
标签: python machine-learning nlp artificial-intelligence word-embedding