【发布时间】:2014-03-04 11:53:22
【问题描述】:
我有一个存储在弹性搜索数据库中的大型图像注释数据库。我想使用这个数据库进行关键字提取。输入是文本(通常是报纸文章)。我对算法的基本想法是遍历文章中的每个术语,并使用弹性搜索来发现该术语在图像注释中的频率。然后从不常用的文章中输出术语(为了比常见的英文单词更喜欢人名或地名)。
我不需要非常复杂的东西,这些关键字仅用作用户输入的建议,但我想要更快的东西,然后向弹性搜索询问 N 个搜索查询(其中 N 是文本中的术语数),这可能会很慢大文本。在 elasticsearch 中是否有一些强大而快速的关键字提取技术?
【问题讨论】:
标签: elasticsearch nlp keyword-search