【发布时间】:2016-01-30 14:07:20
【问题描述】:
我有一个包含 500 万个短语的列表(每个短语可能是 2-10 个单词)。 我的输入是文本(100 到 5000 个字)。 我想在文本中找到短语(来自 500 万个列表)。 Elasticsearch 是否适合这种情况?
谢谢
【问题讨论】:
-
您能否详细说明您是否对包含输入文本中出现的某些单词的短语感兴趣(无论顺序如何),或者单词也必须(大约)以相同的顺序出现?它对最适合哪种查询类型具有重大影响。
-
请查看我对@E-Dahari 回复的评论。谢谢
-
我已经回答了类似的问题here,基本上你索引了 500 万个短语(短语数组)并提供输入文本,ES 会给你所有的短语(使用 shingles,链接中的更多详细信息)
-
我主要关心的是输入 - 5000 字。这是一个常见的场景吗? ES会有性能问题吗?
标签: elasticsearch