【发布时间】:2013-02-10 08:33:03
【问题描述】:
我目前正在从事一个项目,该项目涉及从文本中识别不同的“关键字”。
作为一个例子,让我们假设以下输入文本:
“这是一些来自布宜诺斯艾利斯的关于肉类的文字示例”。
进一步假设我的 elasticsearch 实例存储了以下文档:
城市:[巴塞罗那、布宜诺斯艾利斯、洛杉矶……]
和
类别:[金融、政治、..]
我需要一种方法来从输入文本中识别相应的城市和类别。
我的第一种方法是使用“或”运算符进行搜索查询,看看哪个排名最高。之后,我还将匹配的文档与文本重新匹配,以确保这些文本确实存在(换句话说,确保“los angeles”匹配,因为“los angeles”这个词在文本中并且只有“los”或“天使”。
我想知道这是否是使用 Elasticsearch 做这类事情的最佳实践方式。
【问题讨论】:
-
您能接受您在这里得到的最佳答案吗?
标签: java search elasticsearch