【发布时间】:2015-07-24 20:59:30
【问题描述】:
我正在使用开箱即用的分析器根据语言 ISO 639 代码索引数据:en、de 等。
当涉及到 CJK(中文、日文、韩文)时,基于语言 ISO 代码,我是否应该将 ja(日文)和 ko(韩文)索引到 CJK 索引中(假设根据文档单独支持中文) ?.
【问题讨论】:
标签: elasticsearch
我正在使用开箱即用的分析器根据语言 ISO 639 代码索引数据:en、de 等。
当涉及到 CJK(中文、日文、韩文)时,基于语言 ISO 代码,我是否应该将 ja(日文)和 ko(韩文)索引到 CJK 索引中(假设根据文档单独支持中文) ?.
【问题讨论】:
标签: elasticsearch
您可以使用单独的中文和日文分析器进行索引。对于韩语,他们还没有添加分析器。
对于中文,您需要安装 smartcn-sentence 插件并添加到您的映射中。你可以在这里找到 smartcn-analyzer smartscn-analyzer
对于日语,您需要安装 Kuromoji 插件。你可以在这里找到黑字分析器Kuromoji-analyzer
【讨论】: