【问题标题】:Elasticsearch: the mapping for a document with multiple languages for the same field?Elasticsearch:同一字段具有多种语言的文档的映射?
【发布时间】:2014-08-31 22:48:29
【问题描述】:

我有一个文档类型,它有一个名为标题的数据项。以下是一些关于它的情况:

  • 一个文档的标题可以有多种语言。一份文件 可能只有英文标题。另一个文档可能有两个(例如 英语和西班牙语)或更多语言的标题。目前,有 有四种语言(英语、西班牙语、法语和中文) 文档,但将来随着系统的发展会出现更多的语言。

  • 标题用于搜索。对于同时具有英文标题和 西班牙语标题,如果是英文搜索词,则应返回 在英文标题中找到或在西班牙文搜索词中找到 西班牙语标题。

  • Elasticsearch 应该在搜索结果中返回一个文档,如果 在相同的不同语言标题中找到搜索词 文件。

  • 某些文档可能有很多更新。更新示例包括删除文档、更改一种语言标题并保持其他语言标题不变、删除一种语言标题并保持其他语言标题不变。

考虑到文档索引、更改、删​​除、搜索和系统增长,该文档类型的正确映射是什么?

非常感谢您的任何意见!

问候。

【问题讨论】:

    标签: elasticsearch


    【解决方案1】:

    标题的映射应该使用object类型,其属性包含多个语言字段,每个字段可以根据其语言应用不同的分析器。 在搜索过程中,您可以指定字段为title.en以快速找到英文标题,或title.*查询所有标题字段,具体取决于您的需要。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-07-03
      • 1970-01-01
      • 2016-04-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-03-24
      相关资源
      最近更新 更多