【发布时间】:2016-02-08 10:02:42
【问题描述】:
我正在使用 solr 4.10。我必须在 solr 中索引诗歌数据。现在应该是什么文件结构。基本上,我想为诗歌中的一个词提供一个搜索工具。只有那个特定的 distich 应该被退回。现在我应该在单个文档或每个分区一个文档中索引完整的诗歌。我知道有些诗有两行代表一个概念,有些是 4 行等。现在它的存储格式应该是什么?
【问题讨论】:
我正在使用 solr 4.10。我必须在 solr 中索引诗歌数据。现在应该是什么文件结构。基本上,我想为诗歌中的一个词提供一个搜索工具。只有那个特定的 distich 应该被退回。现在我应该在单个文档或每个分区一个文档中索引完整的诗歌。我知道有些诗有两行代表一个概念,有些是 4 行等。现在它的存储格式应该是什么?
【问题讨论】:
单独索引 distiches 并通过诗歌标识符和序列 ID 将它们链接起来。这样,您还可以在之前或之后检索 distich - 或整首诗。
如果某些用例需要将诗歌作为一个整体来处理,请创建一个单独的集合并为这两个集合创建索引。这样您就可以根据用例调整和调整搜索结果。
【讨论】: