【问题标题】:Identifying documents by multiple unique keys in solr通过 solr 中的多个唯一键识别文档
【发布时间】:2014-11-20 13:39:42
【问题描述】:

我一直在设置 SOLR 以按照本指南自动为我的文档生成 ID: https://wiki.apache.org/solr/UniqueKey,正在按预期工作。

现在,在插入文档时,我想检查/确保 url 字段(只是一个字符串)对于索引中的所有文档都是唯一的。因此,每当添加新文档时,如果文档已经存在具有该特定 url,它应该只更新任何现有文档。 唯一 id 用于识别系统另一部分中的文档。

我尝试将 url 添加到 url 字段,但它只是被忽略了,因此仍然可以添加具有非唯一 url 的文档。

我正在使用 SOLR 4.10.2。

非常感谢任何帮助!

【问题讨论】:

    标签: solr unique-key


    【解决方案1】:

    您可以使用“重复数据删除”Solr 功能防止重复项进入索引。请查看 wiki 了解配置和更多详细信息:https://cwiki.apache.org/confluence/display/solr/De-Duplication

    还有一个标志“overwriteDupes”,我相信它会发出一个覆盖旧值的“更新”命令,尽管它没有在 wiki 中明确记录。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-04-29
      • 2022-11-18
      • 1970-01-01
      • 1970-01-01
      • 2015-08-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多