【发布时间】:2013-01-04 12:56:35
【问题描述】:
我们有客户提供的索引文件,现在想通过删除重复的文档来重新索引它们
为此,我必须从索引中读取数据,并且必须生成一个 XML 文件或 CSV 文件,然后对它们进行索引并消除重复项
(如果我错了,请纠正我,我没有找到任何其他方法)
我知道使用 Lucene 可以做到这一点,但我想知道如何使用 solr 来做到这一点
【问题讨论】:
-
您是否考虑过如何访问索引中已编入索引但未存储的数据?简单地查询所有文档可能不一定检索到用于构建索引的所有数据。