【发布时间】:2014-04-02 19:14:20
【问题描述】:
我正在使用 Solr 版本 4(api spring data solr 来索引,获取...文档),我必须决定我要申请哪种策略来索引我的文档。
我在两种策略之间犹豫:
定期启动批处理以索引所有文档
仅在此文档发生更改时索引文档
哪种策略最好?也许是混合的??或另一个.. 我对每种方法的缺点和缺点都有一些想法,但我对 solr 没有丰富的经验。
【问题讨论】:
-
不一定是答案,而是分享我的经验:两个场景在实践中都有自己的用例,虽然 1) 可能不如 2) 频繁,但它不时发生,以重新索引架构/配置更改所需的所有内容。
-
你是对的,当架构/配置发生变化时,我有时必须重新索引所有文档。但是,在我的情况下,如果我的数据不是最新的(15 分钟是正确的延迟),这并不重要。
标签: solr indexing document batch-processing