【发布时间】:2013-05-22 18:37:04
【问题描述】:
情况就是这样,我的数据导入处理程序中有两个数据源,一个很大,另一个很小:
Source A: 10-20 records
Source B: 50,000,000 records
我想知道如果我每 10 分钟在源 A 上执行一次 DIH,并且每 24 小时只在源 B 上运行一次 DIH,会发生什么情况。
在源 A 上运行我的 DIH 会非常快,因为我们正在导入的数据很小,还是仍然很耗时,因为它必须重建整个 SOLR 的索引(即 50,000,010 条记录)。
谢谢!
【问题讨论】:
-
你说的是不同的 SOLR 内核吗?
-
全部在同一个核心上,因为我希望将它们作为一个进行搜索,但只需从两个不同的来源获取数据。
标签: java performance search solr lucene