【发布时间】:2012-02-22 08:21:10
【问题描述】:
是否有任何链接/资源可用于大型数据集上的 Lucene/Solr 性能基准测试。 500GB~5TB以上的数据集
谢谢
【问题讨论】:
标签: solr lucene benchmarking
是否有任何链接/资源可用于大型数据集上的 Lucene/Solr 性能基准测试。 500GB~5TB以上的数据集
谢谢
【问题讨论】:
标签: solr lucene benchmarking
Lucene 提交者 Mike McCandless 定期运行 benchmarks 以跟踪性能改进和回归。它们是使用 Wikipedia 导出的,可能比您要查找的要小一些。
但性能并不太取决于输入大小,而是取决于文档的数量和唯一术语。如果您已经有一些类似于您需要索引的数据,我建议您查看Mike's test tool,根据您的需要调整它,并使用您自己的数据集和硬件运行它,以尝试找出什么样的性能数字你可以期待。
【讨论】: