【发布时间】:2012-03-12 21:34:27
【问题描述】:
我搜索了一种估计索引时间、索引大小、使用 lucene 库的搜索时间的方法。
我有 500 个文件的一些数字,我想估计 5000 个文件的价值。
我在网上搜索,但没有找到任何估算论文数量的好方法。
【问题讨论】:
-
将 5000 个样本文档放入索引中尝试一下。不要猜测;实验和测量。
-
文档很少时没关系....但是如果我想估计 20 亿个文档,我真的不能使用这种方法...
-
如果您有 20 亿份文档,您真的想根据猜测来分配资源吗?老实说,这就是负载测试(而不是负载猜测)最关键的地方。
-
肯定不是,但在开始之前有想法很正常
标签: lucene performance-estimation