【发布时间】:2011-12-26 03:19:22
【问题描述】:
Solr 1.4 在专用物理服务器 (Windows Server 2008) 上的索引方面做得很好。索引大约 100 万个全文文档(大约 4 GB 大小)大约需要 20 分钟,堆大小 = 512M - 1G 和 4GB RAM。
但是,在使用 4 GB RAM 的 VM 上使用 Solr 时,第一次索引需要 50 分钟。请注意,没有网络延迟,也没有 RAM 问题。现在,当我将 RAM 增加到 8GB 并增加堆大小时,索引时间增加到 2 小时。那真的很奇怪。请注意,除了 SQL Server 之外,没有其他进程正在运行。没有网络延迟。但是我还没有检查文件 I/O。这会是瓶颈吗? Solr 在“虚拟化”环境中运行是否有任何问题?
我今天阅读了 Brian 和 Harry 的一篇论文:“关于虚拟化环境中 SOLR 搜索引擎的响应时间”,他们声称当 Solr 在 VM 上运行时增加 RAM 时性能会下降,但这是与关于查询时间而不是索引时间。
当我第二次重复相同的测试并增加堆大小和 RAM 时,为什么在 VM 上花费更长的时间我有点困惑。
【问题讨论】:
标签: search solr lucene indexing information-retrieval