【问题标题】:Solr Indexing TimeSolr 索引时间
【发布时间】:2011-12-26 03:19:22
【问题描述】:

Solr 1.4 在专用物理服务器 (Windows Server 2008) 上的索引方面做得很好。索引大约 100 万个全文文档(大约 4 GB 大小)大约需要 20 分钟,堆大小 = 512M - 1G 和 4GB RAM。

但是,在使用 4 GB RAM 的 VM 上使用 Solr 时,第一次索引需要 50 分钟。请注意,没有网络延迟,也没有 RAM 问题。现在,当我将 RAM 增加到 8GB 并增加堆大小时,索引时间增加到 2 小时。那真的很奇怪。请注意,除了 SQL Server 之外,没有其他进程正在运行。没有网络延迟。但是我还没有检查文件 I/O。这会是瓶颈吗? Solr 在“虚拟化”环境中运行是否有任何问题?

我今天阅读了 Brian 和 Harry 的一篇论文:“关于虚拟化环境中 SOLR 搜索引擎的响应时间”,他们声称当 Solr 在 VM 上运行时增加 RAM 时性能会下降,但这是与关于查询时间而不是索引时间。

当我第二次重复相同的测试并增加堆大小和 RAM 时,为什么在 VM 上花费更长的时间我有点困惑。

【问题讨论】:

    标签: search solr lucene indexing information-retrieval


    【解决方案1】:

    VM 上的 I/O 总是比专用硬件上的慢。这是因为磁盘是虚拟化的,I/O 操作必须通过一个额外的抽象层。索引需要密集的 I/O 操作,因此它在 VM 上运行得更慢也就不足为奇了。我不知道为什么添加 RAM 会导致速度变慢。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-06-19
      • 2013-01-16
      • 2017-04-04
      • 2011-12-06
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多