【发布时间】:2014-11-20 11:44:39
【问题描述】:
我正在使用 Mysql 将数据索引到 SOLR。早些时候数据较少,因此索引很快就发生了,没有任何延迟。现在我的数据包含近 300 万行,mysql 查询总是超时,因此 SOLR 无法相应地索引数据。有没有办法使用 mysql 快速索引 SOLR 或者可以在 SOLR 中进行任何调整?请帮忙。
【问题讨论】:
我正在使用 Mysql 将数据索引到 SOLR。早些时候数据较少,因此索引很快就发生了,没有任何延迟。现在我的数据包含近 300 万行,mysql 查询总是超时,因此 SOLR 无法相应地索引数据。有没有办法使用 mysql 快速索引 SOLR 或者可以在 SOLR 中进行任何调整?请帮忙。
【问题讨论】:
如果你不使用incremental / delta indexing,你应该开始这样做。这样,只有自上次运行索引后发生更改的行才会再次被索引,从而减少 MySQL 的影响和行数。
此外,JDBCDataSource(我猜你正在使用)supports the batchSize parameter,它告诉 JDBC 驱动程序限制每个查询中的文档数量 - 并发出多个查询。
如果您在检索 SQL 内容(例如增量导入)时对 SQL 内容执行任何类型的过滤,您还应该注意为您的数据设置可用索引。
【讨论】: