【发布时间】:2012-04-03 19:54:44
【问题描述】:
我想将维基百科的 xml 文件索引到 Solr 中。
但是我收到一个错误,它无法索引。 Solr 具有特定的 xml 文件格式。我更改了schema.xml 和data-config.xml 文件以适应维基百科文件的标签。
仍然无法索引文件。我的实际意图是索引维基百科,它是一个 30 GB 的 xml 文件。
我将如何将所有维基百科文件索引到 Solr 中?
【问题讨论】:
-
我在这个链接stackoverflow.com/questions/20473798/…中解决了同样的问题。我希望它有所帮助。
标签: xml solr indexing wikipedia