【发布时间】:2012-04-05 12:24:49
【问题描述】:
我解析了一个 xml 文件并从文件中提取“标题”、“ID”和“文本”并将它们存储为对象。我有一组包含来自 xml 文件的信息的对象。现在我想将这些对象索引到 solr 中,以便我可以搜索相关文件。 有没有办法我可以做到这一点? 需要帮助。
【问题讨论】:
-
您想使用哪种编程语言?
我解析了一个 xml 文件并从文件中提取“标题”、“ID”和“文本”并将它们存储为对象。我有一组包含来自 xml 文件的信息的对象。现在我想将这些对象索引到 solr 中,以便我可以搜索相关文件。 有没有办法我可以做到这一点? 需要帮助。
【问题讨论】:
您的这些物品存放在哪里?
您可以使用API(java、python、ruby、js、scala、perl、PHP 甚至 .NET)直接从源代码向 Solr 发送数据。
无论使用哪种编程语言,您都可以使用标准 HTTP POST 将 XML、CSV 或 JSON 文档推送到 Solr。
有关所有更新请求处理程序(在 Solr 服务器上处理您的请求)wiki 页面,请参见 here。
和here 检查 (javaDoc) 哪些类实现了 SolrRequestHandler。
如果您有某种可以返回 XML 的 RESTfull 服务或标准 Web 服务,您可以选择使用 DataImportHandler 从该源读取。然后将它与XPathEntityProcessor 结合使用,这样可以避免您必须手动解析 XML。
无论您选择哪种方式,首先您需要准备 Solr schema.xml(添加您的 Title、ID 和 Text 字段),以便 Solr 知道如何索引您的数据。
在这之前,我建议你通过Solr quick start tutorial。
【讨论】: