【问题标题】:Processing a MySQL DB and XML Hybrid into a Solr Index将 MySQL DB 和 XML 混合处理成 Solr 索引
【发布时间】:2012-02-14 15:53:12
【问题描述】:

问题:

MySQL 中的表 有一些正常的领域和 一个包含 XML 的文本字段

我需要使用 Solr 数据导入处理程序将此表处理为 Solr 索引。
但是,XML 字段需要分别解析成其他几个 solr 字段

问题:

  1. 是否可以在不必编写自定义 Transformer 的情况下做到这一点?如果是的话如何。我可以将 XPathEntityProcessor 与我的 SQL DB 一起用作数据源吗?

  2. 如果我写了一个自定义转换器,我该如何在dataConfig中配置它?

  3. 我使用的是旧版本的 solr (1.4.1),所以我可以将一个带有新类的新 jar 放入我的 solr web 应用程序吗?

我不太确定的是我需要如何配置 data-config.xml 来执行此操作。如果有人有任何例子,请分享!谢谢。

【问题讨论】:

标签: mysql solr lucene xml-parsing dataimporthandler


【解决方案1】:

我的建议是编写一个程序,从数据库中选择数据,解析 XML 数据字段,然后将整个文档插入 SOLR 索引。

solrj Java api 非常易于使用。其中最难的部分是解析 XML,但它是一个更容易挑战且更容易测试的部分。

【讨论】:

  • 当然,这种事情我已经做过好几次了。但我想知道是否可以使用 DIH 以这种方式完成,而不必在每次需要执行此操作时都编写样板代码。无论如何感谢您的建议。
猜你喜欢
  • 1970-01-01
  • 2012-07-03
  • 2016-05-27
  • 1970-01-01
  • 2020-06-04
  • 1970-01-01
  • 2011-03-24
  • 1970-01-01
相关资源
最近更新 更多