【发布时间】:2011-08-16 16:10:37
【问题描述】:
我有一些 XML 要摄取到 Solr 中,这听起来像是一个打算由 DataImportHandler 解决的用例。我想要做的是从一个 XML 属性中提取列名并从另一个属性中提取值。这是我的意思的一个例子:
<document>
<data ref="reference.foo">
<value>bar</value>
</data>
</document>
从这个 xml sn-p,我想添加一个名称为 reference.foo 和值 bar 的字段。 DataImportHandler 包括一个用于处理 XML 文档的 XPathEntityProcessor。我已经尝试过使用它,如果我给它一个已知的列名(例如<field column="ref" xpath="/document/data/@ref">),它可以完美地工作,但找不到任何文档或示例来建议如何做我想做的事,或者它不能做完了。所以:
- 我可以使用 XPathEntityProcessor 执行此操作吗?如果有,怎么做?
- 如果没有,我可以使用 DataImportHandler 以其他方式执行此操作吗?
- 还是我要编写自己的导入处理程序?
【问题讨论】: