【发布时间】:2016-09-27 11:23:10
【问题描述】:
我有 Solr 4.10.4,我想索引一个 xml 文件。 有些xml标签包含html标签。
<?xml version='1.0' encoding='UTF-8' standalone='no' ?>
<root>
<info>
<text>
<p>text 1</p>
<p>text 2</p>
<p>text 3</p>
</text>
</info>
</root>
我用过这个:
<charFilter class="solr.HTMLStripCharFilterFactory"/>
但它不起作用,我不知道出了什么问题。
M.
【问题讨论】:
-
solr.HTMLStripCharFilterFactory 将从索引数据中删除 html 标签,而不是从存储的值中删除。是否也要转换存储的值?
标签: xml solr dataimporthandler