【发布时间】:2016-08-28 14:15:18
【问题描述】:
我尝试了以下问题中列出的解决方案。
Removing Solr duplicate values into multivalued field
我正在使用数据导入处理程序并使用 RegexTransformer 为字段创建多个值。
我的 sql 为 FOO 列返回这个
Johnny Cash、Bonnie Money、Honey Bunny、Johnny Cash
我使用 splitBy=","
将它存储到多值字段 foo<field column="FOO" name="foo" splitBy=","/>
它被存储在多值字段中
{“Johnny Cash”、“Bonnie Money”、“Honey Bunny”、“Johnny Cash”}
我已将此添加到 solrconfig xml
<updateRequestProcessorChain name="distinctMultiValued" default="true">
<!-- To remove duplicate values in a multivalued field-->
<processor class="DistributedUpdateProcessorFactory"/>
<processor class="UniqFieldsUpdateProcessorFactory">
<str name="fieldRegex">foo</str>
</processor>
<processor class="solr.LogUpdateProcessorFactory" />
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>
我也尝试用 fieldName 代替 fieldRegex 并尝试 *oo 代替 foo,但重复项仍然存在。
这和 RegexTransformer 有关系吗?
我还有一个带有TrimFieldsUpdateProcessorFactory 的更新链,运行起来没有任何问题。
【问题讨论】:
标签: solr dataimporthandler solr5