【发布时间】:2012-06-28 12:51:14
【问题描述】:
我们有一个字段“facet_tag”,其中包含描述产品的标签。由于标签是德语,它们可能包含非 ASCII 字符(如变音符号)。以下是一些可能的值:
“Zelte”
“隧道”
“阿克斯特”
“萨根”
“软壳”
现在,如果我们使用如下查询查询 solr 的构面:
http://<solr_host>:<solr_port>/solr/select?q=*&facet=on&facet.field=facet_tag&facet.sort=index
排序后的结果如下:
<lst name="facet_counts">
<lst name="facet_queries"/>
<lst name="facet_fields">
<lst name="facet_tag">
<int name="Softshells">1</int>
<int name="Sägen">1</int>
<int name="Tunnelzelte">1</int>
<int name="Zelte">1</int>
<int name="Äxte">2</int>
</lst>
</lst>
<lst name="facet_dates"/>
<lst name="facet_ranges"/>
</lst>
标签“Äxte”应该是第一项,然后是“Sägen”。显然 Solr 在这种情况下不能很好地处理非 ASCII 字符(这在分面搜索的文档中也有说明,请参阅http://wiki.apache.org/solr/SimpleFacetParameters#facet.sort)
有没有什么方法可以让 Solr 正确地对这些值进行排序而无需标准化变音符号(因为我们向用户显示了这些值)?
【问题讨论】:
-
感谢您指出这一点,我现在实际上接受了更多答案:)
标签: solr faceted-search