【发布时间】:2012-05-09 20:50:19
【问题描述】:
我希望人们能够搜索 #photography 和 photography。在 Sphinx 中,这些应该被视为两个不同的词。默认情况下,#photography 映射到 photography,我无法搜索主题标签。
我在this page 上读到,您可以将哈希标记添加到 charset_table 以完成此操作。我完全不知道如何做到这一点。我不知道 unicode,也不知道我的 charset_table 应该是什么。
谁能告诉我我的 charset_table 应该是什么?谢谢。
# charset_table = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F
注意:我打算使用实时索引。 (不确定这是否会有所不同)
【问题讨论】:
标签: search unicode utf-8 lucene sphinx