【发布时间】:2019-03-28 06:32:42
【问题描述】:
我使用 Sphinx 搜索版本 2.2.11。
Sphinx 返回没有重音/变音符号的数据,例如。 “cerny”而不是“černý”。
它会返回正确的项目,即使查询本身有重音/变音符号,只有 结果的编码错误。
我知道我以前遇到过这个问题,但我不记得我是如何解决的,那是 3 年前, 我认为它是在 2.1 版上。然后。
也许它的索引很糟糕?
我的配置的相关部分:
searchd {
...
collation_server = utf8_general_ci
}
index xxx {
source = xxxSrc
path = /var/lib/sphinxsearch/xxx
charset_table = 0..9, A..Z->a..z, _, a..z, U+0e1->a, U+0c1->a, U+10d->c, U+10c->c,
U+10f->d, U+10e->d, U+0e9->e, U+0c9->e, U+11b->e, U+11a->e, U+0ed->i, U+0cd->i, U+148->n,
U+147->n, U+0f3->o, U+0d3->o, U+159->r, U+158->r, U+161->s, U+160->s, U+165->t, U+164->t,
U+0fa->u, U+0da->u, U+16f->u, U+16e->u, U+0fd->y, U+0dd->y, U+17e->z, U+17d->z,
index_exact_words = 1
docinfo = extern
morphology = stem_cz
min_stemming_len = 5
min_infix_len = 3
}
感谢任何帮助。
【问题讨论】:
标签: character-encoding sphinx diacritics