【问题标题】:Sphinx Search: Missing accents/diacritics in results狮身人面像搜索:结果中缺少重音符号/变音符号
【发布时间】:2019-03-28 06:32:42
【问题描述】:

我使用 Sphinx 搜索版本 2.2.11。

Sphinx 返回没有重音/变音符号的数据,例如。 “cerny”而不是“černý”。

它会返回正确的项目,即使查询本身有重音/变音符号,只有 结果的编码错误。

我知道我以前遇到过这个问题,但我不记得我是如何解决的,那是 3 年前, 我认为它是在 2.1 版上。然后。

也许它的索引很糟糕?

我的配置的相关部分:

searchd {
        ...
        collation_server = utf8_general_ci
}

index xxx {
        source = xxxSrc
        path = /var/lib/sphinxsearch/xxx
        charset_table = 0..9, A..Z->a..z, _, a..z, U+0e1->a, U+0c1->a, U+10d->c, U+10c->c,
        U+10f->d, U+10e->d, U+0e9->e, U+0c9->e, U+11b->e, U+11a->e, U+0ed->i, U+0cd->i, U+148->n,
        U+147->n, U+0f3->o, U+0d3->o, U+159->r, U+158->r, U+161->s, U+160->s, U+165->t, U+164->t,
        U+0fa->u, U+0da->u, U+16f->u, U+16e->u, U+0fd->y, U+0dd->y, U+17e->z, U+17d->z,
        index_exact_words = 1
        docinfo = extern
        morphology = stem_cz
        min_stemming_len = 5
        min_infix_len = 3
}

感谢任何帮助。

【问题讨论】:

    标签: character-encoding sphinx diacritics


    【解决方案1】:

    好的,实际上不是 sphinx 问题,而是在 ODBC/Oracle 中

    这解决了它

    export NLS_LANG="CZECH_CZECH REPUBLIC.AL32UTF8"
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-12-12
      • 2018-02-13
      • 1970-01-01
      • 2023-04-04
      • 1970-01-01
      相关资源
      最近更新 更多