【发布时间】:2013-04-09 05:25:26
【问题描述】:
我正在尝试找到一种方法来构建模糊搜索,其中文本数据库和查询都可能具有拼写变体。特别是,文本数据库是从网络收集的材料,可能不会从全文引擎的准备阶段(词干)中受益 我可以想象使用 pg_trgm 作为起点,然后验证 Levenshtein 的命中。 然而,人们倾向于做前缀查询,例如,在音乐领域,我希望“beetho symphony”是一个合理的搜索词。那么,是否有人在输入“betho symphony”,是否有一种合理的方式(使用带有 tcl 或 perl 脚本的 postgresql)来发现“betho”部分应该与“beetho”进行比较(返回 1 的编辑距离)
【问题讨论】:
标签: algorithm postgresql fuzzy-search