【发布时间】:2010-02-22 12:31:39
【问题描述】:
我正在做一个在大型词典(100k~1m 字)中搜索的项目。字典项看起来像 {key,value,freq}。 Myy 的任务是开发一种增量搜索算法来支持精确匹配、前缀匹配和通配符匹配。结果应按频率排序。
例如: 字典看起来像
key1=a,value1=v1,freq1=4
key2=ab,value2=v2,freq2=2
key3=abc,value3=v3 freq3=1
key4=abcd,value4=v4,freq4=3
当用户输入“a”时,返回 v1,v4,v2,v3
当用户输入 'a?c' 时,返回 v4,v3
现在我最好的选择是DAWG数据结构表示的后缀树,但是这种方法并不能有效地支持通配符匹配。
有什么建议吗?
【问题讨论】:
-
作为一个新用户,不要被冒犯,但要被告知你用短信的方式写是对自己的伤害。清晰的标点和大小写使问题更具可读性,并吸引更多人给出答案。如常见问题解答所述:为了得到好的答案,您必须在问题上付出一些努力。
标签: search dictionary wildcard