【发布时间】:2019-10-10 21:58:49
【问题描述】:
我已经构建了一个从英语音译为多种语言的算法,因为我们应该向他们展示他们输入的单词的适当建议,所以我已经制定了在该语言词典中搜索的逻辑。
逻辑我已实现在该语言词典中进行搜索:
- 最后输入的元音中的差异并找到单词。 { 例如 : re — > r* }
- 替换所有可能组合中的所有元音。 { 例如 : 测试 — > [ tAst*, tEst*, tIst*, tOst*, tUst* ] }
- 字典中可能出现的最小距离单词。 (Levenshtein 距离算法)
- 在字典中查找发音相似的单词。 { Ex : tast —> [ tEst*, tEAst*, .. ] }
- 强调元音之间的辅音并在字典中搜索。 { 例如:可能 —> [ 可能* ] }
有没有标准的算法来实现上述逻辑的音译和音译建议?
【问题讨论】:
-
你真的是指音译吗? en.wikipedia.org/wiki/Transliteration
-
我认为要使用的数据结构是 trie,但我无法为您提供精确的算法链接,这些算法可以满足您的需求。
-
@WalterTross - 是的。上面我提供的例子都是英文的,所以大家都能理解其背后的逻辑。
标签: algorithm google-translate levenshtein-distance transliteration google-input-tools