语音识别将单词拆分为音素级别答案

【问题标题】：voice recognition splitting words to phoneme level语音识别将单词拆分为音素级别
【发布时间】：2015-09-06 13:11:08
【问题描述】：

我正在考虑为我的母语开发语音识别软件，我正在考虑为此使用 CMUSphinx-4。有一个 CMU 字典文件，其中包含将原始单词拆分映射到其音位边界的英语单词。例如，放弃=> ['AH'，'B'，'AE'，'N'，'D'，'AH'，'N'，'D'] 我无法理解这背后的逻辑，我想为这种对话开发一种算法。如果有人知道这种转换的算法或这种分裂是如何发生的，请与我分享。

【问题讨论】：

标签： voice-recognition cmusphinx phoneme

【解决方案1】：

原始单词到其音素边界

“边界”在这里是一个错误的词。它将单词映射到音素序列，与边界无关

如果有人知道这种转换的算法或这种分裂是如何发生的，请与我分享。

我们的教程中介绍了字典的构造

http://cmusphinx.sourceforge.net/wiki/tutorialdict

【讨论】：