【问题标题】:voice recognition splitting words to phoneme level语音识别将单词拆分为音素级别
【发布时间】:2015-09-06 13:11:08
【问题描述】:

我正在考虑为我的母语开发语音识别软件,我正在考虑为此使用 CMUSphinx-4。有一个 CMU 字典文件,其中包含将原始单词拆分映射到其音位边界的英语单词。例如, 放弃=> ['AH','B','AE','N','D','AH','N','D'] 我无法理解这背后的逻辑,我想为这种对话开发一种算法。如果有人知道这种转换的算法或这种分裂是如何发生的,请与我分享。

【问题讨论】:

    标签: voice-recognition cmusphinx phoneme


    【解决方案1】:

    原始单词到其音素边界

    “边界”在这里是一个错误的词。它将单词映射到音素序列,与边界无关

    如果有人知道这种转换的算法或这种分裂是如何发生的,请与我分享。

    我们的教程中介绍了字典的构造

    http://cmusphinx.sourceforge.net/wiki/tutorialdict

    【讨论】:

      猜你喜欢
      • 2020-01-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-07-16
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多