【问题标题】:Decode speech into Phonemes in Sphinx4在 Sphinx4 中将语音解码为音素
【发布时间】:2013-01-26 06:31:08
【问题描述】:

我可以使用 CMUSphinx4 将特定语音解码为音素并将这些音素用于进一步的实现吗?

【问题讨论】:

标签: speech-recognition sphinx4 phoneme


【解决方案1】:

如果您使用的是 sphinx4(beta 6),框架中有一个名为 getBestPronunciationResult()

的方法

"当应用程序需要音素时使用该方法 最佳最终路径。请注意,单词可能有多个发音, 所以这不等于单词路径,例如一个[HH,W,AH,N] 到[T,UW] 三[TH,R,IY]

返回: 最佳路径上的单词串和相关音素"

位置:src/sphinx4/edu/cmu/sphinx/result/Result.java

Token.java 是执行实际工作的类。

希望这会有所帮助。

【讨论】:

    【解决方案2】:

    找到了这个示例代码,它可以接收识别结果对象并转储音素 :http://cmusphinx.sourceforge.net/wiki/sphinx4:unittimestamps

    我发现这篇论文对理解 Sphinx4 非常有用:http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4Whitepaper.pdf

    了解了架构后,我浏览了 javadoc 页面上的软件包列表。

    希望对您有所帮助。祝你好运!

    【讨论】:

    • 请注意,不鼓励仅链接的答案,因此答案应该是搜索解决方案的终点(相对于另一个参考中途停留,随着时间的推移往往会变得陈旧)。请考虑在此处添加独立的概要,并保留链接作为参考。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-09-16
    • 1970-01-01
    • 1970-01-01
    • 2011-10-24
    • 2011-11-16
    • 1970-01-01
    相关资源
    最近更新 更多