【发布时间】:2018-07-31 12:35:10
【问题描述】:
我想知道如何对音频文件进行语音分割。 例如。父亲,我想应该是,F-a-th-er。
我很想使用过零来检测有声和无声区域,但我很确定。
谢谢。
【问题讨论】:
标签: audio signals signal-processing speech
我想知道如何对音频文件进行语音分割。 例如。父亲,我想应该是,F-a-th-er。
我很想使用过零来检测有声和无声区域,但我很确定。
谢谢。
【问题讨论】:
标签: audio signals signal-processing speech
您提到的过零是一种方法,例如解释。在this 文章中。其他包括神经网络或隐马尔可夫模型。
要获得任何体面的结果,您还应该有一个语言模型。使用句子/单词要容易得多,然后才将它们翻译成音素。为什么?因为上下文对于计算机系统——甚至我们人类——理解这个词来说是必不可少的。上下文为音素提供了约束,没有它很难(不可能?)工作。
【讨论】: