【发布时间】:2013-04-30 18:20:39
【问题描述】:
在哪里可以找到有关 ARPA 语言模型格式的文档?
我正在使用袖珍狮身人面像 STT 引擎开发简单的语音识别应用程序。出于性能原因,建议使用 ARPA。 我想了解我可以做多少调整我的语言模型以满足我的自定义需求。
我发现的只是一些非常简短的 ARPA 格式描述:
- http://kered.org/blog/2008-08-12/arpa-language-model-file-format/
- http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html
- http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html
我是 STT 的初学者,我很难理解这个(n-gram 等)。我正在寻找更详细的文档。类似 JSGF 语法的文档:
【问题讨论】:
-
我发现这个链接很有用:speech.sri.com/projects/srilm/manpages/ngram-format.5.html 它描述了 n-gram aka ARPA aka Doug Paul 格式。
-
看看这个 msdn 链接。arpa 和 args 格式解释得很好Compile Grammar Input and Output File Format
标签: nlp speech-recognition cmusphinx sphinx4 language-model