【发布时间】:2015-01-20 14:29:23
【问题描述】:
我正在尝试使用 Sphinx4 库进行语音识别,但我似乎无法找出声学模型-字典-语言模型的正确组合。我尝试了各种组合,每次都得到不同的错误。
我正在尝试按照http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 上的教程进行操作。如果我使用 ConfigurationManager 而不是 Configuration,我没有 config.xml,因为没有可感知的方式将配置文件的位置传递给 Configuration 本身(ConfigMgr 将其作为构造函数的参数);这可能是我的问题。我只是不知道如何指向一个,并且由于教程说“可以通过 XML 文件配置应用程序的低级组件,尽管只有在你了解发生了什么的情况下才应该这样做。”,我假设有一个 config.xml 文件不是强制性的。
结合最新的字典(7b - 从 Sourceforge 获得)与最新的声学模型(cmusphinx-en-us-5.2.tar.gz - 再次来自 SF)和语言模型(cmusphinx-5.0-en-us.lm .gz - 再次来自 SF)在startRecognition 中产生NullPointerException。该问题与此处的问题类似:sphinx-4 NullPointerException at startRecognition,但答案中给出的链接不再有效。我从 SF 获得了 0.7a(因为那是链接似乎指向的 dict),但是当我使用那个时,我在执行 Error loading word: ;;; 时变得更早了。我尝试从 Github 存储库下载最新模型和 dict,结果为 java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128。
非常感谢任何帮助!
【问题讨论】: