Sphinx4 找出正确的模型答案

【问题标题】：Sphinx4 figuring out correct modelsSphinx4 找出正确的模型
【发布时间】：2015-01-20 14:29:23
【问题描述】：

我正在尝试使用 Sphinx4 库进行语音识别，但我似乎无法找出声学模型-字典-语言模型的正确组合。我尝试了各种组合，每次都得到不同的错误。

我正在尝试按照http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4 上的教程进行操作。如果我使用 ConfigurationManager 而不是 Configuration，我没有 config.xml，因为没有可感知的方式将配置文件的位置传递给 Configuration 本身（ConfigMgr 将其作为构造函数的参数）；这可能是我的问题。我只是不知道如何指向一个，并且由于教程说“可以通过 XML 文件配置应用程序的低级组件，尽管只有在你了解发生了什么的情况下才应该这样做。”，我假设有一个 config.xml 文件不是强制性的。

结合最新的字典（7b - 从 Sourceforge 获得）与最新的声学模型（cmusphinx-en-us-5.2.tar.gz - 再次来自 SF）和语言模型（cmusphinx-5.0-en-us.lm .gz - 再次来自 SF）在startRecognition 中产生NullPointerException。该问题与此处的问题类似：sphinx-4 NullPointerException at startRecognition，但答案中给出的链接不再有效。我从 SF 获得了 0.7a（因为那是链接似乎指向的 dict），但是当我使用那个时，我在执行 Error loading word: ;;; 时变得更早了。我尝试从 Github 存储库下载最新模型和 dict，结果为 java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128。

非常感谢任何帮助！

【问题讨论】：

标签： cmusphinx sphinx4

【解决方案1】：

你需要使用来自github的最新代码

http://github.com/cmusphinx/sphinx4

如教程所述

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

正确的模型（en-us）已包含在内，您不应更换任何东西。您不应配置任何 XML 文件，请使用源中提供的示例。

【讨论】：

只有在我克隆了 github 存储库之后，我才能看到使用 config.xml 文件的 Context 类，显然这是我的问题，正如我所怀疑的那样。仅使用我设置配置对象的声学、字典和语言模型路径的主类是不够的； config.xml 的路径是使用 Context 类中的 ConfigMgr 设置的。感谢您的帮助。