如何将音频数据直接传递给 Sphinx4答案

【问题标题】：How to pass audio data directly to Sphinx4如何将音频数据直接传递给 Sphinx4
【发布时间】：2013-08-11 17:43:24
【问题描述】：

我想将 Sphinx4 用于我系统的一部分。而且，我已经尝试过直接使用麦克风的 HelloWorld 演示。此外，我还看到了有关使用音频文件的示例。

那么，我的问题是，是否还有其他方法可以识别语音？例如，识别短类型数据（例如 short[] 缓冲区）。

除了使用麦克风或 wav 文件（音频文件）之外，我找不到其他方法。

例如，PocketSphinx 具有 processRaw 函数，该函数在此问题 (Input for Pocketsphinx on Android) 中进行了描述。

Sphinx4中没有对应的功能吗？

【问题讨论】：

【解决方案1】：

要从字节数组中提供数据，您需要执行以下操作：

将前端配置为使用 StreamDataSource 而不是麦克风或 AudioFileDataSource。您可以查看 LatticeDemo 或 TrancriberDemo 例如如何执行此操作。
使用数据从 byte[] 数组创建 ByteArrayInputStream
通过 StreamDataSource 的 setInputStream 方法设置输入流使用 ByteArrayInputStream
运行recognize() 识别字节数组中的数据

您可以通过 InputStream 成功使用任何数据，例如来自 Socket 或来自文件的输入数据。

【讨论】：