【问题标题】:How to pass audio data directly to Sphinx4如何将音频数据直接传递给 Sphinx4
【发布时间】:2013-08-11 17:43:24
【问题描述】:

我想将 Sphinx4 用于我系统的一部分。而且,我已经尝试过直接使用麦克风的 HelloWorld 演示。此外,我还看到了有关使用音频文件的示例。

那么,我的问题是,是否还有其他方法可以识别语音?例如,识别短类型数据(例如 short[] 缓冲区)。

除了使用麦克风或 wav 文件(音频文件)之外,我找不到其他方法。

例如,PocketSphinx 具有 processRaw 函数,该函数在此问题 (Input for Pocketsphinx on Android) 中进行了描述。

Sphinx4中没有对应的功能吗?

【问题讨论】:

    标签: speech-recognition sphinx4


    【解决方案1】:

    要从字节数组中提供数据,您需要执行以下操作:

    1. 将前端配置为使用 StreamDataSource 而不是麦克风或 AudioFileDataSource。您可以查看 LatticeDemo 或 TrancriberDemo 例如如何执行此操作。

    2. 使用数据从 byte[] 数组创建 ByteArrayInputStream

    3. 通过 StreamDataSource 的 setInputStream 方法设置输入流使用 ByteArrayInputStream

    4. 运行recognize() 识别字节数组中的数据

    您可以通过 InputStream 成功使用任何数据,例如来自 Socket 或来自文件的输入数据。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-06-20
      • 2022-12-31
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-02-07
      • 2023-01-11
      相关资源
      最近更新 更多