【问题标题】:Getting WAV file transcription to work with Sphinx4让 WAV 文件转录与 Sphinx4 一起工作
【发布时间】:2009-10-04 16:55:05
【问题描述】:

我已经在我的 Windows XP 系统上安装了 Sphinx-4 并设置了 JSAPI。我想将英语口语 WAV(或 MP3)文件转录为文本。

当我运行 "WavFile" demo - 它运行成功。

java -jar WavFile.jar

但是,当我像这样传递自己的 wav 文件时:

java -jar WavFile.jar c:\test.wav

我明白了:

加载 'jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml' 中定义的识别器...

解码jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五

似乎这个演示设置为加载和运行内部 wav 文件(“12345.wav”)或其他东西。

我已阅读文档,但不知道如何设置“config.xml”,甚至不知道将其放置在哪个目录中。我只是想获得一个使用标准演示运行的简单概念证明.

所以,问题是:如何运行 Sphinx4 程序来转录 wav 文件?

谢谢。

【问题讨论】:

    标签: speech-recognition speech-to-text cmusphinx


    【解决方案1】:

    需要编写一个新应用程序(基于 Transcriber.java),它使用 CMU 词典(美式英语)而不是 Transcriber.jar 支持的数字。

    Sphinx 没有提供这么有用的样本,这很奇怪。

    【讨论】:

      【解决方案2】:

      我知道这是一个非常古老的线程,但我只是想指出您的示例似乎运行得很好。如果您查看输出的最后:

      解码jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五个

      【讨论】:

        【解决方案3】:

        看看pocketsphinx 包。它是用 C 语言编写的,已针对每个平台进行编译,可用作命令行或应用程序的一部分。我一直在使用命令行,它非常通用。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2016-12-15
          • 2014-09-15
          • 1970-01-01
          • 2016-12-13
          • 2016-10-06
          • 2011-11-30
          • 2014-02-19
          • 2011-09-03
          相关资源
          最近更新 更多