【发布时间】:2009-10-04 16:55:05
【问题描述】:
我已经在我的 Windows XP 系统上安装了 Sphinx-4 并设置了 JSAPI。我想将英语口语 WAV(或 MP3)文件转录为文本。
当我运行 "WavFile" demo - 它运行成功。
java -jar WavFile.jar
但是,当我像这样传递自己的 wav 文件时:
java -jar WavFile.jar c:\test.wav
我明白了:
加载 'jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml' 中定义的识别器...
解码jar:file:/C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav 结果:一二三四五
似乎这个演示设置为加载和运行内部 wav 文件(“12345.wav”)或其他东西。
我已阅读文档,但不知道如何设置“config.xml”,甚至不知道将其放置在哪个目录中。我只是想获得一个使用标准演示运行的简单概念证明.
所以,问题是:如何运行 Sphinx4 程序来转录 wav 文件?
谢谢。
【问题讨论】:
标签: speech-recognition speech-to-text cmusphinx