【发布时间】:2012-01-11 13:55:30
【问题描述】:
我正在用 python 编写一些语音识别代码,我希望它能够打开 microsoft 语音识别系统,但我希望该系统忽略所有常规 gui 界面命令。因此,如果我说出它识别的内容,它会忽略它并让我的程序处理它。
【问题讨论】:
标签: python speech-recognition speech
我正在用 python 编写一些语音识别代码,我希望它能够打开 microsoft 语音识别系统,但我希望该系统忽略所有常规 gui 界面命令。因此,如果我说出它识别的内容,它会忽略它并让我的程序处理它。
【问题讨论】:
标签: python speech-recognition speech
我相信有一个名为pyspeech 的python API,它是Microsoft 语音API 的包装器。请参阅pyspeech (python) - Transcribe mp3 files? 了解一些可能有用的答案。
通常,使用 Microsoft 语音 API,当人们看到“常规 GUI 界面命令”时,这意味着他们已经实例化了一个共享识别器。您需要实例化一个 inproc 识别器。您可以通过在应用程序中实例化 SpeechRecognitionEngine() 来做到这一点。见SpeechRecognitionEngine Class。我怀疑你正在实例化一个共享识别器 - SpeechRecognizer Class
几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx 上发表了一篇关于Microsoft Speech 的非常好的文章。这可能是迄今为止我找到的最好的介绍性文章。它有点过时了,但很有帮助。 (AppendResultKeyValue 方法在 beta 之后被删除。)
这两个问题可能对你有一些其他有用的信息:
【讨论】: