【发布时间】:2012-09-11 10:39:05
【问题描述】:
Google Chrome 提供语音转文本 (STT),许多智能手机应用程序都提供 STT。有很好的辨识度。
我想要 Visual Studio(MFC) 中的程序,但是没有方法可以做 STT。如果我使用 Google Speech To Text Api,解决这个问题很容易。
如果没有关于 STT 的公开 google api,请告诉我除 start 之外的另一种方法。
【问题讨论】:
Google Chrome 提供语音转文本 (STT),许多智能手机应用程序都提供 STT。有很好的辨识度。
我想要 Visual Studio(MFC) 中的程序,但是没有方法可以做 STT。如果我使用 Google Speech To Text Api,解决这个问题很容易。
如果没有关于 STT 的公开 google api,请告诉我除 start 之外的另一种方法。
【问题讨论】:
据我所知,Google 没有记录他们的语音 API,也不打算将其用于通用客户端。我相信他们的意图是让语音 API 支持他们的 Android 和 Chrome 产品。也就是说,Does Anyone Uses Google Speech API in Production? 和 Is there an API for Google's speech recognition technology? 有更多信息。
既然您正在为 Windows 编程,为什么不使用内置的 Windows 语音引擎。您可以使用 .Net 或 Microsoft.Speech 的 System.Speech 功能并安装 Microsoft 提供的免费识别器。 Windows 7 包括一个完整的语音引擎。其他的可以免费下载。有一个用于相同引擎的 C++ API,称为 SAPI。请参阅http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关适用于 Windows 的 Microsoft 引擎的更多背景信息 What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?
最后一个链接希望对您有所帮助,这里是 .NET 中语音识别的简单示例 - SAPI and Windows 7 Problem
【讨论】:
您可能会发现:https://gist.github.com/alotaiba/1730160 很有用。基本上你需要在 POST 请求中将 FLAC 编码的音频文件发送到谷歌服务器。请注意,它只接受 15 秒以内的音频文件(对于简单的语音命令应用程序就足够了)。
我正在研究这样的事情,MS Speech API 不适合我,即使它很好,因为它不支持 Google 的 API 支持的大多数语言(例如波兰语,MS 文本转语音也是如此)。
【讨论】: