【问题标题】:Using Google Api: Speech To Text on PC Version使用 Google Api:PC 版语音转文本
【发布时间】:2012-09-11 10:39:05
【问题描述】:

Google Chrome 提供语音转文本 (STT),许多智能手机应用程序都提供 STT。有很好的辨识度。

我想要 Visual Studio(MFC) 中的程序,但是没有方法可以做 STT。如果我使用 Google Speech To Text Api,解决这个问题很容易。

如果没有关于 STT 的公开 google api,请告诉我除 start 之外的另一种方法。

【问题讨论】:

    标签: mfc speech-recognition


    【解决方案1】:

    据我所知,Google 没有记录他们的语音 API,也不打算将其用于通用客户端。我相信他们的意图是让语音 API 支持他们的 Android 和 Chrome 产品。也就是说,Does Anyone Uses Google Speech API in Production?Is there an API for Google's speech recognition technology? 有更多信息。

    既然您正在为 Windows 编程,为什么不使用内置的 Windows 语音引擎。您可以使用 .Net 或 Microsoft.Speech 的 System.Speech 功能并安装 Microsoft 提供的免费识别器。 Windows 7 包括一个完整的语音引擎。其他的可以免费下载。有一个用于相同引擎的 C++ API,称为 SAPI。请参阅http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关适用于 Windows 的 Microsoft 引擎的更多背景信息 What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?

    最后一个链接希望对您有所帮助,这里是 .NET 中语音识别的简单示例 - SAPI and Windows 7 Problem

    【讨论】:

    • 我尝试使用微软引擎,但它的识别率下降了。如果您有其他来源或文件,请与我分享。
    • 我发现微软的语音识别质量非常好。也许您可以解释您遇到的问题并发布问题,以便人们可以帮助您获得更好的结果。
    • 在哪里可以找到高质量的微软语音识别示例?
    • 在回答您的问题时,我放置了一个指向 StackOverflow 帖子的链接,其中包含一个很好的示例。见stackoverflow.com/questions/4213035/sapi-and-windows-7-problem
    • 微软的语音 api 的问题在于它不适用于大多数语言,只适用于其中的一些语言,而在谷歌的情况下则相反。他们的语音合成也一样,真的。
    【解决方案2】:

    您可能会发现:https://gist.github.com/alotaiba/1730160 很有用。基本上你需要在 POST 请求中将 FLAC 编码的音频文件发送到谷歌服务器。请注意,它只接受 15 秒以内的音频文件(对于简单的语音命令应用程序就足够了)。

    我正在研究这样的事情,MS Speech API 不适合我,即使它很好,因为它不支持 Google 的 API 支持的大多数语言(例如波兰语,MS 文本转语音也是如此)。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多