【问题标题】:Speech Recognition on iPhoneiPhone 上的语音识别
【发布时间】:2009-07-13 09:04:53
【问题描述】:

我需要开发一个能够识别语音的 iPhone 应用程序,并根据结果执行进一步的任务。

我知道 iPhone 3.0 不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理。

意味着我需要在服务器端购买和实施哪些软件,以及如何使用该服务??

【问题讨论】:

  • 服务器端是什么意思?
  • 他的意思是“不在电话上”。指定是否必须使用特定的服务器操作系统可能会有所帮助。
  • 服务器端意味着将音频数据发送到服务器,识别那里的语音(使用大量资源和内存)并将生成的文本输出发送回手机。谷歌在 Android 上通过 OCR 和机器翻译来做到这一点,例如:拍摄一些外国文本的照片,将其发送到服务器,OCR 并将其翻译成英文并将文本结果发回。

标签: iphone speech-recognition


【解决方案1】:

我所知道的最好的开源语音识别包是 Sphinx。
http://cmusphinx.sourceforge.net/

否则,我会建议研究 Nuance 软件。

当前的语音识别在语法集有限的情况下表现良好(如果你知道他们要说什么的话)。开放式听写仍然不够好,无法可靠地用于许多应用程序。在开发应用程序时请记住这一点。我现在希望 Google 正在进入应该开始改进的转录游戏(使用 Google Voice)。我想他们将来可能会有一些东西。

【讨论】:

【解决方案2】:

我认为服务器端语音识别软件套件并不多。开源版本似乎几乎不存在。不过,您可能想看看这个 SDK:

http://www.scribd.com/doc/17247334/Creaceed-Releases-iPhone-Speech-Recognition-SDK http://www.creaceed.com/weblog/ceedvocalsdk.html

它可能允许你在 iPhone 上做你想做的事。

【讨论】:

    【解决方案3】:

    正确进行语音识别是非常棘手的,也是一个活跃的研究领域。

    不过,有一些开源解决方案,请参阅here。另外一个新的是SCARF,但我不知道它是否可以使用,或者只是一个概念证明。

    【讨论】:

      【解决方案4】:

      查看Nuance Mobile Developer program。如果需要,我们有各种平台(包括 iOS)和 HTTP 服务的库。

      【讨论】:

        猜你喜欢
        • 2017-12-16
        • 1970-01-01
        • 1970-01-01
        • 2011-12-09
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多