iPhone 上的语音识别答案

【问题标题】：Speech Recognition on iPhoneiPhone 上的语音识别
【发布时间】：2009-07-13 09:04:53
【问题描述】：

我需要开发一个能够识别语音的 iPhone 应用程序，并根据结果执行进一步的任务。

我知道 iPhone 3.0 不支持语音识别，我需要在服务器端实现语音识别软件。我只知道这件事，因为我是新手，我不知道如何处理。

意味着我需要在服务器端购买和实施哪些软件，以及如何使用该服务？？

【问题讨论】：

服务器端是什么意思？
他的意思是“不在电话上”。指定是否必须使用特定的服务器操作系统可能会有所帮助。
服务器端意味着将音频数据发送到服务器，识别那里的语音（使用大量资源和内存）并将生成的文本输出发送回手机。谷歌在 Android 上通过 OCR 和机器翻译来做到这一点，例如：拍摄一些外国文本的照片，将其发送到服务器，OCR 并将其翻译成英文并将文本结果发回。

【解决方案1】：

我所知道的最好的开源语音识别包是 Sphinx。
http://cmusphinx.sourceforge.net/

否则，我会建议研究 Nuance 软件。

当前的语音识别在语法集有限的情况下表现良好（如果你知道他们要说什么的话）。开放式听写仍然不够好，无法可靠地用于许多应用程序。在开发应用程序时请记住这一点。我现在希望 Google 正在进入应该开始改进的转录游戏（使用 Google Voice）。我想他们将来可能会有一些东西。

【讨论】：

【解决方案2】：

我认为服务器端语音识别软件套件并不多。开源版本似乎几乎不存在。不过，您可能想看看这个 SDK：

它可能允许你在 iPhone 上做你想做的事。

【讨论】：

【解决方案3】：

正确进行语音识别是非常棘手的，也是一个活跃的研究领域。

不过，有一些开源解决方案，请参阅here。另外一个新的是SCARF，但我不知道它是否可以使用，或者只是一个概念证明。

【讨论】：

【解决方案4】：

查看Nuance Mobile Developer program。如果需要，我们有各种平台（包括 iOS）和 HTTP 服务的库。

【讨论】：