【发布时间】:2009-07-13 09:04:53
【问题描述】:
我需要开发一个能够识别语音的 iPhone 应用程序,并根据结果执行进一步的任务。
我知道 iPhone 3.0 不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理。
意味着我需要在服务器端购买和实施哪些软件,以及如何使用该服务??
【问题讨论】:
-
服务器端是什么意思?
-
他的意思是“不在电话上”。指定是否必须使用特定的服务器操作系统可能会有所帮助。
-
服务器端意味着将音频数据发送到服务器,识别那里的语音(使用大量资源和内存)并将生成的文本输出发送回手机。谷歌在 Android 上通过 OCR 和机器翻译来做到这一点,例如:拍摄一些外国文本的照片,将其发送到服务器,OCR 并将其翻译成英文并将文本结果发回。