Android Instant Speech to Text 语音识别答案

【问题标题】：Android Instant Speech to Text voice recognitionAndroid Instant Speech to Text 语音识别
【发布时间】：2011-08-05 03:08:46
【问题描述】：

我对 Android 没有太多经验，但一位听力受损的朋友问我是否有办法在移动设备上将语音“流式传输”到文本中。我已经使用并查看了android内置的api，但似乎只有在语音输入完成后才将语音发送出去进行处理。我正在寻找可以连续工作的东西（类似于 Dragon 与 microsoft word 的工作方式）。

也许已经有一个应用程序可以做到这一点。如果没有，有没有办法用当前的 Android OS/API 来实现？

任何建议表示赞赏。

【问题讨论】：

标签： android accessibility voice-recognition

【解决方案1】：

正如您所提到的，语音到文本的识别被发送到 Google 进行处理。这可能需要巨大的计算能力，而目前的设备（还）根本无法处理。由于一切都在服务器端处理，因此您无法直接在手机上实时进行即时语音识别。

可能有人创建了一个 3rd-party 库来执行此操作，但我不知道。即便如此，它可能会有一些明显的限制或降低准确性。

【讨论】：

感谢您的快速回答。没有办法批量处理它，对吧？即获取一个 10 秒的样本，发送它，然后开始另一个 10 秒的样本，等等......永远。我想这可能会造成可怕的备份混乱......
您当然可以这样做，因为您的应用程序会知道文本的最后一位处理完毕的时间，并且您会得到该结果。缺点是您必须时不时停止说话并等待几秒钟 - 每个语音样本的时间越长，获得响应所需的时间就越长。
另外，如果你只是一直显示语音输入框，它怎么知道你说完了并停止显示该框？所以是的，我认为这是一种有效的方法，但对最终用户来说可能是一种令人沮丧的体验。
是的，这与我认为可能发生的情况相似。谢谢。

【解决方案2】：

您可以将此 Extra 用于识别器意图：

String EXTRA_PARTIAL_RESULTS 可选布尔值，指示识别器是否应在用户说话时返回部分结果（默认为 false）。

http://developer.android.com/reference/android/speech/RecognizerIntent.html#EXTRA_PARTIAL_RESULTS

【讨论】：