【问题标题】:Android Instant Speech to Text voice recognitionAndroid Instant Speech to Text 语音识别
【发布时间】:2011-08-05 03:08:46
【问题描述】:

我对 Android 没有太多经验,但一位听力受损的朋友问我是否有办法在移动设备上将语音“流式传输”到文本中。我已经使用并查看了android内置的api,但似乎只有在语音输入完成后才将语音发送出去进行处理。我正在寻找可以连续工作的东西(类似于 Dragon 与 microsoft word 的工作方式)。

也许已经有一个应用程序可以做到这一点。如果没有,有没有办法用当前的 Android OS/API 来实现?

任何建议表示赞赏。

【问题讨论】:

    标签: android accessibility voice-recognition


    【解决方案1】:

    正如您所提到的,语音到文本的识别被发送到 Google 进行处理。这可能需要巨大的计算能力,而目前的设备(还)根本无法处理。由于一切都在服务器端处理,因此您无法直接在手机上实时进行即时语音识别。

    可能有人创建了一个 3rd-party 库来执行此操作,但我不知道。即便如此,它可能会有一些明显的限制或降低准确性。

    【讨论】:

    • 感谢您的快速回答。没有办法批量处理它,对吧?即获取一个 10 秒的样本,发送它,然后开始另一个 10 秒的样本,等等......永远。我想这可能会造成可怕的备份混乱......
    • 您当然可以这样做,因为您的应用程序会知道文本的最后一位处理完毕的时间,并且您会得到该结果。缺点是您必须时不时停止说话并等待几秒钟 - 每个语音样本的时间越长,获得响应所需的时间就越长。
    • 另外,如果你只是一直显示语音输入框,它怎么知道你说完了并停止显示该框?所以是的,我认为这是一种有效的方法,但对最终用户来说可能是一种令人沮丧的体验。
    • 是的,这与我认为可能发生的情况相似。谢谢。
    【解决方案2】:

    您可以将此 Extra 用于识别器意图:

    String EXTRA_PARTIAL_RESULTS 可选布尔值,指示识别器是否应在用户说话时返回部分结果(默认为 false)。

    http://developer.android.com/reference/android/speech/RecognizerIntent.html#EXTRA_PARTIAL_RESULTS

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-06-11
      • 1970-01-01
      • 1970-01-01
      • 2019-09-11
      • 2023-01-29
      相关资源
      最近更新 更多