【问题标题】:Perform real time continuous speech recognition using Xamarin and Microsoft Speech Service API使用 Xamarin 和 Microsoft Speech Service API 执行实时连续语音识别
【发布时间】:2018-06-25 13:28:55
【问题描述】:

我在 Bing Speech API 的文档中看到,可以将录音麦克风输入流式传输到 REST 服务 (https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home):

实时连续识别。语音识别 API 启用 用户实时将音频转录为文本,并支持 接收单词的中间结果 到目前为止都被认出来了。

但是,我无法找到一个示例,说明如何使用 Xamarin Forms 以跨平台方式实现这一点

我找到了以下教程:https://developer.xamarin.com/guides/xamarin-forms/cloud-services/cognitive-services/speech-recognition/

但是在这里,发送到 API 的音频流是一个已经存在的音频文件,我想要实现的是流式传输运行应用程序的设备的麦克风输入(Android、iOS、 UWP)

任何见解都将不胜感激。

【问题讨论】:

    标签: c# xamarin speech-recognition audio-recording bing-speech


    【解决方案1】:

    恐怕没有与Xamarin 兼容的库支持实时Microsoft Speech API。唯一兼容的是使用 REST 协议且不提供实时转录的 Bing Speech API。

    实时转录需要Speech Service WebSocket protocol,它有完整的文档记录。您可以自己实现这个接口,但要可靠地完成它可能是一项相当复杂的任务。

    但是,iOSAndroid 的本地库确实支持实时流功能。你可以看到tutorial for iOStutorial for Android

    然后您可以使用 Xamarin 绑定库将本机库绑定到您的 Xamarin 项目中。对于 Java 库 see this tutorial 和 Objective-C 库 see this tutorial

    尤其是创建 Objective-C 绑定可能是一项艰巨的任务,通常更容易创建一个充当外观的 Objective-C 库,然后使用本机库。您将了解外观库的接口,然后您将能够更轻松地创建绑定。你也可以考虑让 Xamarin 团队为你创建绑定,因为他们维护着不断增长的 third-party library bindings on GitHub 集合。

    【讨论】:

      【解决方案2】:

      我有一个使用必应语音的cross platform solution。让IOS正常工作。从未测试过 Android 解决方案。

      【讨论】:

        【解决方案3】:

        这里有一个很棒的库可以满足您的需求:

        https://github.com/NateRickard/Xamarin.Cognitive.BingSpeech

        【讨论】:

          猜你喜欢
          • 2018-09-16
          • 2019-04-12
          • 2013-06-07
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2020-07-09
          • 1970-01-01
          • 2016-10-31
          相关资源
          最近更新 更多