【问题标题】:Microsoft Oxfordproject Speech-to-text Rest APIMicrosoft Oxfordproject Speech-to-text Rest API
【发布时间】:2016-09-28 10:07:22
【问题描述】:

我需要通过 Rest API 使用 Microsoft 引擎识别语音到文本(我知道其他语音到文本引擎并且我让它们工作,但现在我需要完全是 MS 语音到文本)。

我阅读了很多信息和手册,但无法正常工作。

我尝试按照 MS 网站的手册进行操作(抱歉,我无法添加更多链接)但没有运气,然后我找到了许多“工作”示例,并找到了另一种如何通过 MS API 进行识别的方法,但遇到了问题:

1)我可以获取token来授权识别请求:

2) 拿到令牌后,我可以尝试发出识别录音的请求:

但无论如何我都会得到错误。 尽管请求中设置了“版本”。

如果有人知道如何通过 Microsoft Rest API 服务识别录音,请举个例子。

【问题讨论】:

    标签: api rest speech microsoft-cognitive


    【解决方案1】:

    很难确定,但屏幕截图使它看起来像 version 和其他参数在表单(有效负载)中,但规范要求这些是查询参数。

    【讨论】:

    • 没关系,如果我将所有参数移动到查询我会得到Parameter 'samplerate' value is null. Parameter name: samplerate - 尽管它在标题中设置然后如果我将采样率添加到请求值我会得到Parameter 'mimetype' value 'multipart/form-data' is invalid. Parameter name: mimetype ...
    • 您能分享通过 Rest API 工作的示例或任何工作示例
    • 基本上所有的参数都是查询参数。我写了一个bash脚本。根据您的操作系统,您需要使用不同的 getuuid 方法:```function getuuid() { echo cat /dev/urandom | tr -dc 'a-f0-9' | fold -w 32 | head -n 1 | perl -ne 'print join("-", /(.{8})(.{4})(.{4})(.{4})(.{12})/);' } curl -v "speech.platform.bing.com/recognize/…" \ -H "Content-Type: audio/wav; samplerate =8000" \
    • -H "Authorization: Bearer $speech_token" \ --data-binary @your.wav
    • 非常感谢 curl 示例绝对是我需要的,而且它有效。
    猜你喜欢
    • 2016-07-31
    • 1970-01-01
    • 2020-03-10
    • 1970-01-01
    • 1970-01-01
    • 2017-07-28
    • 1970-01-01
    • 1970-01-01
    • 2019-05-03
    相关资源
    最近更新 更多