【问题标题】:Google Speech API Won't Accept Large Audio FilesGoogle Speech API 不接受大型音频文件
【发布时间】:2018-07-27 18:58:26
【问题描述】:

我在尝试处理大型音频文件时收到服务器错误。音频文件最初是 audio/m4a @ 32kHz 并且根据文档的建议将它们转换/压缩为 audio/amr_wb @ 16kHz。这些文件远低于 180 分钟的音频限制,但在处理它们时我仍然收到服务器错误。

GaxError Exception occurred in retry method that was not classified as transient, caused by 8:Received message larger than max (5371623 vs. 4194304)

我正在使用版本V1p1beta 和方法long_running_recognize 来转录这些音频文件。我的文件托管在 Google Cloud Storage 上,我在我的 api 调用中提供了 uri。

如何在服务器不强制执行大小限制的情况下将大型音频文件发送到 API?如果服务器甚至无法处理已编码为 AMR_WB 的长达一小时的音频文件,那么建议使用 FLAC 或 WAV 并将音频长度限制为 180 分钟似乎是错误的。

感谢您的帮助

【问题讨论】:

    标签: google-cloud-speech


    【解决方案1】:

    目前 Speech-to-Text API 发布了v1 endpoint,我建议尝试这个版本。通过使用 90 分钟的音频,我能够得到正确的响应。

    【讨论】:

      猜你喜欢
      • 2018-11-20
      • 1970-01-01
      • 2017-02-24
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-03-12
      相关资源
      最近更新 更多