【问题标题】:Cloud Speech-to-Text bad sample rate hertzCloud Speech-to-Text 错误采样率赫兹
【发布时间】:2018-12-14 02:18:25
【问题描述】:

尝试通过 Cloud Shell 将音频模拟为文本,如 https://codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html?index=..%2F..%2Findex#0- 中所述

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "en-US"
  },
  "audio": {
      "uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
  }
}

这行得通。 使用相同的配置,将从上述codelabs文档中获得的brooklyn.flac文件(文件实际上是一个.wav)加载到bucket中并在“audio”字符串中调用该地址,返回以下错误

{
  "error": {
    "code": 400,
    "message": "Invalid recognition 'config': bad sample rate hertz.",
    "status": "INVALID_ARGUMENT"
  }
}

按照https://cloud.google.com/speech-to-text/docs/reference/rest/v1/RecognitionConfig#AudioEncoding(16 位、16KHz、单声道、WAV、FLAC 编码)中概述的要求编码的其他文件也会出现同样的错误 此外,根据上述 AudioEncoding 参考使用“sampleRateHertz”和“ENCODING_UNSPECIFIED”也会返回无效参数错误。 用关键字“config”搜索了板子:bad sample rate hertz。没有运气。 奇怪的是,codelabs 文档中调用的 FLAC 文件在下载时是一个 .wav,而在移到我的存储桶时不起作用。 欢迎任何想法 - 谢谢!

【问题讨论】:

    标签: json speech-to-text google-speech-api


    【解决方案1】:

    codelabs 文档有点混乱,他们实际上在以下地址 gs://cloud-samples-tests/speech/brooklyn.flac 下转录 FLAC 文件(在 https://storage.cloud.google.com/speech-demo/brooklyn.flac 下载 flac 文件)但他们建议预览地址 https://storage.cloud.google.com/speech-demo/brooklyn.wav 下带有 WAV 的不同文件。这是因为没有多少浏览器可以播放flac,但大多数浏览器都可以播放wav。 WAV 文件仅用于预览,不能用于转录。

    如果将WAV文件放入bucket,则需要根据WAV格式调整参数。或者您仍然可以下载 FLAC 文件并作为推荐使用。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-04-16
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多