Cloud Speech-to-Text 错误采样率赫兹答案

【问题标题】：Cloud Speech-to-Text bad sample rate hertzCloud Speech-to-Text 错误采样率赫兹
【发布时间】：2018-12-14 02:18:25
【问题描述】：

尝试通过 Cloud Shell 将音频模拟为文本，如 https://codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html?index=..%2F..%2Findex#0- 中所述

{
  "config": {
      "encoding":"FLAC",
      "languageCode": "en-US"
  },
  "audio": {
      "uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
  }
}

这行得通。使用相同的配置，将从上述codelabs文档中获得的brooklyn.flac文件（文件实际上是一个.wav）加载到bucket中并在“audio”字符串中调用该地址，返回以下错误

{
  "error": {
    "code": 400,
    "message": "Invalid recognition 'config': bad sample rate hertz.",
    "status": "INVALID_ARGUMENT"
  }
}

按照https://cloud.google.com/speech-to-text/docs/reference/rest/v1/RecognitionConfig#AudioEncoding（16 位、16KHz、单声道、WAV、FLAC 编码）中概述的要求编码的其他文件也会出现同样的错误此外，根据上述 AudioEncoding 参考使用“sampleRateHertz”和“ENCODING_UNSPECIFIED”也会返回无效参数错误。用关键字“config”搜索了板子：bad sample rate hertz。没有运气。奇怪的是，codelabs 文档中调用的 FLAC 文件在下载时是一个 .wav，而在移到我的存储桶时不起作用。欢迎任何想法 - 谢谢！

【问题讨论】：

标签： json speech-to-text google-speech-api

【解决方案1】：

codelabs 文档有点混乱，他们实际上在以下地址 gs://cloud-samples-tests/speech/brooklyn.flac 下转录 FLAC 文件（在 https://storage.cloud.google.com/speech-demo/brooklyn.flac 下载 flac 文件）但他们建议预览地址 https://storage.cloud.google.com/speech-demo/brooklyn.wav 下带有 WAV 的不同文件。这是因为没有多少浏览器可以播放flac，但大多数浏览器都可以播放wav。 WAV 文件仅用于预览，不能用于转录。

如果将WAV文件放入bucket，则需要根据WAV格式调整参数。或者您仍然可以下载 FLAC 文件并作为推荐使用。

【讨论】：