【发布时间】:2018-12-14 02:18:25
【问题描述】:
尝试通过 Cloud Shell 将音频模拟为文本,如 https://codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html?index=..%2F..%2Findex#0- 中所述
{
"config": {
"encoding":"FLAC",
"languageCode": "en-US"
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}
这行得通。 使用相同的配置,将从上述codelabs文档中获得的brooklyn.flac文件(文件实际上是一个.wav)加载到bucket中并在“audio”字符串中调用该地址,返回以下错误
{
"error": {
"code": 400,
"message": "Invalid recognition 'config': bad sample rate hertz.",
"status": "INVALID_ARGUMENT"
}
}
按照https://cloud.google.com/speech-to-text/docs/reference/rest/v1/RecognitionConfig#AudioEncoding(16 位、16KHz、单声道、WAV、FLAC 编码)中概述的要求编码的其他文件也会出现同样的错误 此外,根据上述 AudioEncoding 参考使用“sampleRateHertz”和“ENCODING_UNSPECIFIED”也会返回无效参数错误。 用关键字“config”搜索了板子:bad sample rate hertz。没有运气。 奇怪的是,codelabs 文档中调用的 FLAC 文件在下载时是一个 .wav,而在移到我的存储桶时不起作用。 欢迎任何想法 - 谢谢!
【问题讨论】:
标签: json speech-to-text google-speech-api