【发布时间】:2017-08-01 13:31:42
【问题描述】:
我正在使用 Google Speech API 来识别使用 Python 的 .OGG 文件音频中的越南语语音。但它不会返回任何结果。
【问题讨论】:
标签: speech-recognition google-speech-api
我正在使用 Google Speech API 来识别使用 Python 的 .OGG 文件音频中的越南语语音。但它不会返回任何结果。
【问题讨论】:
标签: speech-recognition google-speech-api
至少在英文版的 Google Speech API 中,您需要使用 FLAC 输入文件或 Linear 16 输入文件(不是 OGG 音频格式)。
有关详细信息,请参阅此故障排除页面:https://cloud.google.com/speech-to-text/docs/troubleshooting
【讨论】:
尝试使用此配置,对我来说使用 nodejs 工作
const config = {
encoding: 'OGG_OPUS',
sampleRateHertz: 16000,
languageCode: 'YOUR_LAUNGAGE CODE'
}
我正在使用 OGA 的电报音频文件
【讨论】: