【问题标题】:Google Speech API: Can recognize speech from OGG fileGoogle Speech API:可以识别 OGG 文件中的语音
【发布时间】:2017-08-01 13:31:42
【问题描述】:

我正在使用 Google Speech API 来识别使用 Python 的 .OGG 文件音频中的越南语语音。但它不会返回任何结果。

【问题讨论】:

    标签: speech-recognition google-speech-api


    【解决方案1】:

    至少在英文版的 Google Speech API 中,您需要使用 FLAC 输入文件或 Linear 16 输入文件(不是 OGG 音频格式)。

    有关详细信息,请参阅此故障排除页面:https://cloud.google.com/speech-to-text/docs/troubleshooting

    【讨论】:

      【解决方案2】:

      尝试使用此配置,对我来说使用 nodejs 工作

      const config = {
        encoding: 'OGG_OPUS',
        sampleRateHertz: 16000,
        languageCode: 'YOUR_LAUNGAGE CODE'
      }
      

      我正在使用 OGA 的电报音频文件

      【讨论】:

        猜你喜欢
        • 2017-02-24
        • 2016-10-31
        • 2015-04-05
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2018-05-04
        相关资源
        最近更新 更多