【问题标题】:Silence/Pauses in audio file leads to Google Speech to Text transcription ending early音频文件中的静音/暂停导致 Google Speech to Text 转录提前结束
【发布时间】:2019-05-31 14:47:23
【问题描述】:

我正在使用 Google Speech to Text API 使用 Python3 中的同步识别意图转换 FLAC 音频文件。但是,当音频文件包含短暂的停顿或静音时,转录会提前结束,并且响应不会捕获暂停/静音后的文本。

        audiofile = self.convert_mp3_to_flac(audiofile)
        with io.open(audiofile, 'rb') as audio_file:
            content = audio_file.read()
        audio = types.RecognitionAudio(content=content)
        config = types.RecognitionConfig(
            encoding=enums.RecognitionConfig.AudioEncoding.FLAC,
            sample_rate_hertz=24000,
            language_code='en-US',
            enable_automatic_punctuation=True)
        response = self.client.recognize(config, audio)

响应对象不包含音频文件中静音后的语音转录。

我希望看到整个转录,因为我正在使用整个音频文件发出请求。

【问题讨论】:

    标签: python python-3.x google-cloud-speech


    【解决方案1】:

    音频源是否使用降噪麦克风产生?一种解决方法是在音频中添加一些白噪声。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2016-03-12
      • 1970-01-01
      • 2023-03-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多