使用 Google Cloud 语音转文本仅转录特定部分的音频答案

【问题标题】：Transcribe only specific portions of audio using Google Cloud speech-to-text使用 Google Cloud 语音转文本仅转录特定部分的音频
【发布时间】：2021-07-17 03:00:48
【问题描述】：

我似乎在文档中找不到任何说明。我能够成功转录谷歌云存储中的音频，但它转录了整个文件。为了节省成本，我想只转录部分音频，最好使用时间戳。是否有方法或变量可以做到这一点？

【问题讨论】：

首先根据时间戳分割音频。 stackoverflow.com/questions/37999150/…

标签： google-cloud-platform speech-to-text google-speech-api google-cloud-speech google-speech-to-text-api

【解决方案1】：

您可以按照评论中的建议首先根据时间戳拆分音频文件。以下来自this Stackoverflow link 的 Python 代码可用于相同的目的。

from pydub import AudioSegment 
t1 = t1 * 1000 #Works in milliseconds
t2 = t2 * 1000 
newAudio = AudioSegment.from_wav("oldSong.wav") 
newAudio = newAudio[t1:t2] 
newAudio.export('newSong.wav', format="wav") #Exports to a wav file in the current path.

代码使用Pydub库，支持WAV、mp3、flv等多种音频文件格式

【讨论】：

感谢您的帮助；但是我想知道 Google API 是否有办法在云中执行此操作。好像没有办法我的程序编码方式，首先拆分音频需要更长的时间。尽管如此，我们还是非常感谢您的帮助。
@JamesKurian 不幸的是，Speech-to-Text API 目前不支持转录音频文件的特定部分，但我们正在努力。我们目前无法提供 ETA，但您可以在 issue tracker 上关注其进度，您可以通过引用此 Link 来“明星”该问题以接收自动更新并为其提供牵引力。