【问题标题】:Transcribe only specific portions of audio using Google Cloud speech-to-text使用 Google Cloud 语音转文本仅转录特定部分的音频
【发布时间】:2021-07-17 03:00:48
【问题描述】:

我似乎在文档中找不到任何说明。我能够成功转录谷歌云存储中的音频,但它转录了整个文件。为了节省成本,我想只转录部分音频,最好使用时间戳。是否有方法或变量可以做到这一点?

【问题讨论】:

标签: google-cloud-platform speech-to-text google-speech-api google-cloud-speech google-speech-to-text-api


【解决方案1】:

您可以按照评论中的建议首先根据时间戳拆分音频文件。以下来自this Stackoverflow link 的 Python 代码可用于相同的目的。

from pydub import AudioSegment 
t1 = t1 * 1000 #Works in milliseconds
t2 = t2 * 1000 
newAudio = AudioSegment.from_wav("oldSong.wav") 
newAudio = newAudio[t1:t2] 
newAudio.export('newSong.wav', format="wav") #Exports to a wav file in the current path.

代码使用Pydub库,支持WAV、mp3、flv等多种音频文件格式

【讨论】:

  • 感谢您的帮助;但是我想知道 Google API 是否有办法在云中执行此操作。好像没有办法我的程序编码方式,首先拆分音频需要更长的时间。尽管如此,我们还是非常感谢您的帮助。
  • @JamesKurian 不幸的是,Speech-to-Text API 目前不支持转录音频文件的特定部分,但我们正在努力。我们目前无法提供 ETA,但您可以在 issue tracker 上关注其进度,您可以通过引用此 Link 来“明星”该问题以接收自动更新并为其提供牵引力。
猜你喜欢
  • 1970-01-01
  • 2021-07-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-01-27
  • 1970-01-01
  • 2012-09-11
相关资源
最近更新 更多