【发布时间】:2018-08-03 01:01:27
【问题描述】:
我正在处理通过 Quicktime 录制并以 .m4a 格式保存的音频。我想使用 Google Cloud Provider 的 Speech API,他们的建议是:
做:
使用无损编解码器录制和传输音频。建议使用 FLAC 或 LINEAR16。
避免:
在录制或传输过程中使用 mp3、mp4、m4a、mu-law、a-law 或其他有损编解码器可能会降低准确性。如果您的音频已经采用 API 不支持的编码,请将其转码为无损 FLAC 或 LINEAR16。如果您的应用程序必须使用有损编解码器来节省带宽,我们建议您按照首选顺序使用 AMR_WB、OGG_OPUS 或 SPEEX_WITH_HEADER_BYTE 编解码器。
来源:https://cloud.google.com/speech/docs/best-practices
API 支持 FLAC、WAV 或 raw,我正在尝试以编程方式将我的文件转码为其中一种,以便在应用程序中使用。但是,我找不到一个好的 Python 库来执行此操作。
更新: 答案如下:https://www.ffmpeg.org/(不是 python,但肯定是最全面的工具)
【问题讨论】:
标签: python python-3.x audio