【发布时间】:2019-06-11 08:06:01
【问题描述】:
我正在尝试使用 speech_regcognition python 包将音频文件转换为文本。但它只适用于非常小的音频文件(比如说 10 秒)。但我必须转换超过 60 秒的音频文件。我知道我可以使用 Google 语音 API 将音频文件转换为文本,但它是付费服务。我不想使用付费服务。所以现在我计划将原始音频文件拆分为多个小音频文件。假设我有 60 秒的音频文件,我将每个部分转换为 10 秒的音频文件。音频文件上传到 S3 存储桶后,我正在尝试在 AWS Lambda 服务中执行此部分。这样我就可以使用这个speech_recognition 免费服务,我不需要使用 Google API 密钥(付费)。
我的问题:如果我使用这种方法,当我在我的 AWS Lambda 服务中使用它时,它会产生任何问题或谷歌服务可以识别吗?
注意:此音频文件到文本文件的转换 AWS Lambda 函数将执行数百万次以上。
【问题讨论】:
标签: python amazon-web-services audio aws-lambda speech-to-text