AWS Lambda 函数中的音频文件到文本转换答案

【问题标题】：Audio file to text conversion in AWS Lambda functionAWS Lambda 函数中的音频文件到文本转换
【发布时间】：2019-06-11 08:06:01
【问题描述】：

我正在尝试使用 speech_regcognition python 包将音频文件转换为文本。但它只适用于非常小的音频文件（比如说 10 秒）。但我必须转换超过 60 秒的音频文件。我知道我可以使用 Google 语音 API 将音频文件转换为文本，但它是付费服务。我不想使用付费服务。所以现在我计划将原始音频文件拆分为多个小音频文件。假设我有 60 秒的音频文件，我将每个部分转换为 10 秒的音频文件。音频文件上传到 S3 存储桶后，我正在尝试在 AWS Lambda 服务中执行此部分。这样我就可以使用这个speech_recognition 免费服务，我不需要使用 Google API 密钥（付费）。

我的问题：如果我使用这种方法，当我在我的 AWS Lambda 服务中使用它时，它会产生任何问题或谷歌服务可以识别吗？

注意：此音频文件到文本文件的转换 AWS Lambda 函数将执行数百万次以上。

【问题讨论】：

标签： python amazon-web-services audio aws-lambda speech-to-text

【解决方案1】：

我建议您使用Amazon Transcribe 为自己节省一些时间和麻烦。它很容易与您的 AWS Lambda 函数集成。

如果您担心costs，有一个免费套餐：

每月 60 分钟，持续 12 个月

从您创建第一个转录请求之日起，您可以使用 Amazon Transcribe 免费套餐 12 个月。当您的免费使用到期时，或者如果您的应用程序使用超出免费使用层级，您只需支付标准的即用即付服务费率。

此后，它是每秒 0.0004 美元。即每分钟 2.4 美分或每小时 1.44 美元。

如果您超过免费层级，您将节省的个人时间将物超所值。

【讨论】：

好答案。这将比执行 100 万次 Lambda 函数便宜。