【问题标题】:Audio file to text conversion in AWS Lambda functionAWS Lambda 函数中的音频文件到文本转换
【发布时间】:2019-06-11 08:06:01
【问题描述】:

我正在尝试使用 speech_regcognition python 包将音频文件转换为文本。但它只适用于非常小的音频文件(比如说 10 秒)。但我必须转换超过 60 秒的音频文件。我知道我可以使用 Google 语音 API 将音频文件转换为文本,但它是付费服务。我不想使用付费服务。所以现在我计划将原始音频文件拆分为多个小音频文件。假设我有 60 秒的音频文件,我将每个部分转换为 10 秒的音频文件。音频文件上传到 S3 存储桶后,我正在尝试在 AWS Lambda 服务中执行此部分。这样我就可以使用这个speech_recognition 免费服务,我不需要使用 Google API 密钥(付费)。

我的问题:如果我使用这种方法,当我在我的 AWS Lambda 服务中使用它时,它会产生任何问题或谷歌服务可以识别吗?

注意:此音频文件到文本文件的转换 AWS Lambda 函数将执行数百万次以上。

【问题讨论】:

    标签: python amazon-web-services audio aws-lambda speech-to-text


    【解决方案1】:

    我建议您使用Amazon Transcribe 为自己节省一些时间和麻烦。它很容易与您的 AWS Lambda 函数集成。

    如果您担心costs,有一个免费套餐

    每月 60 分钟,持续 12 个月

    从您创建第一个转录请求之日起,您可以使用 Amazon Transcribe 免费套餐 12 个月。当您的免费使用到期时,或者如果您的应用程序使用超出免费使用层级,您只需支付标准的即用即付服务费率。

    此后,它是每秒 0.0004 美元。即每分钟 2.4 美分或每小时 1.44 美元。

    如果您超过免费层级,您将节省的个人时间将物超所值。

    【讨论】:

    • 好答案。这将比执行 100 万次 Lambda 函数便宜。
    猜你喜欢
    • 2019-07-14
    • 1970-01-01
    • 2020-05-18
    • 2019-06-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-01-23
    • 1970-01-01
    相关资源
    最近更新 更多