【问题标题】:APIs for converting Voice/Audio data in to text用于将语音/音频数据转换为文本的 API
【发布时间】:2009-11-05 16:54:27
【问题描述】:

我正在开发一个 iphone 应用程序,我将用户的声音存储为音频文件并希望以文本形式显示。

它会怎样......关于 API 的任何想法??

谢谢, 亚利安

【问题讨论】:

标签: iphone


【解决方案1】:

你见过CMU Sphinx吗?

特别是pocket sphinx (written in C)

虽然更注重识别,it's been used for transcription before,所以这取决于你到底需要什么:

此外,您是否考虑过非本地/本地 API,即您可以使用语音数据调用的 Web 服务,或者您是否坚持使用本地库/API?

例如Ribbit has a platform for these sorts of things,确实支持语音转文字

“如何启用语音到文本的转录? 作为付费服务,语音到文本的转录可通过 Ribbit API 自动获得。请使用 25 美元的免费注册积分来试用该服务。”

【讨论】:

  • Ribbit 还没有开始这项服务,将从 12 月中旬开始提供 API 服务。
【解决方案2】:

已经有一款应用可以做到这一点:Jott。他们这样做的方式是将文件发送给印度的转录员! (source)

【讨论】:

    【解决方案3】:

    恐怕您必须自己开发语音识别引擎。据我所知,没有任何图书馆可以做到这一点。除此之外,iPhone CPU 可能还不够强大。

    【讨论】:

    • 会起作用..例如“Dragon Dictation”...音频到文本..工作正常:)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-09
    • 1970-01-01
    • 2020-05-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多