【问题标题】:How to create custom text-to-speech engine如何创建自定义文本转语音引擎
【发布时间】:2011-11-05 14:59:36
【问题描述】:

据我所知,TTS 需要 TTS 引擎说一种语言。在 Android 模拟器 2.2 中,Pico TTS 引擎是默认的。它只有一些流行的语言。我可以在市场上看到一些必须购买才能安装的引擎。我的问题:有没有办法创建支持其他语言的自定义引擎?(通过编程或使用软件)

(不知道该把这个问题发到StackOverflow还是SuperUser,如果发错地方,请迁移)

【问题讨论】:

  • 请指定您希望为哪种语言启用 TTS 功能。您是否需要有限的词汇(例如,仅数字 0 到 9 的 TTS 功能)或任意文本输入?
  • 如果可能的话,任何语言,我的意思是我想通过编码创建一个新的 TTS 引擎。

标签: android text-to-speech


【解决方案1】:

我也有兴趣制作我的 tts 引擎。以下是我找到的一些信息。在this link 上,您可以找到一个简短的描述,以使您的 tts 引擎适用于 android。从 API 级别 14 开始,存在用于 tts 引擎实现的抽象类。更多关于link

但是从文本到语音的转换并不是那么容易。 tts引擎应该实现的一些基本信息可以在wikipedia上找到。

【讨论】:

    【解决方案2】:

    就我的研究而言,目前制作 TTS 引擎的最佳架构是 Tacotron 2[Paper here],这是一种用于 直接从文本合成语音(可以通过OCR 轻松捕获)。它的MOS(mean opinion score) 为 4.53,与专业录制的语音的 MOS 为 4.58 相当。 Tacotron 2 的官方实现不是公开的,但有一个使用 tensorflow 1.15.0 here 的 tensorflow 实现。 nvidia here 也有一个 pytorch 实现,目前维护得更多。两种实现都可以使用新语言(尚未实现 TTS 的语言)的数据集进行重新训练,以便轻松实现 TTS 引擎。您还可以使用上述架构作为垫脚石来构建您自己的架构。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-09-20
      • 1970-01-01
      • 2021-07-01
      • 2011-08-11
      • 1970-01-01
      • 2014-05-21
      • 2011-05-01
      • 1970-01-01
      相关资源
      最近更新 更多