【问题标题】:Does Google's WaveNet support phonetic input (SSML phoneme elements)?Google 的 WaveNet 是否支持语音输入(SSML 音素元素)?
【发布时间】:2020-03-16 17:27:45
【问题描述】:

我正在使用一种产品,该产品使用语音输入使 TTS 为名称生成正确的发音。我在 Google 的 WaveNet TTS 文档 https://cloud.google.com/text-to-speech/docs/ssml 中没有看到音素标签,但也许我错过了它。

如果有任何 Google 开发人员正在倾听,他们能否分享添加语音输入的计划? 天呐

【问题讨论】:

标签: text-to-speech ssml


【解决方案1】:

由于它们基于“端到端”(文本 -> 网络 -> 声音)的神经网络,它们可能从未像(文本 -> 音素 -> 网络 -> 声音)那样进行音素步骤。

这是非常值得期待的,因为这个音素选择应该是神经网络的工作,消除不必要的阶段。

【讨论】:

  • 毫无疑问,但所有 TTS 系统都需要覆盖专用词汇表(专有名称、技术术语)。不管规则的质量如何,总会有需要。
猜你喜欢
  • 2013-04-08
  • 1970-01-01
  • 2019-09-21
  • 2018-08-02
  • 1970-01-01
  • 2012-03-13
  • 1970-01-01
  • 2011-05-20
  • 2017-10-09
相关资源
最近更新 更多