【问题标题】:High-Quality Text-To-Speech engine for personal use [closed]供个人使用的高质量文本转语音引擎[关闭]
【发布时间】:2011-06-06 10:35:04
【问题描述】:

我正在寻找我能负担得起的高质量 TTS 引擎(假设价格低于 1000 美元)。到目前为止,我已经尝试过使用默认声音的flitefestival。然而,虽然结果肯定是可以理解的,但技术文本很难理解。

来自 LoquendoReadspeaker sound way better 的商业 TTS 解决方案。然而,这些公司似乎不愿意将他们的产品卖给凡人——我在他们的主页上都找不到价格。

那么,有哪些适合个人使用的 TTS 解决方案?

【问题讨论】:

标签: text-to-speech festival flite


【解决方案1】:

NextUp.com网站购买:

NextUp.com 销售最好的、最自然的文本到语音,支持 20 多种语言和多种口音。

还有:

【讨论】:

  • 我从 NextUp.com 购买了 Natural Voices。感谢您提供广泛的清单!一旦我设法找到/编写一个围绕它的 API,我会在这里发表另一条评论,并且可能会从这个列表中尝试更多的声音。
  • 好吧,只要您在 Windows 上,您就可以随时通过 SAPI 控制语音生成。顺便说一句,经过一些测试,IVONA 的示例在我的机器上听起来比 AT&T 更好。我将对其进行测试并在此处重新发布;)
  • 自 2011 年以来,IVONA 显然 (eon.businesswire.com/news/eon/20110519006454/en/text-to-speech/…) 在竞争中胜出,许多个人评价似乎都支持这一点。在 2011 年,我是 Acapela 声音的忠实粉丝,但 IVONA 的声音似乎确实消除了“起泡”效果。
  • 这里是 Cereproc 的员工。我们大多数声音的个人许可证是 25.99 英镑而不是 400 美元(即商业许可证)。或者,您可以使用我们的云服务器
  • @phihag 许可证允许您修改和分发生成的音频。我请网络管理员在网站上使条款更清晰。
【解决方案2】:

Ivona 一直给我留下深刻印象http://www.ivona.com/?set_lang=en 他们有一个便宜的个人版本,叫做 expressivo(添加 .com - 不能发布更多链接),只要 45 美元。我认识一些看电影的人用Expressivo看字幕,所以实际上非常非常好。

【讨论】:

  • 确实,质量非常好,甚至可能比 AT&T Natural Voices 好一点。值得注意的是,他们也会进行这种疯狂的价格隐藏,但如果有人对商业用途感兴趣的话。
【解决方案3】:

您可以为音乐节下载质量比随附的更好的声音:

这些似乎是目前质量最高的:
HMM-based Speech Synthesis System (HTS)

这些似乎也可以:
The MBROLA Project

来源: HOWTO: Make festival TTS use better voices (MBROLA / CMU / HTS)

【讨论】:

  • 欢迎来到 Stack Overflow!虽然该页面实际上可能回答了这个问题,it would be preferable 在此处包含答案的基本部分,并提供链接以供参考。 Stack Overflow 仅与它的问题和答案一样有用,如果该主机出现故障或它们的 URL 被移动,这个答案将变得毫无用处。谢谢!
【解决方案4】:

AT&T 有一款名为 Natural Voices 的产品。与所有其他产品相比,我认为这听起来很棒。不过我不确定定价。

http://www2.research.att.com/~ttsweb/tts/demo.php

【讨论】:

【解决方案5】:

还有一些令人印象深刻的开源解决方案。

这听起来令人印象深刻。 http://freetts.sourceforge.net/docs/index.php

【讨论】:

  • 这听起来是关于节日的水平,可能会差一点,但比flite好。但是,如果您将样品与问题中链接的商业样品进行比较,就会发现质量上存在巨大的差异。
  • 会说话的时钟是唯一听起来不错的时钟。其余的不太好。我喜欢 MacOSX 内置的 TTS 引擎,很不错。
【解决方案6】:

请查看this site

基本上,这是在 Linux 上使用 Android 提供的语音的高级教程。 这很笼统,但该技术应该适用于大多数 TTS 引擎。

【讨论】:

    【解决方案7】:

    我在 2007 年对该主题进行了一些研究,并尝试了几种文本到语音系统来阅读文章或将它们转换为 mp3。从那时起,消费者 TTS 产品取得的进展如此之小令我感到惊讶。

    首先我购买了 NextUp 的 TextAloud,因为在网络样本中,声音听起来很自然。然而,事实证明,部分句子被强调的方式使得理解科学文本变得非常困难。我不知道这是否有所改善。

    然后我找到了 Linguatec 的 VoiceReader Home(每个声音 49 欧元),它做得非常好,从那时起我就没有找到更好的解决方案。 Linguatec 刚刚做了一个更新,我已经使用了几个星期了,质量提高了很多。

    但是,我不太喜欢他们的 GUI 和集成。我基本上将所有想要阅读的文本复制到 GUI 窗口中。然而,新版本还可以从文件中读取 pdf 和 word 文档。对我来说,最重要的因素仍然是易于聆听和理解文本,即使结构复杂。

    Linguatec 看起来像一家小型德国公司。我不知道他们是有自己的 TTS 引擎还是使用外部引擎。

    我与 Linguatec 没有任何关系,并且对其他建议非常感兴趣!

    【讨论】:

      【解决方案8】:

      令人惊讶的是,loquendo 确实卖东西:Price list 即用即付 TTS。不幸的是,这在在线时可以在线工作,并且需要花费一大笔钱来生成按需语音(每天 30 分钟将低于每年 120.000 欧元)。

      【讨论】:

        【解决方案9】:

        Nuance vocalizer 但恐怕他们不会说价格。 Nuance 有很多高质量的语音应用程序,所以也许它们能让你开心。

        【讨论】:

          【解决方案10】:

          我用过AT&T Natural Voices,它们对我来说听起来最人性化。

          【讨论】:

            【解决方案11】:

            供个人使用,我正在使用 VocaTalk Personal Podcast。该应用程序增强了语音,使其成为立体声,播放 bg 音乐,生成 mp3,上传到 skydrive/google 驱动器,与 iTunes 或 zune 同步等等。非常适合在旅途中聆听。 http://www.vocamedia.com/

            【讨论】:

              【解决方案12】:

              对于个人用途,您还可以使用 ReadSpeaker 中的“TextAid”。它是基于网络的个人阅读器,使用 Acapela 语音。它还有翻译功能! http://www.readspeaker.com/readspeaker-textaid/

              【讨论】:

                【解决方案13】:

                在线生成语音怎么样?您可以使用免费网站audiotext.ws text to speech 将英文文本转换为语音。

                【讨论】:

                • 目前,我这边没有任何音频,即使一分钟后它仍在加载。这突出了问题:如果网络或服务出现任何问题,应用程序就会失败。此外,您可能希望在不联系网络的情况下发出音频 - 例如,您的应用程序将如何通知用户存在网络问题?
                【解决方案14】:

                如果您正在寻找基于印度口音的输出,请查看 http://www.indiantts.com

                这听起来像是最人性化的印度方言。他们提供我认为从文本中下载 mp3 的选项。

                【讨论】:

                  猜你喜欢
                  • 2012-10-14
                  • 1970-01-01
                  • 2011-09-18
                  • 2010-09-13
                  • 2013-04-06
                  • 2017-09-20
                  • 1970-01-01
                  • 1970-01-01
                  相关资源
                  最近更新 更多