【问题标题】:Need text to speech and speech recognition tools for Linux需要适用于 Linux 的文本到语音和语音识别工具
【发布时间】:2009-05-18 12:33:00
【问题描述】:

我正计划为 Linux 编写一个使用文本到语音和语音识别的程序。什么是最好的工具/库?我应该使用 Windows 来使用更好的工具吗?这些工具需要能够从控制台或 C 程序中轻松调用。

【问题讨论】:

    标签: linux speech-recognition text-to-speech


    【解决方案1】:

    对于语音识别,有各种Sphinxes。不同的变种有不同的优缺点,这里有一个比较Comparison of Sphinx versions。我相信,Sphinx 4 是 Java,但其他的是 C。

    【讨论】:

      【解决方案2】:

      这在很大程度上取决于您要识别的语音。

      这是 2005 年的一篇文章,解释了创建听写程序的一些困难:http://www.cs.cmu.edu/~archan/personal/whyNoOpenSourceDictationDraft4.html。如果您愿意,Julius 语音识别引擎似乎很有前途,但您需要添加自己的声学和语言模型。您或许可以使用voxforge 声学模型。

      如果您不尝试编写听写程序,那么您的任务会容易得多。命令程序的词汇量有限,例如“如果您想继续使用英语,请说“英语”。

      我能够使用 pocketsphinx 和 gstreamer 制作 a program 获得相当不错的结果,它会自动编辑出现在 TWiT 播客中的大多数单词“twitter”。直到我根据播客的成绩单使用我自己的语言模型之前,它根本不起作用;来自语音识别器的机器转录无用/搞笑,但它们在查找关键字方面做得很好。

      【讨论】:

      • 您有使用 tcpserversrc/client 的 pocketsphinx 和 gstreamer 的经验吗?
      • 不,但 gstpocketsphinx + tcpserversrc/sink 应该与任何其他 gstreamer 元素 + tcpserversrc/sink 没有任何不同。
      • 您的“twitterkiller”程序的链接似乎已损坏。
      【解决方案3】:

      对于语音识别,Linux 几乎没有。我只知道一个明显不错的选择,IBM 几年前发布但后来不再可用(有人知道这个 ViaVoice SDK 是否仍然可以从任何地方获取?)。 wikipedia 有更多关于可能选项的信息。

      【讨论】:

      • 通过语音 SDK。它从未完全发布过,文档要求 2.4 内核版本号的范围相当窄。当我手腕出现间歇性肌腱炎时,我玩弄它以减轻打字负担,但没有运气......
      【解决方案4】:

      我在linux下使用过LoquendoFestival。我认为我使用的音乐节声音很差,合成非常机器人。另一方面,Loquendo 的声音非常出色——质量非常高。

      【讨论】:

      • 如果你要使用Festival,你应该安装alternate voices。说明(针对 debian/ubuntu)在这里:ubuntuforums.org/showthread.php?t=677277
      • 您对 Loquendo 的体验如何?如果您愿意,我很想通过电子邮件向您提出几个问题?
      【解决方案5】:

      对于 Debian/Ubuntu 文本转语音,还有 SVOX Pico:

      sudo apt-get install libttspico-utils
      

      【讨论】:

        【解决方案6】:

        我知道espeak 是一个非常好的用于 linux 的文本到语音转换程序(它甚至可以做不同的口音!),但我不知道有任何为 UNIX 设计的语音识别系统。

        【讨论】:

          【解决方案7】:

          at&t fsm 工具包也非常棒 - 但不允许用于商业用途,

          http://www.research.att.com/~fsmtools/fsm/

          【讨论】:

            【解决方案8】:

            这有点老了,但我前几天在 Hackaday 上看到了一个相当全面的语音识别指南: http://hackaday.com/2010/07/09/get-started-with-speech-recognition/

            【讨论】:

              【解决方案9】:

              http://simon-listens.org/ - simon 开源语音/语音识别程序

              【讨论】:

                【解决方案10】:

                还有用于文本到语音的 mbrola。

                【讨论】:

                  【解决方案11】:

                  您是否检查了基于 HMM 的语音合成的文本转语音。您可以在网站http://hts.sp.nitech.ac.jp/ 上找到免费演示。安装会有点繁琐。

                  【讨论】:

                    【解决方案12】:

                    我知道,最初的问题是关于寻找合适的库,但就使用足够好的语音识别来进行真正的听写而言,Linux 似乎没有任何东西(尽管我确信它会及时改变,我怀疑这需要一段时间,因为我不确定有多少人感兴趣)。

                    目前,我正在尝试将 Dragon NaturallySpeaking 推广为 CodeWeavers 支持的产品...因此,如果您作为用户感兴趣,如果您投票会有所帮助...

                    http://www.codeweavers.com/compatibility/browse/name/?app_id=8427

                    【讨论】:

                      猜你喜欢
                      • 1970-01-01
                      • 2023-03-03
                      • 1970-01-01
                      • 2016-12-04
                      • 1970-01-01
                      • 1970-01-01
                      • 1970-01-01
                      • 2021-09-07
                      • 1970-01-01
                      相关资源
                      最近更新 更多