【问题标题】:Sphinx4 Phoneme SegmentationSphinx4 音素分割
【发布时间】:2012-10-22 17:22:14
【问题描述】:

我正在开发一个系统,我需要一个单词或句子中每个音素的起始帧结束帧分割分数。我一直在使用 Sphinx-3 命令:sphinx3_align,得到以下结果(示例):

     SFrm  EFrm   SegAScr Phone
        0    21    -67327 SIL
       22    37   -236740 AH SIL K b
       38    41    -61028 K AH S i
       42    56    -82368 S K EH i
       57    67   -106366 EH S P i
       68    86   -101908 P EH T i
       87   106    -89226 T P SIL e
      107   113    -82281 SIL
 Total score:     -827244

问题是,我必须多次运行此命令,这会占用我服务器中的大量内存。我尝试在控制文件中传递许多输入,但这需要很长时间来处理,而且我的应用程序不能有很长的响应时间。

因此,为了在保持响应时间的同时消耗更少的内存,我尝试在 Sphinx-4 中实现相同的系统。这样我就可以在对齐后立即返回结果,而不必在每次运行时卸载应用程序。

我怀疑是否可以在 Sphinx-4 中显示上述输出(类似于 sphinx3_align)?

【问题讨论】:

    标签: speech-recognition voice-recognition cmusphinx sphinx4


    【解决方案1】:

    在当前状态下这是不可能的。此功能未实现。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-09-16
      • 1970-01-01
      • 2014-12-19
      • 2015-02-02
      • 1970-01-01
      相关资源
      最近更新 更多