【问题标题】:"Speaker Recognition and Segmentation" [closed]“说话人识别和分割”[关闭]
【发布时间】:2014-06-27 17:34:54
【问题描述】:

寻找可以将媒体文件处理为“谁在何时何地说了什么”的代码,换句话说,就是“按发言人分段的发言人”以及每个人的时间安排。失败的答案:做任何手动工作来处理媒体文件..谢谢!

【问题讨论】:

  • 您没有指定您使用的语言。
  • Java...C++ 也可以...谢谢

标签: java c++ speech-recognition voice-recognition speaker


【解决方案1】:

您可以使用 Kaldi 的扬声器分类,设置起来并不容易,但效果很好。

还有许多其他库 - LIUM、bob 等。

【讨论】:

  • 感谢 Nikolay...以您在本主题中的背景,LIUM 是否适合在手机应用中明确使用...?
  • 不是 LIUM,但您可以在 C 中创建类似的实现。这很合适。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-03-24
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-01-29
相关资源
最近更新 更多