“说话人识别和分割”[关闭]

【问题标题】："Speaker Recognition and Segmentation" [closed]“说话人识别和分割”[关闭]
【发布时间】：2014-06-27 17:34:54
【问题描述】：

寻找可以将媒体文件处理为“谁在何时何地说了什么”的代码，换句话说，就是“按发言人分段的发言人”以及每个人的时间安排。失败的答案：做任何手动工作来处理媒体文件..谢谢！

【问题讨论】：

您没有指定您使用的语言。
Java...C++ 也可以...谢谢

标签： java c++ speech-recognition voice-recognition speaker

【解决方案1】：

您可以使用 Kaldi 的扬声器分类，设置起来并不容易，但效果很好。

还有许多其他库 - LIUM、bob 等。

【讨论】：

感谢 Nikolay...以您在本主题中的背景，LIUM 是否适合在手机应用中明确使用...？
不是 LIUM，但您可以在 C 中创建类似的实现。这很合适。

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
1970-01-01
2013-03-24
1970-01-01
1970-01-01
1970-01-01
2014-01-29

相关资源

下载 2023-02-15
下载 2022-12-20
下载 2023-01-09

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode