【发布时间】:2018-01-23 03:32:35
【问题描述】:
我有一个说话者验证的任务。
我的任务是计算两个音频语音之间的相似度,然后与一个阈值进行比较。 例如:两个音频之间的相似度得分为 70%,阈值为 50%。因此,说话者是同一个人。
演讲是文本无关,可以是任何对话。
我有使用 MFCC、GMM 进行说话人识别任务的实验,但是这个任务是不同的,只需比较两个音频特征以获得相似度得分。我不知道哪个特征对说话人验证有好处,哪个算法可以帮助我计算 2 个模式之间的相似度分数。
希望大家多多指教
非常感谢。
【问题讨论】:
标签: audio similarity verification speech speaker