哪个功能，算法适用于说话人验证答案

【问题标题】：Which feature, algorithm is good for Speaker Verification哪个功能，算法适用于说话人验证
【发布时间】：2018-01-23 03:32:35
【问题描述】：

我有一个说话者验证的任务。

我的任务是计算两个音频语音之间的相似度，然后与一个阈值进行比较。例如：两个音频之间的相似度得分为 70%，阈值为 50%。因此，说话者是同一个人。

演讲是文本无关，可以是任何对话。

我有使用 MFCC、GMM 进行说话人识别任务的实验，但是这个任务是不同的，只需比较两个音频特征以获得相似度得分。我不知道哪个特征对说话人验证有好处，哪个算法可以帮助我计算 2 个模式之间的相似度分数。

希望大家多多指教

非常感谢。

【问题讨论】：

【解决方案1】：

目前最先进的是 xvectors：

在 Kaldi 中的实现是 here。

【讨论】：

【解决方案2】：

我还在研究用于说话人验证的 TIMIT 数据集。我已经提取了 mfcc 特征并为此训练了一个 UBM，并针对每个扬声器进行了调整。在适应方面，我使用了对角矩阵。你是如何测试wav文件的？但是，当涉及到功能时，您可以使用音高和能量。

【讨论】：