语音识别是深度学习早先攻克的几个领域之一。传统的基于HMM等的语音识别精度一直比较受限。但是深度学习还是给语音识别的精度带来了一个飞跃性的提高。本文在网上找了段代码实现了下,感觉非常简单就可以复现。


不过看了过程,也非常简单,主要有几步:


(1) 下载VCTK数据集;

(2) 对数据集,提取每个WAV文件的MFCC特征以及对应的语音文本标注语料。

(3) 设置CTC的损失目标函数。

(4) 进行训练。


这样训练完保存模型,则可以开始进行训练。


训练效果如图所示:

基于Tensorflow的VCTK语音识别例子测试

相关文章:

  • 2021-11-30
  • 2021-12-10
  • 2021-10-01
  • 2021-12-07
  • 2022-01-02
  • 2021-12-19
  • 2021-12-10
猜你喜欢
  • 2021-11-10
  • 2021-11-29
  • 2021-09-05
  • 2021-09-17
  • 2021-11-06
  • 2021-09-20
  • 2021-10-19
  • 2021-12-16
相关资源
相似解决方案