语音识别资料整理 - Vanessa_Feng

语音识别资料整理

语音识别

Information

cmu sphinx
Kaldi

DataSet

TensorFlow15: 中文语音识别 :包含数据集下载和训练代码
语音数据库集合及下载链接
 THCHS30 [TensorFlow15: 中文语音识别](http://blog.csdn.net/u014365862/article/details/53869701) :包含数据集下载和训练代码 [语音数据库集合及下载链接](http://www.zd.hk/thread-index-fid-5-tid-7856.htm) [THCHS30](http://data.cslt.org/thchs30/standalone.html)是Dong Wang, Xuewei Zhang, Zhiyong Zhang这几位大神发布的开放语音数据集，可用于开发中文语音识别系统。

# 下载中文语音数据集（5G+）：
$ wget http://data.cslt.org/thchs30/zip/wav.tgz  
$ wget http://data.cslt.org/thchs30/zip/doc.tgz  
$ wget http://data.cslt.org/thchs30/zip/lm.tgz  
# 解压  
$ tar xvf wav.tgz  
$ tar xvf doc.tgz  
$ tar xvf lm.tgz

CSLT数据
 清华大学cslt实验室分享中文语音识别: 数据集

data_thchs30.tgz [6.4G] ( speech data and transcripts )
test-noise.tgz [1.9G] ( standard 0db noisy test data )
resource.tgz [24M] ( supplementary resources, incl. lexicon for training data, noise samples )

PCM、WAV格式介绍及用C语言实现PCM转WAV

Theory

GMM-HMM语音识别模型原理
[GMM-HMM语音识别模型原理](http://blog.csdn.net/abcjennifer/article/details/27346787?utm_source=tuicool&utm_medium=referral) 博主思维清晰，发了很多不错的博客，可以关注一下
HMM中的viterbi算法 [HMM中的viterbi算法](http://www.cnblogs.com/chuanlong/archive/2013/05/07/3065045.html)

语音专题第四讲，语音识别之解码器技术简介 [语音专题第四讲，语音识别之解码器技术简介](http://www.leiphone.com/news/201610/BQLMnSiPoM8TvAfX.html)

知乎：语音识别的技术原理
关于原理的理解写的很透彻，再细看理解 [知乎：语音识别的技术原理](https://www.zhihu.com/question/20398418) 关于原理的理解写的很透彻，再**细看理解**

声学特征提取，如MFCC，其中假设声学特征是12维，这和Alex(train_vad_ffnn)里得到MFCC是26维一样的道理么，这个维度如何界定？

Examples

Kaldi在语音数据库timit上的声学和语音模型训练--1 [Kaldi在语音数据库timit上的声学和语音模型训练--1](http://blog.itpub.net/16582684/viewspace-1266649/)

kaldi终于有了免费的中文语音识别的例子 [kaldi终于有了免费的中文语音识别的例子](https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30)

语音识别kaldi--安装与yesno实例说明 [语音识别kaldi--安装与yesno实例说明](http://blog.sina.com.cn/s/blog_659acd6f0102v71w.html)

Kaldi运行timit语音库的部分结果与问题 [ Kaldi运行timit语音库的部分结果与问题](http://blog.csdn.net/cdj0311/article/details/18184231)

posted on 2017-08-30 11:00 Vanessa_Feng 阅读(1041) 评论(0) 编辑收藏举报

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode