语音识别哪家强讯飞搜狗百度阿里还是腾讯

识别结果对比： http://download.csdn.net/download/elesos/10138377

百度

http://yuyin.baidu.com/asr

REST API

http://yuyin.baidu.com/docs/asr/54

格式：推荐pcm

推荐16K

编码：16bit 位深的单声道

最长支持60s的录音文件

转码： http://yuyin.baidu.com/docs/asr/58

调用流程

http://yuyin.baidu.com/docs/asr/55

http://ai.baidu.com/docs#/Auth/top  有AipSpeech.php的使用方法

概念：

asr:语音识别

tts:语音合成

如果不使用raw方式，而是使用json方式：

(speech, len) 及 (url, callback) 这两组参数必须二选一

异步的返回值

{"err_msg":"success. ","err_no":0,"sn":"396863495271511838506"}

异步的结果会返回到一个回调地址里，需要将数据存储才能看到

这个很慢，且不稳定

搜狗的

http://openspeech.sogou.com/Sogou/php/index.php

SDK适用于Android和iOS平台

http://www.xfyun.cn/services/lfasr

讯飞的，可以在线测试

http://www.iflyrec.com/

腾讯 的

https://cloud.tencent.com/product/asr

还在申请中

阿里的

https://help.aliyun.com/document_detail/30416.html

提供如下三种服务：

「 一句话识别 」对一分钟内的短语音实时识别，适用于对话聊天，控制口令等较短的语音识别场景。

「 实时语音识别 」：对长时间的语音数据流实时识别，适用于会议演讲、视频直播等长时间不间断识别的场景。

「 录音文件识别 」：对录音文件中的语音做识别，需要存放到oss上，并设置数据为私有， 非实时

oss为私有的情况下oss地址还要包含Signature，Expires，OSSAccessKeyId三个参数

阿里云大数据平台，简称数加

采样率要求是8或16K

阿里内部进行了切分，返回的结果也是分段的，后面一段重复识别了前面一段的后15ms

总结：

百度的要求格式是16K,单声道的pcm,而且时长不超过60s， 免费，但是有50000次/日 的在线识别调用配额，可以申请提高配额。

测试demo(支持各种格式音频输入，内部会进行转换):有需要的私信

搜狗的目前 只有Android和iOS平台适用，未测试

讯飞的，可以在线测试

http://www.iflyrec.com/

每小时9.9元

腾讯 的

https://cloud.tencent.com/product/asr

还在申请中

阿里的

https://help.aliyun.com/document_detail/30416.html

提供如下三种服务：

「 一句话识别 」对一分钟内的短语音实时识别，适用于对话聊天，控制口令等较短的语音识别场景。

「 实时语音识别 」：对长时间的语音数据流实时识别，适用于会议演讲、视频直播等长时间不间断识别的场景。

「 录音文件识别 」：对录音文件中的语音做识别，需要存放到oss上，并设置数据为私有， 非实时

测试demo地址:有需要的私信