下面是一个简单的人工智能对话的程序,做起来很简单基于俩个工具就可以完成了.

百度AI开放平台:  ai.baidu.com    里面有很多实现人工智能的模型可以免费使用

图灵机器人: www.turingapi.com  定制一个属于自己的专属智能机器人

 

在进行语音识别的时候,要求传入音频的格式是pcm,我们电脑的录音机的格式不是人家要求的需要对格式进行转码,在这之前需要下载安装插件  http://ffmpeg.org/download.html

这样就可以玩了.

首先我们需要去录音机录制一段语音.稍后要进行使用.

下面是具体代码,语音合成和识别的代码其实特别简单,按照百度文档里的内容复制粘贴就行

 

from aip import AipSpeech
from to_tolin import to_tolin
import os
"""读取音频文件,语音转化成字符串传给图灵"""

""" 你的 APPID AK SK """
APP_ID = '15838233'
API_KEY = 'Xy8d3wRbsjfmpGsPryvNexcL'
SECRET_KEY = 'PmpwVdVj0mHU1BTeAhyXZNlBi8CrPOP2'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 读取文件
def get_file_content(filePath):
    new = filePath.split(".")[0]
    os.system(f"ffmpeg -y  -i {filePath}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {new}.pcm")
    with open(f"{new}.pcm", 'rb') as fp:
        return fp.read()

# 识别本地文件
ret = client.asr(get_file_content('auido.mp3'), 'pcm', 16000, {
    'dev_pid': 1536,
})
ret_new = ret.get("result")[0]
to_tolin(ret_new)
语音识别的代码

相关文章: