• 语音学与音系学—研究语言的语音
• 形态学—研究词的有意义的组合
• 句法学—研究词与词之间的结构关系
• 语义学—研究意义
• 语用学—研究如何用语言来达成一定的目的
• 话语学—研究大于段的语言单位
• 语音链:发音-传递-感知三阶段
• 语音产生过程:动力源-发音体-共鸣器• 动力源
○ 发音的原动力是呼吸时所产生的的呼出的气流,人的呼吸器官就是发音的动力源
○ 发音体:喉是人类专职的发音器官
§ 声带振动原理:伯努利效应
○ 共鸣器
口腔:舌头的重要作用
• 语音产生原理:
• 声门振动的快慢,决定声音的基本频率(即音高)。
• 口腔、鼻腔、舌头的位置、嘴型等,决定声音的內容(即音色)。
• 肺部压缩空气的力量大小,决定音量大小
• 清音和浊音
○
• 数字模型
○
• 人声的发音与接收流程
○ 1、声门的快速打开与关闭
○ 2、声道、口腔、鼻腔的共振
○ 3、空气的波动
○ 4、接收者耳膜的振动
○ 5、內耳神经的接收
○ 6、大脑的辨识
• 语音产生模型
• 语音产生模型:激励模型
○ 浊音信号产生的激励模型
§
§
○ 清音
§ 声带处于松弛状态,不发生振动。气流直接进入声道,清音激励信号相当于一个随机白噪声。实际上用均值0表示,方差为1,并在时间或幅值上用白色分布的序列来表示。
• 语音产生模型:声道模型
○ 声道的两种状态
§ (1)发元音时,声道中的口腔为稳定的某种形状谐振腔。由声门带来的准周期脉冲激励声道而产生响应。
§ (2)发辅音时,由声门带来的激励在声道某处形成湍流。
○ 声道的两种模型
§ (1)声管模型
□ 将声道视作是由多个不同截面积的声管串联而成的系统。
□
§ (2)共振峰模型
□ 将声道视作谐振腔,腔体的谐振频率为共振峰。
□
○ 语音的表示
§ (1)元音用前3个共振峰
§ (2)辅音用前5个以上共振峰
• 语音识别
• 语音识别的性能评价
○
• 语音识别的层次模型
○
○
• 特征提取:MFCC的步骤
• 特征参数
○ 静态参数:mfc
○ 动态参数
§
• 倒谱均值归一化
○ CMN
○ 消除信道带来的影响
• 能量特征
• 计算公式
○
○
• 特点
○ 1、一般而言,有浊音的音量大于清音的音量,而清音的音量又大于噪音的音量。
○ 2、是一个相对性的指标,受到麦克风设定的影响很大。
○ 3、通常用在端点检测,检测浊音的声母或韵母的开始及结束位置。
○ 4、在计算前最好先減去语音信号的平均值,以避免语音的直流偏移(DC Bias)所导致的误差。
• 主观音量除了和频率有关外,和语音的内容(音色)也有关系