语音复习资料整理

• 语言处理中的知识
• 语音学与音系学—研究语言的语音
• 形态学—研究词的有意义的组合
• 句法学—研究词与词之间的结构关系
• 语义学—研究意义
• 语用学—研究如何用语言来达成一定的目的

• 话语学—研究大于段的语言单位

• 语音链：发音-传递-感知三阶段

• 语音产生过程：动力源-发音体-共鸣器
• 动力源
○ 发音的原动力是呼吸时所产生的的呼出的气流，人的呼吸器官就是发音的动力源
○ 发音体：喉是人类专职的发音器官
§ 声带振动原理：伯努利效应
○ 共鸣器

口腔：舌头的重要作用

• 语音产生原理：
• 声门振动的快慢，决定声音的基本频率（即音高）。
• 口腔、鼻腔、舌头的位置、嘴型等，决定声音的內容（即音色）。
• 肺部压缩空气的力量大小，决定音量大小
• 清音和浊音
○ 语音复习资料整理
• 数字模型
○
• 人声的发音与接收流程
○ 1、声门的快速打开与关闭
○ 2、声道、口腔、鼻腔的共振
○ 3、空气的波动
○ 4、接收者耳膜的振动
○ 5、內耳神经的接收
○ 6、大脑的辨识

• 语音产生模型
• 语音产生模型：激励模型
○ 浊音信号产生的激励模型
§ 语音复习资料整理

§
○ 清音
§ 声带处于松弛状态，不发生振动。气流直接进入声道，清音激励信号相当于一个随机白噪声。实际上用均值0表示，方差为1，并在时间或幅值上用白色分布的序列来表示。
• 语音产生模型：声道模型
○ 声道的两种状态
§ （1）发元音时，声道中的口腔为稳定的某种形状谐振腔。由声门带来的准周期脉冲激励声道而产生响应。
§ （2）发辅音时，由声门带来的激励在声道某处形成湍流。
○ 声道的两种模型
§ （1）声管模型
□ 将声道视作是由多个不同截面积的声管串联而成的系统。
□ 语音复习资料整理
§ （2）共振峰模型
□ 将声道视作谐振腔，腔体的谐振频率为共振峰。
□
○ 语音的表示
§ （1）元音用前3个共振峰
§ （2）辅音用前5个以上共振峰

• 语音识别
• 语音识别的性能评价
○ 语音复习资料整理
• 语音识别的层次模型
○

○
• 特征提取：MFCC的步骤
• 特征参数
○ 静态参数:mfc

○ 动态参数
§
• 倒谱均值归一化
○ CMN
○ 消除信道带来的影响

• 能量特征
• 计算公式
○ 语音复习资料整理

○
• 特点
○ 1、一般而言，有浊音的音量大于清音的音量，而清音的音量又大于噪音的音量。
○ 2、是一个相对性的指标，受到麦克风设定的影响很大。
○ 3、通常用在端点检测，检测浊音的声母或韵母的开始及结束位置。
○ 4、在计算前最好先減去语音信号的平均值，以避免语音的直流偏移（DC Bias）所导致的误差。
• 主观音量除了和频率有关外，和语音的内容（音色）也有关系