目录
1. 同态分析
同态信号处理也称为同态滤波,其目的是将卷积关系变换为求和关系的分离处理。同态滤波是非线性滤波但服从广义叠加原理,即几种不同原因的综合所产生的效果等于这些不同原因单独产生效果的累加,叠加原理如图所示。
同态系统是指通过非线性变换将非线性组合变换为线性组合以便于处理的一类系统。同态系统分为乘积同态和卷积同态,语音中主要讨论卷积同态,其模型如下图所示。
任何一个同态系统都可以表示为三个同态系统的级联,如下图所示:
对于卷积同态系统来说,三个系统功能分别为:
-
特征系统,通过卷积合并输入,并将其转换为累加输出
-
线性系统,是常规的线性系统,服从叠加原理
-
逆特征系统,是第一个系统的逆变换,将信号的加性组合转换为卷积输出
计算过程为:
对语音信号进行同态滤波处理可以分离声门激励信息和声道响应信息,从而求得声道共振特征和基音周期。
2. 复倒谱与倒谱分析
经过特征系统的输出是一个时域序列,称为复倒频谱,简称复倒谱。特征系统将离散时域中的卷积运算转为复倒谱域中的加性运算。将同态系统中的特征系统写成如下形式:
逆特征系统为:
将公式(3)写成幅度相位后取对数的形式,可以发现复数的对数也分为实部和虚部。
将公式(3)(4)写成如下形式:
这里c(n)是序列x(n)对数幅度谱的傅里叶逆变换,此时c(n)并不是在时域而是进入了倒谱域。与复倒谱不同,倒谱域中的一个序列经过正逆特征系统不能还原成自身,因为其丢失了相位信息。将复倒谱和倒谱写成积分的形式有:
可以发现它们之间的关系为:
3. 同态声码器
同态声码器如上图所示,其流程如下:
-
每10-20ms计算倒谱
-
估计基因周期,进行VAD
-
量化编码倒谱值
-
在合成器端近似计算激励值
-
将第4步计算的结果与基因周期,VAD和振幅信息得到的激励进行卷积得到合成语音
参考文献:
[1]. 同态解卷, https://zhuanlan.zhihu.com/p/94324470
[2]. 语音信号倒谱分析,https://tieba.baidu.com/p/2811564662?red_tag=1886867543
[3]. 胡航, 语音信号处理
[4]. UCBS, Digital Speech Process
语音信号处理交流群: 652292630