基于统计模型及SVM的低速率语音编码QIM隐写检测

一、基本思想

提取特征：
1.音素P(音标)进行LPC分析，得到LPC预测系数。
2.矢量量化，获得量化矢量索引Ｉ。“P—>Ｉ”：每个P有一个Ｉ对应，Ｉ为Ｐ的量化特征索引。
基于统计模型及SVM的低速率语音编码QIM隐写检测
语音中的音素分布特性：一段语音中的各音素的出现是不均衡的，其次不同音素的出现存在相关性。
设某段语音对应的音素序列为Ｓ＝Ｐ1…Ｐn-1Ｐn ，根据P—>Ｉ，与之对应的量化特征索引序列：Ｓ*＝Ｉ1…Ｉn-1Ｉn。
[8]信息隐藏方法是在获得LPC系数的量化索引Ｉ时进行QIM隐写的.进行QIM隐写势必使序列Ｓ*发生的某些量化索引值发生变化，例如对于音素Ｐk，设其原量化索引为Ｉm，进行QIM隐写后可能变为Ｉm+1，Ｓ*中索引的改变将导致Ｓ中音素Ｐk相应的改变，如变为Ｐk+1,音素的改变将使Ｓ中的音素分布特性发生变化.因此，如能够有效量化Ｓ中音素的分布特性，则通过比较QIM隐写前后该特征的变化即可实现隐写检测．

二、音素分布特性的量化统计模型

语言Ｌ的任意一段语音都可由下文方法获得其对应的音素序列.
1.音素Ｐ用三元组(p,s,t)表示，其中p为音标,s为音标p的发音是具有一定时长的语音小片段，t为s的时长.音素Ｐ为语音的基本组成单位.
2.语言L，包含有限音素，Ｂ＝｛Ｐ1,Ｐ2,…,Ｐn-1,Ｐn｝。
3.语言Ｌ的一段语音片段Ｓ可以根据Ｂ中的音素分解为多个按时序排列的语音分片Ｓ=ｆ1ｆ2...ｆm-1ｆm。分片ｆk实质上是音素Ｐt的发音，即ｆk=ｓt。
4.语音片段Ｓ表示为音素序列：Ｓ＝ＰkＰl...ＰxＰy（k,l,x,y∈[1,n]）

若音素P为单词，语音片段S为文档。用文档量化表示模型：文档向量空间模型，使用PSVM音素向量空间模型作为音素序列的量化表示模型。
基于统计模型及SVM的低速率语音编码QIM隐写检测

音素向量空间量化表示模型定义：
定义1：虚拟语言Ｌ的音素集合Ｂ=｛Ｐ1,…,Ｐn｝,称Ｐi∈Ｂ为音素词汇，称Ｂ为语言Ｌ的音素词典，属于虚拟语言Ｌ的语音片段所包含的音素都在Ｂ中．
定义2：虚拟语言Ｌ的一段语音Ｓ，通过查找音素词典，可切分为按时序排列的Ｎ个音素，称上述过程为基于音素的语音分帧。
定义3：设语音片段Ｓ分帧后所得的音素序列为Ｓ=Ｐk …Ｐx ；根据音素词典Ｂ＝｛Ｐ1 ,...,Ｐn｝可构造n 维向量Ｖ=｛Ｗ1,…,Ｗn｝对音素序列Ｓ进行量化表示，称Ｗi为音素词汇ＰiＰｌＰｙ的权重（它是与Ｐｉ在音素序列Ｓ中的分布相关的变量，其取值依据预先设定的计算规则求取），称向量Ｖ对应的ｎ维空间为音素向量空间，音素序列Ｓ可用该空间中的一个点表示；称上述定义构成的语音片段量化表示方法为音素向量空间量化表示模型.