一、基本思想
提取特征:
1.音素P(音标)进行LPC分析,得到LPC预测系数。
2.矢量量化,获得量化矢量索引I。“P—>I”:每个P有一个I对应,I为P的量化特征索引。
语音中的音素分布特性:一段语音中的各音素的出现是不均衡的,其次不同音素的出现存在相关性。
设某段语音对应的音素序列为S=P1…Pn-1Pn ,根据P—>I,与之对应的量化特征索引序列:S*=I1…In-1In。
[8]信息隐藏方法是在获得LPC系数的量化索引I 时进行QIM隐写的.进行QIM隐写势必使序列S*发生的某些量化索引值发生变化,例如对于音素 Pk,设其原量化索引为Im,进行QIM隐写后可能变为Im+1,S*中索引的改变将导致S中音素Pk相应的改变,如变为Pk+1,音素的改变将使S中的音素分布特性发生变化.因此,如能够有效量化S中音素的分布特性,则通过比较QIM隐写前后该特征的变化即可实现隐写检测.
二、音素分布特性的量化统计模型
语言L的任意一段语音都可由下文方法获得其对应的音素序列.
1.音素P用三元组(p,s,t)表示,其中p为音标,s为音标p的发音是具有一定时长的语音小片段,t为s的时长.音素P为语音的基本组成单位.
2.语言L,包含有限音素,B={P1,P2,…,Pn-1,Pn}。
3.语言L的一段语音片段S可以根据B中的音素分解为多个按时序排列的语音分片S=f1f2...fm-1fm。分片fk实质上是音素Pt的发音,即fk=st。
4.语音片段S表示为音素序列:S=PkPl...PxPy(k,l,x,y∈[1,n])
若音素P为单词,语音片段S为文档。用文档量化表示模型:文档向量空间模型,使用PSVM音素向量空间模型作为音素序列的量化表示模型。
音素向量空间量化表示模型定义:
定义1: 虚拟语言L的音素集合B={P1,…,Pn},称Pi∈B为音素词汇,称B为语言L的音素词典,属于虚拟语言L 的语音片段所包含的音素都在B中.
定义2:虚拟语言L的一段语音S,通过查找音素词典,可切分为按时序排列的N个音素,称上述过程为基于音素的语音分帧。
定义3:设语音片段S分帧后所得的音素序列为S=Pk …Px ;根据音素词典B={P1 ,...,Pn}可构造n 维向量V={W1,…,Wn}对音素序列S进行量化表示,称Wi为音素词汇PiPl Py 的权重(它是与Pi在音素序列S中的分布相关的变量,其取值依据预先设定的 计算规则求取),称向量V对应的n维空间为音素 向量空间,音素序列S可用该空间中的一个点表 示;称上述定义构成的语音片段量化表示方法为音 素向量空间量化表示模型.