CRFs及其应用
模型原理
基本思路:给定观察序列X,输出标识序列Y,通过计算P(Y∣X)求解最优标注序列。
CRFs和HMMs的区别:

CRFs中特征函数(全局特征函数)统一表示为:
Fj(Y,X)=i=1∑nfj(yi−1,yi,X,i)
其中局部特征函数fj(yi−1,yi,X,i)表示状态特征s(yi−1,yi,X,i)或转移特征t(yi−1,yi,X,i)。
则CRFs定义的条件概率为:
p(Y∣X,λ)=Z(X)1exp(j∑λjFj(Y,X))
其中,Z(X)为归一化因子:Z(X)=∑Yexp(∑jλjFj(Y,X))
实现CRFs要解决的三个问题
CRFs的应用
由字构词的(基于字标注)的分词方法
基本思想:将分词过程看作是字的分类问题:每个字在 构造一个特定的词语时都占据着一个确定的构词位置 (即词位)。一般情况下,每个字只有4个词位:词首(B)、词中(M)、词尾(E)和单独成词(S) 。
算法过程:
-
特征选择
- 一元特征:当前字、当前字的前一个字、当前字的后一个字
- 二元特征:各标记间的转移特征,状态特征和转移特征
-
参数训练
通过训练语料估计特征权重λj, 使其在给定一个观察序列X的条件下, 找到一个最有可能的标记序列Y, 即条件概率P(Y∣X) 最大。
-
解码
条件随机场解码的过程就是根据模型求解的过程,可以由维特比 (Viterbi)算法完成。维特比算法是一 个动态规划算法,动态规划要求局部路径也是最优 路径的一部分。
CRFs和MEMMs
