类似于HCLG的wfst结构,EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING文章提出了TLG的网络结构

Grammar

CTC学习笔记(四) 解码-WFST

Lexicon

有两种形式,可以基于characters和phonemes。
CTC学习笔记(四) 解码-WFST

Token

对应于传统的state,前后添加blank,而且状态存在自旋
CTC学习笔记(四) 解码-WFST

网络

S=Tmin(det(LG)) S=T∘min(det(L∘G))

结论

相比于传统的hybrid方法,准确率差不多,解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度。

           
                     

类似于HCLG的wfst结构,EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING文章提出了TLG的网络结构

Grammar

CTC学习笔记(四) 解码-WFST

Lexicon

有两种形式,可以基于characters和phonemes。
CTC学习笔记(四) 解码-WFST

Token

对应于传统的state,前后添加blank,而且状态存在自旋
CTC学习笔记(四) 解码-WFST

网络

S=Tmin(det(LG)) S=T∘min(det(L∘G))

结论

相比于传统的hybrid方法,准确率差不多,解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度。

           

相关文章: