类似于HCLG的wfst结构,EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING文章提出了TLG的网络结构

Grammar

CTC学习笔记(四) 解码-WFST

Lexicon

有两种形式,可以基于characters和phonemes。
CTC学习笔记(四) 解码-WFST

Token

对应于传统的state,前后添加blank,而且状态存在自旋
CTC学习笔记(四) 解码-WFST

网络

S=Tmin(det(LG)) S=T∘min(det(L∘G))

结论

相比于传统的hybrid方法,准确率差不多,解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度。

           
                     

类似于HCLG的wfst结构,EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING文章提出了TLG的网络结构

Grammar

CTC学习笔记(四) 解码-WFST

Lexicon

有两种形式,可以基于characters和phonemes。
CTC学习笔记(四) 解码-WFST

Token

对应于传统的state,前后添加blank,而且状态存在自旋
CTC学习笔记(四) 解码-WFST

网络

S=Tmin(det(LG)) S=T∘min(det(L∘G))

结论

相比于传统的hybrid方法,准确率差不多,解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度。

           

相关文章:

  • 2022-12-23
  • 2021-08-30
  • 2021-05-14
  • 2021-10-11
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-12-06
猜你喜欢
  • 2021-10-03
  • 2021-05-23
  • 2021-04-04
  • 2021-11-17
  • 2021-12-04
  • 2021-08-18
  • 2021-07-21
相关资源
相似解决方案