NLP(3)——seq to seq

 

  • 什么是Seq2Seq网络?
    在Seq2Seq模型中采用了这种 Encoder-Decoder架构,其中 Encoder 是一个RNNCell(RNN ,GRU,LSTM 等) 结构,四层的LSTM结构使得能够提取足够多的特征,使得decode的模型变好
  • 几种Seq2Seq模式
    1.学霸模式

     

    seq to seq

     

    2.普通作弊

     

    seq to seq

    image.png


    3.学弱作弊

    seq to seq


    普通作弊的基础上,回顾上一刻的答案

    4.学渣作弊(attention机制)

     

    seq to seq


    上课的时候划重点
  • 应用场景
    只要是序列到序列都可以用
  • attention机制是怎么引入的?

     

    seq to seq

    image.png

     

    第一步

     

    seq to seq


    第二步:

    seq to seq

     

    第三步:

     

    seq to seq

  • seqtoseq损失函数
    损失函数为交叉熵损失函数,一般情况下,深度学习最后用softmax最为分类器一般都会选择用交叉熵损失函数

相关文章:

  • 2021-07-13
  • 2022-12-23
  • 2021-10-18
  • 2021-10-01
  • 2022-12-23
  • 2022-12-23
  • 2021-09-08
  • 2021-11-21
猜你喜欢
  • 2021-05-20
  • 2022-01-03
  • 2021-07-02
  • 2021-12-15
  • 2022-12-23
  • 2021-12-28
相关资源
相似解决方案