【发布时间】:2021-02-03 17:15:55
【问题描述】:
我想知道人们什么时候说预训练的bert模型,是不是只训练了最终的分类神经网络
或者
transformer 内部是否有任何通过反向传播和分类神经网络进行的更新
【问题讨论】:
-
你是说预训练还是微调?
-
我的意思是在预训练期间
-
你能解释一下@AshwinGeetD'Sa on 在训练期间每个bert编码器的权重是否有内部更新
标签: nlp bert-language-model transformer