【发布时间】:2022-02-01 20:13:22
【问题描述】:
所以,如果我理解正确的话,主要有两种方法可以让 BERT 适应特定任务:微调(所有权重都发生变化,甚至是预训练的权重)和基于特征的(预训练的权重被冻结)。但是,我很困惑。
- 什么时候使用哪一个?如果您有未标记的数据(无监督学习),您是否应该使用微调?
- 如果我想微调 BERT,使用掩码语言模型和下一句预测不是唯一的选择吗?还有:是否有必要在上面再放一层神经网络?
谢谢。
【问题讨论】:
所以,如果我理解正确的话,主要有两种方法可以让 BERT 适应特定任务:微调(所有权重都发生变化,甚至是预训练的权重)和基于特征的(预训练的权重被冻结)。但是,我很困惑。
谢谢。
【问题讨论】:
【讨论】: