【发布时间】:2021-07-20 17:49:58
【问题描述】:
我想使用预训练的 BERT 模型,以便在文本分类任务中使用它(我正在使用 Huggingface 库)。但是,预训练模型是在与我不同的领域上训练的,并且我有一个大型未注释数据集,可用于对其进行微调。如果我只使用我的标记示例并在针对特定任务 (BertForSequenceClassification) 进行训练时“随时随地”对其进行微调,那么数据集太小而无法适应特定领域的语言模型。最好的方法是什么? 谢谢!
【问题讨论】:
标签: nlp text-classification bert-language-model huggingface-transformers pytorch-lightning