【问题标题】:Slow training of BERT model Hugging faceBERT模型Hugging face的慢速训练
【发布时间】:2021-10-22 13:09:46
【问题描述】:

我正在使用拥抱人脸库中的 BERT 模型实现二进制分类器

training_args = TrainingArguments(
   "deleted_tweets_trainer",                  
   num_train_epochs = 1,            
   #logging_steps=100,    
   evaluation_strategy='steps',       
   remove_unused_columns = True    
)

我正在使用 Colab TPU,但训练时间很长,60 小时清理推文需要 38 小时。

有没有办法优化训练?

【问题讨论】:

    标签: python google-colaboratory bert-language-model huggingface-transformers tpu


    【解决方案1】:

    您目前每 500 步评估一次,并且训练和评估批次大小为 8。

    根据您当前的内存消耗,您可以增加批量大小(评估更多,因为训练消耗更多内存):

    • per_device_train_batch_size
    • per_device_eval_batch_size

    如果它与您的用例匹配,您还可以在开始评估后增加步骤;

    • eval_steps

    【讨论】:

    • 谢谢,添加 per_device_eval_batch_size=16 后,增加了计算时间
    • 更高的batch_size会增加计算时间?你能再检查一遍吗? @AlexKujur
    猜你喜欢
    • 2022-01-15
    • 2021-09-06
    • 2022-01-01
    • 1970-01-01
    • 2022-11-08
    • 2020-12-08
    • 2021-07-25
    • 1970-01-01
    • 2021-06-01
    相关资源
    最近更新 更多