【问题标题】:how to use amp training in Allennlp 2.4.0?如何在 Allennlp 2.4.0 中使用 amp 训练?
【发布时间】:2021-07-08 11:23:10
【问题描述】:

我从https://medium.com/ai2-blog/tutorial-training-on-larger-batches-with-less-memory-in-allennlp-1cd2047d92ad 学会了在训练模型上使用 AMP 和 GA 技巧, 但是2.4.0好像不支持?

文件“/root/anaconda3/envs/allennlp/lib/python3.6/site-packages/allennlp/training/util.py”,第 217 行,在 create_serialization_dir f"训练配置中 '{key}' 的值与 "

中的值不匹配

【问题讨论】:

  • AMP 仍然适用于 AllenNLP。您的问题可能有其他原因。您可以发布整个错误消息吗?
  • 感谢您的回复,我已通过在我的 config.json 中为 trainer 传递参数(类型:“gradient_descent”)来修复此错误。但是,我在 allennlp 2.4.0 文档中找不到 Gradient_descent_trainer 类,这真的让我很困惑。
  • 非常感谢,上个版本2.5.1可以找到,但是具体版本2.4.0找不到了

标签: allennlp


【解决方案1】:

感谢您的回答!@Dirk Groeneveld。 最后,在 allennlp 2.4.0 中使用 AMP 的正确方法:

"trainer": {
    "type":"gradient_descent",
    "use_amp": true,
    "num_gradient_accumulation_steps": 4,
    "distributed": true,
    ...
    }

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-04-05
    • 2019-08-10
    • 2022-06-11
    • 2019-12-08
    • 2021-11-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多