【发布时间】:2020-10-12 23:29:36
【问题描述】:
目前,我正在构建一个新的基于 Transformer 的模型,其中包含抱脸变压器,其中注意力层与原来的不同。我使用run_glue.py 来检查我的模型在 GLUE 基准测试中的性能。但是,我发现Huggingface-transformers的Trainer类保存了我设置的所有检查点,我可以在其中设置要保存的最大检查点数。但是,我只想在验证数据集上保存具有 best 性能的权重(或其他东西,如优化器),而当前的 Trainer 类似乎没有提供这样的东西。 (如果我们设置检查点的最大数量,那么它会删除旧的检查点,而不是性能较差的检查点)。 Someone already asked about same question on Github,但我不知道如何修改脚本并做我想做的事。目前,我正在考虑制作一个自定义 Trainer 类,它继承原始类并更改 train() 方法,如果有一种简单易行的方法来做到这一点,那就太好了。提前致谢。
【问题讨论】:
标签: deep-learning nlp pytorch huggingface-transformers