【发布时间】:2020-05-22 15:52:45
【问题描述】:
我正在尝试使用 GPT-2-simple 的 colab 设置从保存的检查点继续训练:
https://colab.research.google.com/drive/1SvQne5O_7hSdmPvUXl5UzPeG5A6csvRA#scrollTo=aeXshJM-Cuaf
但我就是不能让它工作。从我的 googledrive 加载保存的检查点工作正常,我可以使用它来生成文本,但我无法从该检查点继续训练。在gpt2.finetune () 中,我输入了restore.from='latest" 和overwrite=True,我一直在尝试使用相同的run_name 和不同的run_name,并使用overwrite=True,而不是。正如建议的那样,我也尝试在两者之间重新启动运行时,但这没有帮助,我不断收到以下错误:
"ValueError: Variable model/wpe already exists, disallowed. Did you mean to set reuse=True
or reuse=tf.AUTO_REUSE in VarScope?"
我假设我需要在继续训练之前运行gpt2.load_gpt2(sess, run_name='myRun'),但是每当我先运行这个时,gtp2.finetune() 就会抛出这个错误
【问题讨论】:
标签: python tensorflow nlp google-colaboratory gpt-2