https://github.com/karpathy/minGPT

新手不会调参各种换着玩的。

最近一直在学习这个项目,偶然把GELU换成ReLU,在play_math上得到了100%正确率。

也许是因为GELU更适合NLP?

不过,换了后,也不能叫GPT了。GPT中用的是GELU

相关文章:

  • 2022-12-23
  • 2021-10-01
  • 2021-11-17
  • 2021-09-15
  • 2022-12-23
猜你喜欢
  • 2021-05-28
  • 2022-01-13
  • 2022-12-23
  • 2021-06-28
  • 2022-12-23
  • 2021-04-07
相关资源
相似解决方案