【问题标题】:Is it possible to train the transformer model in google colab? (Not gpt2)是否可以在 google colab 中训练变压器模型? (不是 gpt2)
【发布时间】:2022-01-18 11:57:18
【问题描述】:

我知道gpt2是基于transformer架构的,但是源代码在哪里,资源有限,也没有关于如何编写的教程.. 我是 NLP 的新手,如果我必须生成小说,那么在多部小说上训练变形金刚还是一部?

【问题讨论】:

  • 我相信这是源代码:github.com/openai/gpt-2
  • 我不是在寻找 gpt2
  • 请编辑问题以将其限制为具有足够详细信息的特定问题,以确定适当的答案。

标签: python machine-learning nlp artificial-intelligence


【解决方案1】:

我认为训练 GPT 和其他转换器的最佳方法是使用库 https://huggingface.co/docs/transformers。他们还有一门课程可以帮助您熟悉该主题:https://huggingface.co/course/

是的,Transformer 模型如果不是太大,可以在 Colab 上进行训练。

是的,可以训练类似 GPT 的模型来生成小说,但只能生成短篇小说(比如几段),因为几乎所有此类模型都只能处理有限长度的文本。

【讨论】:

  • 谢谢,所以如果我理解正确的话,gpt 是一个采用变压器架构的模型,对吧?那为什么没有像RNN或LSTM这样的代码
  • @Vortekus GPT 是一个多层解码器专用转换器,它没有 LSTM 或 RNN 层,因为它使用注意力机制和位置嵌入来理解语言。
  • 如果您想要 GPT 的源代码,请参阅github.com/huggingface/transformers/tree/master/src/…
猜你喜欢
  • 2016-09-16
  • 1970-01-01
  • 2020-05-27
  • 1970-01-01
  • 2018-12-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多