【发布时间】:2021-08-16 12:09:29
【问题描述】:
我正试图集中精力在新数据集上训练 OpenAI 的语言模型。这里有人有这方面的经验吗? 我的想法是用教科书提供 GPT-2 或 3(虽然我没有 API 访问 3),对其进行训练,然后能够用语言模型“讨论”本书的内容。我认为我不必更改任何超参数,我只需要模型中的更多数据。
有可能吗?
非常感谢任何(也是概念性的)帮助!
【问题讨论】:
-
我投票结束这个问题,因为它与 help center 中定义的编程无关,而是关于 ML 理论和/或方法 - 请参阅
machine-learning@ 中的介绍和注意事项987654322@. -
请注意,SO 是一个提供特定编程问题的网站,而不是论坛。
标签: machine-learning training-data gpt-2 gpt-3