【发布时间】:2020-09-30 17:10:56
【问题描述】:
我想在烧瓶应用程序中执行文本生成任务并将其托管在 Web 服务器上,但是在下载 GPT 模型时,弹性 beanstalk 托管 EC2 实例崩溃,因为下载需要太多时间和内存
from transformers.tokenization_openai import OpenAIGPTTokenizer
from transformers.modeling_tf_openai import TFOpenAIGPTLMHeadModel
model = TFOpenAIGPTLMHeadModel.from_pretrained("openai-gpt")
tokenizer = OpenAIGPTTokenizer.from_pretrained("openai-gpt")
这些是导致问题的行。 GPT 约为 445 MB。我正在使用变压器库。我没有在这一行下载模型,而是想知道是否可以腌制模型,然后将其捆绑为存储库的一部分。这个库有可能吗?否则如何预加载此模型以避免我遇到的问题?
【问题讨论】:
标签: machine-learning flask amazon-elastic-beanstalk transformer huggingface-transformers