【发布时间】:2019-10-12 06:36:16
【问题描述】:
我已经使用 transformer-lm 训练了一个使用 PyTorch 的语言模型。我想将生成的模型作为 Cloud Function 部署到 Google Cloud Platform。 Cloud Functions 的内存限制为 2 GB。
问题是加载模型会导致错误,因为使用了太多内存(超出了内存限制)。 model.pt 文件是 1.32 GB,我用的是
torch.load(model_path / 'model.pt', map_location='cpu')
加载模型。有没有办法 i) 压缩模型? ii) 不立即加载完整模型?或任何其他使其在 GCP 上运行的可能性?
【问题讨论】:
标签: google-cloud-platform google-cloud-functions pytorch