【发布时间】:2022-07-30 07:04:54
【问题描述】:
这似乎是一件棘手的事情,因为我没有找到太多的文档。我正在尝试将用于 NLU 的 Huggingface 预训练模型部署到 SageMaker 端点。自然,我不想手动执行此操作,我想通过 CloudFormation 将其自动化。我发现了一个关于如何部署的 useful article,但是训练模型的名称令人困惑,我不知道在哪里可以找到我想要部署的模型的正确名称,或者我将把该名称放在哪里(我想要部署一个all-MiniLM-L6-v2 模型)。
这可能吗?我需要部署容器吗?如果是这样,我如何设置容器来处理请求并从模型返回文本嵌入?我已经考虑过仅使用 lambda(这将满足自动化部署过程)来执行此操作,但我需要使用的包大大超过了 lambda+layers 的 250MB 限制。
如何从 CloudFormation 部署端点?有没有人有这样做的经验?如果是这样,请分享您的智慧。
【问题讨论】:
标签: aws-lambda amazon-cloudformation amazon-sagemaker