【发布时间】:2020-01-06 03:18:13
【问题描述】:
我正在处理 sagemaker 中文本数据的分类问题。在哪里,我首先将其拟合并转换为结构化格式(例如通过在 sklearn 中使用 TFIDF),然后我将结果保存在 S3 存储桶中,并用它来训练我的 pytorch 模型,我已经在我的入口点中为其编写了代码。
如果我们注意到,在上述过程结束时,我有两个模型
- sklearn TFIDF 模型
- 实际 PyTorch 模型
因此,当我每次需要对新的文本数据进行预测时,我需要使用我在训练期间创建的 TFIDF 模型单独处理(转换)文本数据。
如何使用 sklearn 的 TFIDF 和 pytorch 模型在 sagemaker 中创建管道。
如果我在入口点的 main 方法中使用 TFIDF 拟合和转换文本数据,那么如果我在 main 方法中训练我的 pytorch 模型,我只能返回一个将在 model_fn() 中使用的模型
【问题讨论】:
标签: python scikit-learn pytorch amazon-sagemaker