将训练有素的机器学习模型部署到生产中的步骤答案

【问题标题】：Steps to deploy trained machine leaning model into production将训练有素的机器学习模型部署到生产中的步骤
【发布时间】：2017-04-05 03:39:44
【问题描述】：

我是 ML 世界的新手，在阅读有关使用训练数据构建模型并最终测试数据以满足要求时，直到这一点我能够遵循，我的问题是一旦测试模型准备好部署

假设使用 spark MLib 构建模型

让我添加更多详细信息。当我训练模型时，它会在预生产环境中生成基于分数的训练数据，我可以将带有分数的数据保存在分布式存储中以供以后预测，而不是重新训练模型。我想了解步骤 1) 当我将经过良好测试的模型从预生产环境带到生产环境时，我是否需要有训练数据和新数据集来预测结果？

我是机器学习的新手，想了解模型代码如何发布到下一个环境，我需要考虑哪些步骤

感谢您的澄清，这意味着我需要将模型对象部署到生产中，然后使用生产数据（功能）来计算目标数据值？请您参考我可以了解如何构建的任何书籍或信息，验证和部署监督算法。

再次感谢您花时间教育我。

【问题讨论】：

【解决方案1】：

生产部署后是否需要训练/重新训练模型？如果是这样，具体做法是什么？

不一定，但您可能会。很大程度上取决于正在发生的事情建模以及随着时间的推移它的稳定性。

有没有办法坚持假设，以便模型可以使用坚持的结果进行预测？

??不确定我是否理解这个问题，但大多数生产模型都有记录系统附加到分析/报告/可视化帮助跟踪模型性能并帮助决定何时重新训练。

每天、每周或每月重新训练模型是一种好习惯吗？

取决于性能和资源限制。如果您有少量模型需要重新训练/评分和重新训练不会影响 SLA，这可能不是一个坏主意，但是当有计算资源有限，答案可能会改变。

【讨论】：

有没有办法坚持假设，以便模型可以使用坚持的结果进行预测？，-让我添加更多细节。
我仍然有点不确定您要做什么。通常在将模型投入生产时，您不使用训练数据，而是使用模型对象（在训练过程中创建）以及要评分的新数据（看起来几乎与训练数据相同，减去目标变量）。