【问题标题】:Steps to deploy trained machine leaning model into production将训练有素的机器学习模型部署到生产中的步骤
【发布时间】:2017-04-05 03:39:44
【问题描述】:

我是 ML 世界的新手,在阅读有关使用训练数据构建模型并最终测试数据以满足要求时,直到这一点我能够遵循,我的问题是一旦测试模型准备好部署

  1. 生产部署后是否需要训练/重新训练模型?如果有,具体做法是什么?
  2. 有没有办法坚持假设,以便模型可以使用坚持的结果进行预测?
  3. 每天、每周或每月重新训练模型是否良好?

假设使用 spark MLib 构建模型

  • 让我添加更多详细信息。当我训练模型时,它会在预生产环境中生成基于分数的训练数据,我可以将带有分数的数据保存在分布式存储中以供以后预测,而不是重新训练模型。我想了解步骤 1) 当我将经过良好测试的模型从预生产环境带到生产环境时,我是否需要有训练数据和新数据集来预测结果?

我是机器学习的新手,想了解模型代码如何发布到下一个环境,我需要考虑哪些步骤

感谢您的澄清,这意味着我需要将模型对象部署到生产中,然后使用生产数据(功能)来计算目标数据值?请您参考我可以了解如何构建的任何书籍或信息,验证和部署监督算法。

再次感谢您花时间教育我。

【问题讨论】:

  • “ML”标签适用于编程语言 ML,而非机器学习。

标签: apache-spark machine-learning


【解决方案1】:

生产部署后是否需要训练/重新训练模型?如果是这样,具体做法是什么?

不一定,但您可能会。很大程度上取决于正在发生的事情 建模以及随着时间的推移它的稳定性。

有没有办法坚持假设,以便模型可以使用坚持的结果进行预测?

  • ??不确定我是否理解这个问题,但大多数生产模型都有记录系统附加到分析/报告/可视化 帮助跟踪模型性能并帮助决定何时 重新训练。

每天、每周或每月重新训练模型是一种好习惯吗?

  • 取决于性能和资源限制。如果您有少量模型需要重新训练/评分和重新训练 不会影响 SLA,这可能不是一个坏主意,但是当有 计算资源有限,答案可能会改变。

【讨论】:

  • 有没有办法坚持假设,以便模型可以使用坚持的结果进行预测?,-让我添加更多细节。
  • 我仍然有点不确定您要做什么。通常在将模型投入生产时,您不使用训练数据,而是使用模型对象(在训练过程中创建)以及要评分的新数据(看起来几乎与训练数据相同,减去目标变量)。
猜你喜欢
  • 2011-02-15
  • 2017-09-21
  • 2020-05-06
  • 2016-02-06
  • 2017-07-15
  • 1970-01-01
  • 2011-03-16
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多