【发布时间】:2016-09-14 17:07:11
【问题描述】:
所以在我花了几天时间清理我的数据、预处理和试验几个不同的模型(例如在 R Studio 中)之后,我该如何实际部署解决方案。 如果模型是一个简单的模型,例如决策树、逻辑回归,这很简单,因为模型很明显,并且 R 预测器模型部署到具有 http 端点等的商业 R 服务器中。
我的问题是,复杂的预处理(例如 PCA 变换、RBF 内核或 100 棵树的随机森林)怎么样。就像在验证阶段一样,我假设我必须部署 R 脚本来进行预处理,而 PCA或将 RBF 预处理脚本等应用到我的部署服务器?
这是否意味着对于 RBF,我必须将所有原始训练数据集与我的 SVM 预测器一起托管? RBF 变换是训练集或至少支持向量的函数。
对于随机森林,我假设我必须上传所有大约 500 棵树,作为一个非常大的模型的一部分。
【问题讨论】:
标签: deployment machine-learning kernel