【发布时间】:2017-12-27 22:12:30
【问题描述】:
我正在学习 scala,并尝试加载我已经运行/适合数据的模型,但没有成功。运行了 6 个小时,如果我想不出保存/加载输出的方法,恐怕我将不得不重新运行它。
我将 KMeans 作为管道的一部分运行。我将在训练数据集上运行的管道的输出保存为“模型”,这就是我尝试加载的内容。
运行模型后,我可以使用以下方法保存(或者至少我认为是):
model.write.overwrite().save("/analytics_shared/qoe/km_model")
我的问题是如何将其加载回来,这样我就可以使用它对新数据进行聚类/评分,而无需重新运行需要 6 小时的训练。
【问题讨论】:
标签: scala apache-spark k-means apache-spark-mllib