【发布时间】:2020-01-17 10:05:58
【问题描述】:
我想学习如何在 Spark 上使用 K-Means 算法。 我有一个镶木地板文件,我想用 k-means 分析它。如何告诉 spark 仅分析特定列?如何从行中删除空值?有人可以编写一个简单的代码来说明如何做到这一点吗? 谢谢
【问题讨论】:
-
这是4题合1! :) 阅读镶木地板,运行 k-means,仅选择某些列,并删除空值...如果您遇到任何问题,您至少应该先尝试,然后再提出更具体的问题
标签: scala apache-spark k-means parquet