【发布时间】:2017-01-16 01:40:40
【问题描述】:
我有一个 pojo-AnalyticsModel,我有一个循环,我在其中为 pojo 创建对象。每次创建对象时,我都会保存到名为 AnalyticsModelList 的列表中。然后在退出循环后,我将列表转换为 RDD。下面是我的代码:
do {
AnalyticsModel analyticsObj = new AnalyticsModel(time, columnName, aggrResult);
analyticsList.add(analyticsObj);
}while (cal.getTimeInMillis() <= endDate);
JavaRDD<AnalyticsModel> analyticsRdd = sc.parallelize(analyticsList);
我可以直接将对象作为 RDD,而不是添加到列表然后将其转换为 RDD。有人可以指导我吗?我对 Spark 很陌生。
谢谢
【问题讨论】:
-
它看起来不错,这是一个更好的方法,只需使用
Kyro serializer,工作会更快
标签: java apache-spark rdd