【发布时间】:2016-10-18 07:38:48
【问题描述】:
我已经开始将我的 Pyspark 应用程序编写为 Java 实现。我正在使用 Java 8。我刚开始在 java 中执行一些基本的 spark 程序。我使用了以下wordcount 示例。
SparkConf conf = new SparkConf().setMaster("local").setAppName("Work Count App");
// Create a Java version of the Spark Context from the configuration
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile(filename);
JavaPairRDD<String, Integer> counts = lines.flatMap(line -> Arrays.asList(line.split(" ")))
.mapToPair(word -> new Tuple2(word, 1))
.reduceByKey((x, y) -> (Integer) x + (Integer) y)
.sortByKey();
我在 lines.flatMap(line -> Arrays.asList(line.split(" "))) 中收到 Type mismatch: cannot convert from JavaRDD<Object> to JavaRDD<String> 错误
当我用谷歌搜索时,在所有基于 Java 8 的 spark 示例中,我看到了与上述相同的实现。我的环境或程序出了什么问题。
有人可以帮我吗?
【问题讨论】:
-
是
sc一个JavaSparkContext实例。 -
@Ravikumar,是的,它是 JavaSparkContext。
标签: java apache-spark java-8