不多说,直接上干货!

 

 

创建Pair RDD

 

 

Python语言
pairs = lines.map(lambda x: (x.split(" ")[0], x))

 

 

 

 scala语言

val pairs = lines.map(x => (x.split(" ")(0), x))

 

 

 

Java语言

PairFunction keyData =
    new PairFunction() {
    public Tuple2 call(String x) {
        return new Tuple2(x.split(" ")[0], x);
    }
};
JavaPairRDD pairs = lines.mapToPair(keyData);

 

相关文章: