【发布时间】:2020-10-10 20:12:31
【问题描述】:
我有一个如下的序列:
val data = Seq("banagalore",
"Delhi.","","","","Mubmai","Kolkata","Jammu$Kashmir")
val rddData = ss.sparkContext.parallelize(data,3)
val output = rddData.flatMap(_.split(" "))
所以,我的要求是打印 blelow O/P 1.(单词,单词在序列中的位置,序列中的字符个数)
Eg:For Mumbai it will print("Mumbai",5,6)
5=Mumbai 这个词在序列中的位置 6=单词“Mumbai”中的字符数
Also,
O/p 2:Also I have to find out below:
(word,Position of the word in the sequence, Word with Maximum elements)
(word,Position of the word in the sequence, Word with Minimum characters
【问题讨论】:
-
不确定 9 来自哪里
-
嗨 @Elinda 对不起,不是 9。它是 5。5 位孟买字在序列中的位置和 6=“孟买字”中的字符数
标签: scala dataframe apache-spark rdd