【发布时间】:2020-05-09 00:16:25
【问题描述】:
我有一个包含 20 多列的文件,我想从中提取一些。到目前为止,我有以下代码。我确信有一种聪明的方法可以做到这一点,但无法让它成功运行。有什么想法吗?
mvnmdata 是 RDD[String] 类型
val strpcols = mvnmdata.map(x => x.split('|')).map(x => (x(0),x(1),x(5),x(6),x(7),x(8),x(9),x(10),x(11),x(12),x(13),x(14),x(15),x(16),x(17),x(18),x(19),x(20),x(21),x(22),x(23) ))```
【问题讨论】:
-
上述代码执行时出现了什么样的错误?是不是像“元组的元素太多”?
-
没有错误,我得到了预期的结果。但我在想是否有一条捷径可以在不重复“x(n)”的情况下编写相同的命令。
标签: scala apache-spark