【发布时间】:2016-08-10 00:14:29
【问题描述】:
我有一个日志文件,其数据如下:
1,2008-10-23 16:05:05.0,\N,Donald,Becton,2275 Washburn Street,Oakland,CA,94660,5100032418,2014-03-18 13:29:47.0,2014-03-18 13:29:47.0
2,2008-11-12 03:00:01.0,\N,Donna,Jones,3885 Elliott Street,San Francisco,CA,94171,4150835799,2014-03-18 13:29:47.0,2014-03-18 13:29:47.0
我需要创建一个以邮政编码为键的 RDD 对,并在该邮政编码中创建一个名称列表 (Last Name,First Name) 作为值。
我需要使用mapValues,我做了以下操作:
val namesByPCode = accountsdata.keyBy(line => line.split(',')(8)).mapValues(fields => (fields(0), (fields(4), fields(5)))).collect()
但我遇到了一个错误。谁能告诉我我的陈述有什么问题?
【问题讨论】:
-
你遇到了什么错误?
标签: scala apache-spark bigdata