【发布时间】:2017-04-26 08:41:49
【问题描述】:
我一直在寻找一段时间,但我还没有找到如何去做。 我有一个包含对表的引用的数据框,其中一列包含一个字符串
dataframe schema: name string,lastname string, interests string
我有一个这样的兴趣列表:
val sports:List [String] = List("football","basketball","soccer")
我想从我的数据框中过滤出所有符合他们兴趣的包含上述一项运动的人
val peopledata = sqlContext.sql("select * from learning.people")
我尝试过这样做:
for (sport <- sports)peopledata.filter(peopledata("interests").contains(sport))
但我已经问过我工作的公司的一位专业人士,他告诉我他有一个更好、更漂亮的方法来做这件事
【问题讨论】:
标签: scala apache-spark hive bigdata