【发布时间】:2019-03-30 01:18:00
【问题描述】:
假设我有一个数据框 df1,其中一列是“城市”。
我需要创建一个新列,它基本上会列出特定城市名称在第二个数据框 df2 中出现的次数。
谢谢!
【问题讨论】:
标签: scala apache-spark dataframe
假设我有一个数据框 df1,其中一列是“城市”。
我需要创建一个新列,它基本上会列出特定城市名称在第二个数据框 df2 中出现的次数。
谢谢!
【问题讨论】:
标签: scala apache-spark dataframe
var df3 =df2.groupBy("city").count
df1.join(df3,Seq("city"), "left")
这将为您提供答案。这里join用作查找技术
【讨论】: