【发布时间】:2019-01-31 00:11:17
【问题描述】:
这可能是一个非常简单的问题。
但我自己并没有走得太远。
我正在尝试在 Databricks 中使用 PySpark 来执行相当于查询的 SQL:
select
a.*
, b.MASTER_ID as PLAYER_ID
from vGame a
join PLAYER_XREF b
on a.PLAYER_NAME = b.PLAYER
注意on两侧的两个属性名称不同。
你能告诉我同样的 pyspark 版本吗? 在我看来,与此相比,这里的众多切线帖子过于复杂。
我发现了这个,这真的很接近,但返回的数据框是 ta & tb 的所有列。
inner_join = ta.join(tb, ta.name == tb.name)
【问题讨论】:
标签: apache-spark pyspark pyspark-sql databricks azure-databricks