【发布时间】:2021-05-07 22:43:24
【问题描述】:
我们有两个数据框
df = spark.createDataFrame([
(1, 'Nick', 'Miller'),
(2, 'Jessica', 'Day'),
(3, 'Winston', 'Schmidt'),
], ['id', 'First_name', 'Last_name'])
df1 = spark.createDataFrame([ (1, '^[a-lA-L]', 'type1'), (3, '^[m-zM-Z]', 'type2')], ['id', 'regex_match', 'vaule']
需要加入这两个dataframe,其中df1.regex_match匹配df.Last_name
需要的输出如下:请有任何建议:
join df to df1 using left join
【问题讨论】:
标签: regex dataframe apache-spark join pyspark