【发布时间】:2020-06-16 08:35:48
【问题描述】:
> val a=spark.sql(select max(CID) as C_ID from AAA
> val b=spark.sql(select * from NST where C_ID= ' ')
>
我必须将 C_ID 值作为参数传递给下面数据框中的 where 条件。 有什么建议我该怎么做?我不应该使用子查询概念,因为数据以百万计,并且 连接中有多个表,这里我提到了示例查询。
【问题讨论】:
-
您可以从第一个查询中 .collect() 并将其放在第二个查询 where 子句中
标签: sql dataframe apache-spark apache-spark-sql