【发布时间】:2021-05-31 21:02:25
【问题描述】:
我通过从案例类加载创建了 3 个临时表。让我们称之为
- ABC
- BCD
- EFG
然后我继续通过执行连接来创建另外 3 个表。
- ABC 加入 BCD 得到 XYZ
- XYZ 与 EFG 连接,这将提供 LMN
- LMN 与 ABC 结合,得到 PQR
spark 是否允许我以某种方式查看相关注册临时表的沿袭?我如何提取它知道 LMN 取决于 XYZ 和 PQR 取决于 LMN 的信息,并以编程方式使用它来构建沿袭树(没有所有计划信息)。 等:
|-PQR
|-LMN
|-XYZ
|- ABC
|-EFG
|-ABC
谢谢。
【问题讨论】:
-
你的意思是像
DataFrame.explain这样的东西吗? -
我试过dataframe.explain,没有显示血统表
-
你用过
extended=true吗? -
是的,它适用于扩展。但是,我希望能够以编程方式使用这些信息,而不仅仅是打印它。我将更新问题以具体化。
-
那么你前面有很多编码 :) 我可能是错的,但据我所知,如果不修改 DataFrame 代码并从头开始重建 Spark,这是不可能的。
标签: apache-spark apache-spark-sql