【发布时间】:2021-11-05 23:35:30
【问题描述】:
我有一个 Spark Dataframe (json_df),我需要基于嵌套的 json 创建另一个 Dataframe:
这是我当前的数据框:
我知道我可以手动执行此操作,例如:final_df = json_df.select( col("Body.EquipmentId"),..... ),但我想以通用方式执行此操作。
注意:对于这个特定的 DF,json 记录具有相同的结构。
有什么想法吗?
谢谢!
【问题讨论】:
-
json_df.select('Body.*')工作吗? -
你说得对@werner...解决方案可能是:
Final_df = json_df.select(col("body.*"))
标签: python apache-spark pyspark databricks