【发布时间】:2020-09-27 07:54:44
【问题描述】:
使用 scala 已经可以使用类似的解决方案,但我需要 pyspark 中的解决方案。我是 python 新手,同样需要你的帮助。
以下是 scala 解决方案的链接,以便更好地理解需求。
Rename nested struct columns in a Spark DataFrame
我正在尝试在 python 中更改 DataFrame 列的名称。我可以轻松更改直接字段的列名,但在转换数组结构列时遇到了困难。
下面是我的 DataFrame 架构。
|-- VkjLmnVop: string (nullable = true)
|-- KaTasLop: string (nullable = true)
|-- AbcDef: struct (nullable = true)
| |-- UvwXyz: struct (nullable = true)
| | |-- MnoPqrstUv: string (nullable = true)
| | |-- ManDevyIxyz: string (nullable = true)
但我需要像下面这样的架构
|-- vkjlmnvop: string (nullable = true)
|-- kataslop: string (nullable = true)
|-- abcdef: struct (nullable = true)
| |-- uvwxyz: struct (nullable = true)
| | |-- mnopqrstuv: string (nullable = true)
| | |-- mandevyixyz: string (nullable = true)
如何动态更改 Struct 列名?
【问题讨论】:
-
也许这会有所帮助? stackoverflow.com/questions/43004849/…
标签: python pyspark pyspark-dataframes