【发布时间】:2020-05-19 09:21:52
【问题描述】:
这里提到的架构是我在 AWS Glue 中使用 Unnest 转换后的原始架构的一部分。
profile.details.indices.index: array
| |-- element: struct
| | |-- profile.details.indices.index.val.indexname: string
| | |-- profile.details.indices.index.val.indexsymbol: string
我的要求是将结构内的两个字段的名称(“profile.details.indices.index.val.indexname”和“profile.details.indices.index.val.indexname”)更改为 indexname 和 indexsymbol 分别使用 pyspark。
Glue 中的 RenameField 转换不适用于结构内的字段,它会产生相同的架构。经过一些研究,我发现我必须创建一个 UDF 来重命名 struct 中的字段,因为我是 Pyspark 的新手,任何人都可以告诉我如何实现我的要求。
【问题讨论】:
标签: amazon-web-services pyspark aws-glue