【发布时间】:2020-08-31 20:57:41
【问题描述】:
我正在尝试从 Glue 动态框架中提取列名和数据类型,并希望在 spark sql 中使用它们。 例如:
persons = glueContext.create_dynamic_frame.from_catalog(
database="legislators",
table_name="customer_table")
persons.printSchema()
输出是
根 |-- cust_no: 长 |-- 名称:字符串 |-- 地址:字符串 |-- 邮编:长
如何从动态框架中提取列名和数据类型。我只想修剪字符串,而不是长字符串。 我想使用 spark sql 中的列
spark.sql(""" SELECT cust_no, trim(name),trim(address),zip....""")
请告知如何实现这一目标。
【问题讨论】:
标签: amazon-web-services aws-glue pyspark-dataframes