【问题标题】:Iterate over AWS Glue DynamicFrame迭代 AWS Glue DynamicFrame
【发布时间】:2019-10-16 13:44:36
【问题描述】:

我对 AWS Glue 还是很陌生,仍在尝试解决问题,我尝试在谷歌上搜索以下内容,但找不到答案...

有谁知道如何在 AWS Glue 作业脚本中迭代 DynamicFrame?

例如,我正在尝试执行以下操作:

datasource0 = glueContext.create_dynamic_frame.from_catalog(
                        database = "...", 
                        table_name = "...", 
                        transformation_ctx = "datasource0")

for r in datasource0:
    print(r)

但收到以下错误:

'DynamicFrame' object is not iterable
Traceback (most recent call last):
TypeError: 'DynamicFrame' object is not iterable

【问题讨论】:

  • 我认为 datasource0 本质上是一个 spark 数据框 - 所以你可以通过在本地 pyspark 中尝试来测试你的代码

标签: amazon-web-services aws-glue


【解决方案1】:

将 Glue 的 DynamicFrame 转换为 Spark 的 DataFrame 并使用foreach 函数迭代行:

def f(row):
   print(row.name)

...

datasource0.toDF().foreach(f)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-12-09
    • 2019-08-22
    • 1970-01-01
    • 2018-09-28
    • 2020-10-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多