【发布时间】:2020-04-10 12:08:35
【问题描述】:
我是 AWS 和雪花的新手。 我希望使用 aws 胶将 csv 文件从 S3 加载到相应的雪花表(大约 100 个表)。我能够使用下面的文章将数据加载到 1 个雪花表中
https://support.snowflake.net/s/article/How-to-Set-up-AWS-Glue-ETL-for-Snowflake
是否可以使用 1 个 aws 胶水来加载表列表?
在 AWS Glue 内部 - 我们可以编写逻辑来根据 csv 文件在雪花中更新或插入数据吗?
如有任何示例代码/解决方案,请提供建议并分享。
谢谢, 乔
【问题讨论】:
-
我知道您专门要求使用 Glue,但就像其他人指出的那样,您可以使用其他不那么密集的工具。我会调查 Snowflake 的 Snowpipe 服务。基本上,您需要在 S3 中设置通知,然后在 Snowflake 中进行一些额外设置,然后 Snowflake 将自动从 S3 中提取新记录,而无需您维护任何作业:docs.snowflake.com/en/user-guide/…
标签: amazon-web-services pyspark snowflake-cloud-data-platform aws-glue aws-glue-data-catalog