【发布时间】:2020-08-28 18:03:01
【问题描述】:
我正在尝试使用 Airflow 将文件从 S3 存储桶移动到 Snowflake 内部阶段(不是直接表)的解决方案,但当前的 Snowflake 运算符似乎不支持 PUT 命令。
我知道还有其他选项,例如 Snowpipe,但我想展示 Airflow 的功能。 COPY INTO 也是一种替代解决方案,但我想从文件中加载 DDL 语句,而不是在 Snowflake 中手动运行它们。
这是我能找到的最接近的,但它使用 COPY INTO 表:
https://artemiorimando.com/2019/05/01/data-engineering-using-python-airflow/
还有:How to call snowsql client from python
有没有办法通过Airflow+Python+Snowsql将文件从S3 bucket移动到Snowflake内部阶段?
谢谢!
【问题讨论】:
-
这是一个不寻常的请求。为什么您试图将文件从 S3 移动到内部阶段而不打算将它们加载到 Snowflake 中?
-
@MikeWalton 我确实有这个意图,但我想分两步完成:1. 使用 PUT 将文件移动到舞台 2. 复制到我知道事情可以轻松完成,但这里的关键是展示气流编排。
标签: amazon-s3 airflow snowflake-cloud-data-platform snowsql