【发布时间】:2020-08-05 15:49:11
【问题描述】:
谁能告诉我如何检查从 S3 到 Snowflake 的数据加载结果。
加载过程是面向批处理的,我将文件从 Snowflake 中的某个位置拖放到 S3 存储桶中,我们通过查询从文件中读取的阶段将数据摄取到永久表中。
处理文件中的数据后,需要将文件移动到存档文件夹。
我正在为如何完成最后一步而苦恼?
我想到了一些选项,但不确定它们有多好 选项 1 - Snowflake 中的一个外部函数,它将在 AWS 中引发一个事件,该事件将触发一个 lambda 函数来移动文件。我觉得有点不靠谱
选项 2 - 将加载结果写入 Snowflake 中的审核表,然后从 aws 轮询该表并将其中列出的所有已处理文件移动到存档 - 可能有效,但有点老派,也不是实时的,所以会需要在 Snowflake 端进行额外查询以防止重复
选项 3 - 将文件直接写入舞台和存档文件夹,并使用加载命令的删除选项将其从 Snowflake 中删除 - 不理想并且有点变通方法。
提前非常感谢。我想没必要说我是 Snowflake 的新手 :-)
【问题讨论】:
标签: load snowflake-cloud-data-platform