【发布时间】:2019-06-17 00:45:37
【问题描述】:
目前,我们使用 Hadoop 和 Snowflake 来存储我们的数据。
该过程是使用 DISTCP 将 Hadoop ORC 文件复制到 Snowflake s3 位置,然后从 S3 运行 Copy into Snowflake 表。这会将 Hadoop ORC 表中的所有内容复制到 Snowflake 表中。
现在,我有一个新要求,其中我的 Hadoop 表是一个事务表,并且现有条目每小时都会更新一次。如果我将 ORC 文件复制到 S3 并运行 Copy 命令,它会将更多条目添加到现有表中,而不是更新现有的 1。
如何在 Snowflake 中解决这个问题?
【问题讨论】:
标签: snowflake-cloud-data-platform