【发布时间】:2023-03-26 12:53:01
【问题描述】:
在我的用例中,我计划的作业读取 CSV 并写入雪花。
当我安排从 CSV 读取并每小时写入雪花时,我看到雪花中有多个重复项。尽管我的 ID 是 PRIMARY KEY (ALTER TABLE tablename ADD PRIMARY KEY (column1).
我了解 Snowflake 支持定义和维护约束,但不强制执行它们,但始终强制执行的 NOT NULL 约束除外。 我需要帮助来解决这个问题。
为了详细说明,让我们考虑一下场景:
第 1 步:上午 9 点将数据从 CSV 插入到 Snowflake ID Customer name Price 1111 John Mathew 10 1112 David Becham 20
第 2 步:晚上 10 点,我又多了一行,因此我的 CSV 是 ID Customer name Price 1111 John Mathew 10 1112 David Becham 20 1113 Hello World 40
预计在雪花中
ID Customer name Price 1111 John Mathew 10 1112 David Becham 20 1113 Hello World 40
【问题讨论】:
-
当然,如果您多次加载具有相同记录的 CSV 文件,您会看到重复项。您可以像在下面描述的任何其他数据库中一样执行此操作。
标签: primary-key snowflake-cloud-data-platform