【问题标题】:Upsert in Amazon RedShift without Function or Stored Procedures没有函数或存储过程的 Amazon RedShift 中的 Upsert
【发布时间】:2013-06-19 09:07:23
【问题描述】:

由于 RedShift 中不支持用户定义的函数或存储过程,我如何在使用 ParAccel(PostgreSQL 8.0.2 fork)的 RedShift 中实现UPSERT 机制。

目前,我正在尝试使用 IF...THEN...ELSE... 语句来实现 UPSERT 机制 例如:-

IF NOT EXISTS(SELECT...WHERE(SELECT..))
              THEN INSERT INTO tblABC() SELECT... FROM tblXYZ
              ELSE UPDATE tblABC SET.,.,.,. FROM tblXYZ WHERE... 

这给了我错误。因为我正在独立编写此代码,而不将其包含在函数或 SP 中。 那么,有没有实现UPSERT的解决方案。

谢谢

【问题讨论】:

标签: amazon-redshift paraccel


【解决方案1】:

您可能应该阅读this article on upsert by depesz。你不能依赖SERIALIABLE 因为,AFAIK,ParAccel 不支持像 Pg 9.1+ 中的完全可序列化支持。正如那篇文章中所述,无论如何,您不能真正在数据库中做您想做的事情。

简短的版本是,即使在当前支持可写 CTE 的 PostgreSQL 版本上,它仍然很难。在基于 8.0 的 ParAccel 上,您几乎不走运。

我会进行分阶段合并。 COPY 新数据到服务器上的临时表,LOCK 目标表,然后执行 UPDATE ... FROM 后跟 INSERT INTO ... SELECT。以大块的形式上传数据并为 upserts 锁定表是合理地与 Redshift 的使用方式保持一致。

另一种方法是通过应用程序集群本地的东西从外部协调 upsert。让您的所有工具通过外部工具进行通信,在这些工具中,它们在进行插入之前会采取“插入意图锁定”。您需要一个适合您系统的分布式锁定工具。如果一切都在一个应用服务器中运行,它可能就像一个同步的单例对象一样简单。

【讨论】:

  • 非常感谢,我已经实现了同样的功能,COPY 到 tmp 表,然后是 UPDATE,然后是 INSERT INTO...SELECT。它奏效了。
猜你喜欢
  • 1970-01-01
  • 2019-10-01
  • 2013-01-24
  • 1970-01-01
  • 2014-04-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多