【发布时间】:2020-09-09 07:36:22
【问题描述】:
请建议将数据加载到雪花的最佳方法,我目前对两种方法感到困惑
A)。首先将数据从 Informatica Power center 加载到 s3,然后再加载到雪花
B)。将数据直接从 Informatica 加载到雪花,并从 Informatica 并行加载到 s3。
我的最终目标是在 S3 和雪花中都有数据,只是对遵循哪种方法感到困惑。
而且我需要在雪花中添加增量数据,而不仅仅是附加数据。
【问题讨论】:
-
逻辑上如果我们应该首先加载 s3 然后雪花应该是更好更快的方法。
-
感谢 Sandeep ,那么从 s3 将增量数据加载到雪花的最佳成本效益方法是什么?听说过雪管,但它只处理数据追加而不是 upsert 场景?对此有任何建议。
-
为了更具成本效益,从 S3 中删除数据,但这非常少..
标签: amazon-web-services amazon-s3 snowflake-cloud-data-platform informatica-powercenter