【发布时间】:2020-01-18 03:40:49
【问题描述】:
我正在尝试构建一个强大的 AWS 无服务器 ETL 流,以将 (CSV) 文件从 S3 存储桶加载到 Postgres 实例 (postgresql9.6)。这些文件相当大(10gb+),所以在测试时我遇到了 Lambda 的多个限制(/tmp 空间、内存空间、时间)。
我正在研究 AWS Glue,但感觉这可能对 RDS 有限制,并且对于我正在尝试做的事情来说有点矫枉过正。
此外,CSV 文件包含 Postgres COPY FROM 无法处理的多字符分隔符(“~|~”)(因此,我还需要进行一些预处理)。
有没有人遇到过类似情况并设法做到无服务器,或者我应该坚持使用 EC2 实例以了解情况?
【问题讨论】:
标签: amazon-web-services aws-lambda serverless aws-glue