【发布时间】:2020-07-08 22:36:28
【问题描述】:
在这里寻找一些提示。我使用 python3 和 lambda 进行了一些安静的编码和研究。但是,超时是我在 atm 上苦苦挣扎的最大问题。我正在尝试从 S3 读取一个非常大的 csv 文件(3GB)并将这些行推送到 DynamoDB 中。我目前一次读取大约 1024 * 32 字节,然后使用 pub/sub 模式将行推送到 dynamo DB(使用 asyncio 批量写入),它适用于小文件,即 ~500K 行。当我有数百万行时,它会超时。我试图不使用 AWS 胶水和/或 EMR。我有一些限制/限制。
有谁知道这是否可以使用 Lambda 或步进函数来完成?如果是这样,你能分享你的想法吗?谢谢!!
【问题讨论】:
-
这可以使用多处理和读写块来完成吗?
标签: python-3.x aws-lambda aws-step-functions