【发布时间】:2020-04-05 23:52:47
【问题描述】:
我有一个工作流程,可以将 700gb 的文件从 ftp 服务器移动到本地服务器以进行 python 脚本处理。
我想将此进程迁移到 AWS s3 存储桶以供 lambda 处理。
我认为 AWS 数据同步是一种价格合理的解决方案 (0.0125/gb),可以将此数据移动到 S3 存储桶。
但不是来自 ftp 站点。
任何人有建议如何做到这一点?
注意:我研究了 filezilla pro,但无法使用批处理命令或脚本自动执行此过程。
【问题讨论】:
-
AWS supports SFTP 用于进出 s3。因此,也许它会很有用。
-
通过您的设计思考。您想将数据从 FTP 服务器复制到 S3。这将需要计算和网络资源。然后您计划将数据从 S3 复制到 Lambda 进行处理。相反,启动 EC2,将数据从 FTP 下载到 EC2 并进行处理。 AWS 对数据传输和存储收费。谷歌搜索
FTP file sync寻找可以从 FTP 服务器自动同步到本地存储(在 EC2 上)的工具。 -
使用aws sftp的传输速率完全不合理。
-
看起来我可以在 ec2 实例中的预定 dos 批处理脚本中运行 winscp,但如果有办法将文件直接加载到 lambda 进行处理,这似乎是一个不必要的步骤。我不知道 lambda 可以存储文件。
标签: amazon-web-services amazon-s3 aws-datasync