【发布时间】:2021-02-24 10:14:42
【问题描述】:
我目前在 Python 中使用ftplib 来获取一些文件并将它们写入 S3。
我使用的方法是使用with open,如下图:
with open('file-name', 'wb') as fp:
ftp.retrbinary('filename', fp.write)
从 FTP 服务器下载文件并将它们保存在临时文件夹中,然后将它们上传到 S3。
我想知道这是否是最佳实践,因为这种方法的缺点是:
如果文件太多&太大,我可以下载它们并上传到 S3,然后从临时文件夹中删除它们, 但问题是如果我每天运行一次此脚本,我必须再次下载所有内容,那么我如何检查文件是否已下载并存在于 S3 中,以便脚本仅处理 FTP 中新添加的文件?
希望这是有道理的,如果有人有例子或其他东西,那就太好了,非常感谢。
【问题讨论】:
-
我不认为你的问题标题总结了你的问题。 “从 FTP 获取文件并将它们写入 AWS S3” 没有问题。你似乎已经解决了。您在查找 FTP 上的新文件时遇到问题。
-
无论如何,这可能会对您有所帮助:How to get FTP file's modify time using Python ftplib.
标签: python amazon-web-services amazon-s3 ftp ftplib