【发布时间】:2021-09-19 20:18:39
【问题描述】:
我必须上传大文件 (~5GB)。我将文件分成小块(10MB),无法一次发送所有数据(+5GB)(因为如果在一个请求中发送超过 5GB 的大数据,我请求的 api 将失败)。我上传到的 api 有一个规范,它需要至少 10MB 的数据才能发送。我确实使用了 read(10485760) 并通过请求发送它,效果很好。
但是,我不想读取内存中的所有 10MB,如果我在脚本中利用多线程,那么读取 10MB 的每个线程都会占用太多内存。
有没有一种方法可以向 api 请求发送总共 10MB 但一次只读取 4096/8192 字节并传输直到达到 10MB,这样我就不会过度使用内存。
请注意,我无法在请求中发送 fileobj,因为这将使用更少的内存,但我将无法在 10MB 处破坏块,并且整个 5GB 数据将发送到请求中,这是我不想要的。
有没有办法通过请求。我看到httplib有它。 https://github.com/python/cpython/blob/3.9/Lib/http/client.py - 我将在这里循环调用 send(fh.read(4096) 函数,直到我完成 10MB 并且将完成一个 10MB 的请求而不会占用大量内存。
【问题讨论】:
标签: file-upload python-requests upload streaming