【问题标题】:How to compress csv file into zip archive directly?如何将 csv 文件直接压缩成 zip 存档?
【发布时间】:2014-09-22 09:52:21
【问题描述】:

我正在使用以下代码动态生成多个 csv 文件:

import csv
fieldnames = ['foo1', 'foo2', 'foo3', 'foo4']
with open(csvfilepath, 'wb') as csvfile:
    csvwrite = csv.DictWriter(csvfile, delimiter=',', fieldnames=fieldnames)
    csvwrite.writeheader()
    for row in data:
        csvwrite.writerow(row)

为了节省空间,我想压缩它们。
使用gzip 模块非常简单:

with gzip.open("foo.gz", "w") as csvfile :
    csvwrite = csv.DictWriter(csvfile, delimiter=',', fieldnames=fieldnames)
    csvwrite.writeheader()
    for row in data:
        csvwrite.writerow(row)

但我想要 'zip' 格式的文件。

我尝试了zipfile 模块,但无法直接将文件写入 zip 存档。

相反,我必须将 csv 文件写入磁盘,使用以下代码将它们压缩为 zip 文件,然后删除 csv 文件。

with ZipFile(zipfilepath, 'w') as zipfile:
    zipfile.write(csvfilepath, csvfilename, ZIP_DEFLATED)

如何将 csv 文件直接写入类似于 gzip 的压缩 zip?

【问题讨论】:

  • @J.F.Sebastian 感谢您的评论。更新
  • 哇,使用 gzip 就是这么简单!在 Py3 上,我必须使用它来将字符串转换为字节,然后才能启动 csv.writer 并写出 csv_out_file = io.TextIOWrapper(outfile, encoding='utf-8', newline='', write_through=True)

标签: python csv gzip zipfile


【解决方案1】:

使用cStringIO.StringIO对象模仿文件:

with ZipFile(your_zip_file, 'w', ZIP_DEFLATED) as zip_file:
    string_buffer = StringIO()
    writer = csv.writer(string_buffer)

    # Write data using the writer object.

    zip_file.writestr(filename + '.csv', string_buffer.getvalue())

【讨论】:

  • 酷。感谢您的快速回答。只需稍加修改即可完成。请检查我的答案。
  • 在 Python 3 中,这已移至 io.StringIO
【解决方案2】:

感谢 kroolik 几乎没有修改就完成了。

with ZipFile(your_zip_file, 'w', ZIP_DEFLATED) as zip_file:
    string_buffer = StringIO()
    csvwriter = csv.DictWriter(string_buffer, delimiter=',', fieldnames=fieldnames)
    csvwrite.writeheader()
    for row in cdrdata:
        csvwrite.writerow(row)
    zip_file.writestr(filename + '.csv', string_buffer.getvalue())

【讨论】:

  • 注意:StringIO() 在内存中累积数据。如果未压缩的数据无法放入内存,则不太适合。
  • @J.F.Sebastian 感谢您的评论。你能推荐更好的选择吗?
  • @J.F.Sebastian 谢谢,但我使用的是“zip”格式,因为我打算在 Windows 上使用这个文件。有没有像 zip 这样的 windows 常用格式?
  • 我知道7z 也可以在 Windows 上运行,它支持多种格式。
猜你喜欢
  • 1970-01-01
  • 2011-04-27
  • 2020-07-10
  • 2011-10-31
  • 1970-01-01
  • 1970-01-01
  • 2013-03-01
  • 1970-01-01
  • 2019-02-25
相关资源
最近更新 更多