【发布时间】:2020-02-28 08:42:43
【问题描述】:
我有一个巨大的主数据转储 Excel 文件。我必须定期向它附加数据。要附加的数据存储为 pandas 数据框。有没有办法将此数据附加到主转储文件而无需读取其内容。
转储文件很大,程序加载文件需要相当长的时间(使用 pandas)。
我已经尝试过 openpyxl 和 XlsxWriter,但是没有用。
【问题讨论】:
我有一个巨大的主数据转储 Excel 文件。我必须定期向它附加数据。要附加的数据存储为 pandas 数据框。有没有办法将此数据附加到主转储文件而无需读取其内容。
转储文件很大,程序加载文件需要相当长的时间(使用 pandas)。
我已经尝试过 openpyxl 和 XlsxWriter,但是没有用。
【问题讨论】:
不可能像文本文件一样只附加到 xlsx 文件。 xlsx 文件是 Zip 容器中 XML 文件的集合,因此要附加数据,您需要解压缩文件、读取 XML 数据、添加新数据、重写 XML 文件,然后重新压缩它们。
这实际上就是 OpenPyXL 所做的。
【讨论】: