【发布时间】:2021-12-08 12:29:06
【问题描述】:
我有 2 个基于相同数据的羽毛文件。唯一的区别是获取数据的方式。
文件 1 有一个查询列表,按月细分,每个查询都保存为单独的文件。然后将每个文件读入字典并在python中与pd.concat(dict[values])连接。
文件 2 是另一个查询列表,分为四个部分,每个部分都保存为单独的文件。然后通过我不熟悉的 R 中的某个过程连接每个文件。
读取两个文件后,我可以看到数据是相同的。相同的行数、总和等。
但是文件 1 是 3GB,文件 2 是 6GB。这是为什么呢?
【问题讨论】: