Python Pandas：子集 DataFrame 时的内存问题答案

【问题标题】：Python Pandas: memory issue when subsetting a DataFramePython Pandas：子集 DataFrame 时的内存问题
【发布时间】：2018-05-06 15:59:06
【问题描述】：

我正在使用一些大的pandas DataFrame。我意识到在将一个 DataFrame 的子集分配给自身时，内存使用量（在 Win Task Manager 中监控）并没有减少。例如，如果有一个大的DataFrame df 大约占用10GB 内存，则在执行如下操作后：

df = df[df['v1']==1]

甚至

df = df.loc[0:10]

任务管理器中的内存使用行根本不会改变。

我已经搜索了一段时间并在这里和那里阅读了一些帖子 - 但找不到可以理解的原因或解决方案。任何帮助表示赞赏！

有没有办法减少内存使用？我读了一些帖子，建议一开始就少读一些数据，但在我的情况下，这个解决方案似乎相当困难。

【问题讨论】：

【解决方案1】：

对我有用的一个解决方案是在原地一一删除每一列/行。

for x in range(0,10):
    df.drop(x, inplace=True, axis=0)

【讨论】：