【发布时间】:2018-05-05 16:24:22
【问题描述】:
我知道这可能是老生常谈,但在 pandas.drop 和 python del 函数中,哪个在性能方面优于大型数据集?
我正在使用 python 3 学习机器学习,但不确定该使用哪一个。我的数据采用pandas 数据框格式。但是python del 函数在built-in function for python。
【问题讨论】:
-
我会建议使用drop,因为它很容易实现一次drop多列。 df.drop(['A','B'])
-
@Wen 实现多列 drop 不是我关心的问题,但对于较大的数据集,如果我只需要删除一列,drop 会比 del 表现更好,反之亦然?
-
@Greg 这就是我正在搜索的内容。非常感谢..我猜删除会从数据帧中释放一些内存,而删除只会在隐藏删除的列的同时返回数据帧,是对还是我缺少什么?
-
@sagarjain 你可以通过传递
df.drop(<whatever>, inplace=True)使.drop方法就地工作。我认为不会有性能差异。如果您是古玩,就不能进行测试吗?
标签: python python-3.x pandas