【发布时间】:2015-07-12 15:44:57
【问题描述】:
有没有办法在大约 10 列和 400,000 行的 pandas 数据框中有条件地删除重复项(特别是使用 drop_duplicates)?也就是说,我想让所有有 2 列的行都满足一个条件:如果 date (column) 和 store (column) # 的组合是唯一的,则保留行,否则,丢弃。
【问题讨论】:
-
你试过什么?有最终方便的
if语句,但是是的,这可能会有点混乱。您是否检查过文档中是否有此方法? -
发布示例数据和预期输出总是有帮助的。
-
是的,我正在研究如何发布一些示例数据。
-
如果您需要代码格式化,只需缩进四个空格,或者只是复制粘贴它,我们中的一位将为您修复它(特别是如果它有大量数据)。 :)
标签: python python-2.7 numpy pandas dataframe