【发布时间】:2019-08-10 07:38:30
【问题描述】:
我有一个大约 10m 行的文件。每行很可能是唯一的,但我按第 1 列、第 2 列然后第 3 列对文件进行排序。
Column 1 = CODE
Column 2 = DATE
Column 3 = AMOUNT
我只想将第一行保留到下一个日期,依此类推。下面是我所拥有的以及我需要的输出的示例。
Original:
COL1 COL2 COL3
ABA 2019-01-01 100
ABA 2019-01-01 111
ABA 2019-01-02 140
ABA 2019-01-02 150
ABA 2019-01-03 200
ABA 2019-01-03 220
Ouptut needed:
COL1 COL2 COL3
ABA 2019-01-01 100
ABA 2019-01-02 140
ABA 2019-01-03 200
任何人都可以帮助我。试过了
a.drop_duplicates(subset[data.columns[0],data.columns[1],data.columns[2]], keep='first')
【问题讨论】:
-
什么是
a?你的尝试有什么问题?
标签: python pandas sorting duplicates