【发布时间】:2020-03-31 08:55:47
【问题描述】:
我有一个 csv 文件,我需要在其中找到最新用户活动不等于 0 的 ID。
输入.csv:
id date userActivity
1 2020-03-30 0
2 2020-03-30 1
3 2020-03-30 0
1 2020-03-29 10
2 2020-03-29 33
3 2020-03-29 0
1 2020-03-28 2
2 2020-03-28 0
3 2020-03-28 9
所需的输出.csv
id date userActivity
1 2020-03-29 10
2 2020-03-30 1
3 2020-03-28 9
到目前为止我的代码:
df = pd.read_csv('path/to/my/input.csv')
activUsr = df.groupby('id').userActivity
df[df['id'].isin(activUsr[activUsr != 0].index)].to_csv('path/to/my/output.csv')
但是,它会抛出以下错误消息:
Exception: Column(s) userActivity already selected
有人可以帮我解决这个问题吗?提前致谢!
【问题讨论】: