【发布时间】:2020-10-07 04:09:41
【问题描述】:
我需要删除每个组的最后一个成员,因为它会打乱进一步的计算。我不知道如何更好地解释我的问题,但如果您需要进一步说明,请询问。
我当前的代码:
sampleDataUser = sampleData.groupby('user').filter(lambda x: x != sampleDataUser.tail(1))
返回此错误:
ValueError: Can only compare identically-labeled DataFrame objects
样本数据:
df = [{ "user" : "seth", var1 = "5"}, {"user": "seth", "var1" : "8"}, {"user" : "chris", "var1" : "2"}]
预期输出:
df = [{ "user" : "seth", var1 = "5"}, {"user" : "chris", "var1" : "2"}]
【问题讨论】:
-
也许您只想保留每个用户的第一行:
df.drop_duplicates('user', keep='first')?
标签: python pandas pandas-groupby