【发布时间】:2018-03-29 01:56:28
【问题描述】:
以下是我的数据框示例:
revisionId | itemId | wikidataType
290397666 | 23 | Q5
307190482 | 23 | Q5
292002833 | 80 | Q5
292428272 | 80 | Q5
305018745 | 80 | Q5
305018964 | 80 | Q5
305019084 | 80 | Q5
301731639 | 181 | Q5
303692414 | 181 | Q5
306600439 | 192 | Q5
294596767 | 206 | Q5
294597048 | 206 | Q5
我想使用 itemId 列对元素进行分组,并为每个具有最大 revisionId 的项目返回一行。我已经根据 wikidataType、itemId 和 revisionId 对它们进行了排序。以下是我希望我的数据框的样子:
revisionId | itemId | wikidataType
307190482 | 23 | Q5
305019084 | 80 | Q5
303692414 | 181 | Q5
306600439 | 192 | Q5
294597048 | 206 | Q5
此外,这里 wikidataType 列仅包含一个值“Q5”。但在整个数据框中,有 100 种不同的类型。但这可能不是问题,因为我可以迭代这 100 种类型,因为我已经修复了它们的值。有人对此有想法吗? 提前致谢。
【问题讨论】:
标签: python pandas sorting dataframe group-by