【发布时间】:2019-11-13 00:56:34
【问题描述】:
我有一个表在连续的行中有重复的行。具有相同“id”的行在其他列中应该有重复的数据。但是很少有数据不正确的行。例如 -
id Name Age
1 Ram 12
1 Ram 10
2 Shyam 11
2 Yam 11
3 Ravi 23
3 Ravi 23
4 Harsh 34
4 Harsh 34
我需要知道连续行的列不同的列。
我需要的最终输出 -
id Name Age DifferentColumn
1 Ram 12
1 Ram 10 Age
2 Shyam 11
2 Yam 11 Name
3 Ravi 23
3 Ravi 23
4 Harsh 34
4 Krish 54 Name,Age
我可以为此使用“petl”或“pandas”,但我的方法应该是什么?
【问题讨论】:
-
3 Ravi 23也应该是姓名和年龄吧?还是按 id 分组? -
不,两行都有重复数据。所以,是正确的
-
所以每 2 行分组对吗?
-
是的,两行分组
标签: python-3.x pandas dataframe petl