【发布时间】:2017-08-12 03:37:24
【问题描述】:
我想获得以下问题的输出。 我有以下数据类型:
id start end count Time Train
001 Paris London 01 05:00 Yes
001 Paris London 01 05:00 Yes
002 Prague Vienna 15 15:00 No
003 Frankfurt London 01 17:00 Yes
015 Paris London 08 21:00 No
019 Barcelona Vienna 15 15:00 No
003 Frankfurt London 01 07:00 Yes
002 Prague Vienna 15 05:00 No
我想找到按 id 分组的计数总和。还要忽略具有相同 id、start 和 end 的行。另外我有一个 4 GB 的数据,我想找到前 5 个计数的开始和结束城市。谢谢。
我希望得到与此类似的数据的输出,
Prague -> Vienna Count : 15
Barcelona -> Vienna count : 15
Paris --> london Count : 09
Frankfurt -> London Count: 02
.....
【问题讨论】:
标签: pandas