【发布时间】:2020-06-09 15:23:04
【问题描述】:
我有一个 pandas df,其中有一列用于 Names,两列用于 2 个可能的出生年份。如果至少有一个出生年份列匹配,我想按姓名和出生年份分组。
FullName BirthYr1 BirthYr2
Smith, Joe 1985 1986
Dolan, Tom 1991 1992
Smith, Alex 1984 1985
Smith, Joe 1984 1985
Dolan, Tom 1991 1992
Smith, Alex 1986 1987
BirthYr2 总是比 BirthYr1 多 1。
2 'Smith, Joe' 将被分组,因为他们都有 1985 年(1 场比赛),2 'Dolan, Tom' 将被分组,因为两列相同(2 场比赛),而 2 ' Smith, Alex' 将不会被分组,因为他们没有任何匹配项。
一旦我弄清楚这一点,我计划使用 ngroup() 为每个组分配一个唯一的 ID。
【问题讨论】: