【发布时间】:2020-05-17 11:00:30
【问题描述】:
我有一个任务,我需要用重复记录清理我的数据,但同时用 nan 用具有相同名称的记录的值填充这些单元格,例如:
id id2 name other_n date country
1.177.002 nan test_name nan 8 decembre 1981 usa
1.177.002 A test_name ALVA nan nan
到目前为止,我尝试了正常的 groupby,但没有得到我预期的结果
tst.groupby('name').mean()
tst.groupby('name').sum()
我正在寻找的结果应该是这样的:
id id2 name other_n date country
1.177.002 A test_name ALVA 8 decembre 1981 usa
【问题讨论】:
-
当数据重复时,其他列中的值是否会发生冲突,还是始终保证为
NaN或唯一的非空值(每个名称)? -
@ALollz 它总是保证为 NaN,
-
使用“第一”作为您的聚合