【发布时间】:2020-11-27 08:46:47
【问题描述】:
我有这样的数据框:更改了发布标签:您可以看到。 SSN、学生证和驾照将是唯一的。我如何在 Python (PD/NP) 中做到这一点
Name SSN Student_ID DrivingLicenseNumber
Smith None 1234 DL1234
Smith None None DL1234
Smith 2222 1234 None
None 2222 None None
您可以注意到,对于 Simith,并非所有值都出现在每一行中。我正在尝试为 smith 找到 one 行,如下所示。任何指针将不胜感激。我知道我可以加载到 MySQL 并执行此操作,但无法在 DF 中找到最佳方式。
None SSN Student_ID DrivingLicenseNumber
Smith 2222 1234 DL1234
【问题讨论】:
-
@Sushanth
groupby.first不适用于None。 -
将
groupby.first与fillna结合起来。 -
@sadeepkadapa 是的即将编辑,在此之前将
None替换为NaNstackoverflow.com/a/52488608/4985099 -
我可以使用 df = df.replace( {np.nan: None} ) 类型函数将 None 更改为 NaN 或空字符串。