【发布时间】:2022-01-13 20:13:37
【问题描述】:
我正在尝试根据标识符填充包含重复元素的数据框。 我的数据框如下:
Code Value
0 SJHV
1 SJIO 96B
2 SJHV 33C
3 CPO3 22A
4 CPO3 22A
5 SJHV 33C #< -- Numbers stored as strings
6 TOY
7 TOY #< -- These aren't NaN, they are empty strings
仅当存在非空“值”行时,我想删除空的“值”行。为了清楚起见,我希望我的输出看起来像:
Code Value
0 SJHV 33C
1 SJIO 96B
2 CPO3 22A
3 TOY
我的尝试如下:
df['Value'].replace('', np.nan, inplace=True)
df2 = df.dropna(subset=['Value']).drop_duplicates('Code')
正如预期的那样,此代码还删除了“TOY”代码。有什么建议吗?
【问题讨论】:
标签: python python-3.x pandas