【发布时间】:2016-03-12 16:50:03
【问题描述】:
我有一个数据框,我想用另一个数据框中的值替换一列中的值。
df = pd.DataFrame({'id1': [1001,1002,1001,1003,1004,1005,1002,1006],
'value1': ["a","b","c","d","e","f","g","h"],
'value3': ["yes","no","yes","no","no","no","yes","no"]})
dfReplace = pd.DataFrame({'id2': [1001,1002],
'value2': ["rep1","rep2"]})
我需要使用带有公共键的 groupby,而当前的解决方案是使用循环。使用 .map(apply) 等是否有更优雅(更快)的方法来执行此操作?我想最初使用 pd.update(),但似乎不是正确的方法。
groups = dfReplace.groupby(['id2'])
for key, group in groups:
df.loc[df['id1']==key,'value1']=group['value2'].values
输出
df
id1 value1 value3
0 1001 rep1 yes
1 1002 rep2 no
2 1001 rep1 yes
3 1003 d no
4 1004 e no
5 1005 f no
6 1002 rep2 yes
7 1006 h no
【问题讨论】:
-
我建议您使用@JohnE 的解决方案,因为它比我的更优雅