根据条件替换不同文件中的字符串答案

【问题标题】：Replace strings from different files according to condition根据条件替换不同文件中的字符串
【发布时间】：2019-03-31 02:03:43
【问题描述】：

我是 Python 编码的新手，但遇到了有关 csv 文件数据操作的问题。

基本上，我有 2 个 csv 文件导入，这要归功于它们看起来像的 pd.read_csv

我想用 df2 中关于 'NBIMAGE' 的句子替换 df1 中的句子，并保存第三个名为 df3 的 csv（或者只是将 df1 的修改版本保存为 df1 而没有新文件）

换句话说，只要 df1 中的'NBIMAGE' = df2 中的'NBIMAGE'（即使行不同），它应该将 df1 中该行的 SENTENCE 替换为 df2 中具有相同“NBIMAGE”的句子

我所做的是

df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

df1['newcolumn'] = 
np.where (df1['NBIMAGE'] == df2['NBIMAGE'], df2['SENTENCE'], 0)

但它输出一个 ValueError: Can only compare identically-labeled Series objects

我不想使用替换，因为我需要指定要替换的内容，但我认为使用 numpy 处理字符串也不是最好的解决方案......

希望您能理解我的问题，并感谢大家的帮助！

【问题讨论】：

【解决方案1】：

df3 = df1.drop('SENTENCE',axis=1).merge(df2[['NBIMAGE','SENTENCE']],how='left', on='NBIMAGE')

【讨论】：