【发布时间】:2019-02-27 06:14:41
【问题描述】:
我有两个数据集如下
full.name 是一列,全名的第一个是 df1 中 full.name 和 country 的第一个单词不正确,所以我想将 df1(full.name 和 first of full name) 与 column(name )of df2 如果 df1 的两列中的任何一列与 df2 的列匹配,则相应的它应该打印更正的国家值,如果 df1 的全名的 full.nameandfirst 与 df2 的名称不匹配,那么它应该打印值full.nameandfirst of full name and NA in the value of name 和更正的国家
df1:
full.name first of full name country
karachi east karachi pakistan
phu my phu england
phu my phu india
delhi delhi china
west australia west england
west australia west australia
abu dhabai abu xyz
south africa south africa
和
df2:
name corrected.country
karachi pakistan
phu my england
delhi India
west australia australia
abu dubai
我希望我的输出为
full.name first of full name country name corrected country
karachi east karachi pakistan karachi pakistan
phu my phu england phu my england
phu my phu india phu my england
delhi delhi china delhi India
west australia west england west australia australia
west australia west australia west australia australia
abu dhabai abu xyz abu dubai
south africa south africa NA NA
如果任何 df1 列与 df2 (col-name) 匹配,我想匹配 df1 的 full.name 和 first of full name 以匹配 df2 的名称,然后在输出中我想要更正的国家列和名称列,如果有的话df1 列与 df2 的名称列匹配 full.name 或 first of full name
我知道我让这个 lil 有点复杂,但我真的想解决这个问题,请帮忙
【问题讨论】:
-
我认为在提出问题时使用标点符号是一个不错的举措。有很大帮助。并且可能给出您的数据的可重复示例,例如通过使用
dput(head(df1))和df2相同。 -
我确信我不是唯一一个觉得这本书难以阅读的人。您能否发布示例 data.frames(即前几行)和示例输出。
标签: r