【问题标题】:R- Column match, create new column with another column of corresponding value [duplicate]R-列匹配,用对应值的另一列创建新列[重复]
【发布时间】:2020-09-23 11:35:58
【问题描述】:

我有两个数据框:

df1<- data.frame(place=c("KARACA ADANA","ASIL BOLU","GAZIANTEP","YUKARI/MERSIN"))
df2<- data.frame(city=c("ADANA","BOLU","ANTEP","MERSIN"), neighbor=c("KARACA","ASIL","GAZI","YUKARI"))

我需要匹配列 df1$place 和 df2$neighbor。如果 df1$place 包含 df2$neighbor 中的单词,它应该通过复制 df2$city of match 的相应值来为 df1$newcol 创建一个新列。

df1$newcol <- data.frame(place=c("KARACA ADANA","ASIL BOLU","GAZIANTEP","YUKARI/MERSIN") ,city=c("ADANA","BOLU","ANTEP","MERSIN"))

【问题讨论】:

    标签: r match string-matching


    【解决方案1】:

    这是使用来自 base R 的sapply 的方法:

    如果您只想匹配整个单词,您可以使用正则表达式。 \\b 查找单词边界。

    ind <- unlist(sapply(df2$neighbor, function(x) grep(paste0("\\b",x,"\\b"),df1$place)))
    ind2 <- rep(1:length(df2$neighbor),
                times = sapply(df2$neighbor, function(x) length(grep(paste0("\\b",x,"\\b"),df1$place))))
    df1$newcol <- NA
    df1$newcol[ind] <- as.character(df2$city[ind2])
    df1
    #          place newcol
    #1  KARACA ADANA  ADANA
    #2     ASIL BOLU   BOLU
    #3     GAZIANTEP   <NA>
    #4 YUKARI/MERSIN MERSIN
    #5 YUKARI/MERSIN MERSIN
    #6     GAZIANTEP   <NA>
    #7     ASIL BOLU   BOLU
    #8  KARACA ADANA  ADANA
    

    样本数据

    df1<- data.frame(place=c(c("KARACA ADANA","ASIL BOLU","GAZIANTEP","YUKARI/MERSIN"),
                             rev(c("KARACA ADANA","ASIL BOLU","GAZIANTEP","YUKARI/MERSIN"))))
    

    【讨论】:

    • 这真的有效!非常感谢
    • 我刚刚意识到,当匹配列之间存在订单时,此代码有效,如果没有订单怎么办。这种情况我该怎么办
    • 很抱歉,我还有一个问题。 df1 和 df2 的长度不同。因此,编辑后的代码也不起作用
    • 是的,它在 df1$newcol[ind]
    • 这次有效 :) 你救了我的命,非常感谢
    【解决方案2】:

    试着这样做

    library(tidyverse)
    df1 %>% 
      rowwise() %>% 
      mutate(out = df2$city[str_which(place, df2$city)])
    

    【讨论】:

    • 请在您的代码中添加一些解释
    • 允许只回答代码,但也鼓励解释答案。考虑添加一些解释。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-28
    • 2016-09-26
    • 2021-02-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多