【发布时间】:2020-08-30 21:30:44
【问题描述】:
我正在处理一个相当大的数据集(10 万行),并希望在 R Studio 中复制 Excel 索引匹配函数。
我正在寻找一种方法来创建一个新列,该列将从现有列(“1995_Number”)中提取一个值,如果来自一年的三个不同列的 3 个值与来自另一年的三个列的三个值匹配 - 独立于行,并创建一个新列(“1994_Number”)。
以数据框为例:
dat <- data.frame(`1994_Address` = c("1234 Road", "123 Road", "321 Road"),
`1994_ZipCode` = c(99999, 99999, 11111),
`1994_Bank Name` = c("JPM", "JPM", "WF"),
`1995_Address` = c("123 Road", "1234 Road", "321 Road"),
`1995_ZipCode` = c(99999, 99999, 11111),
`1995_Bank Name` = c("JPM", "JPM", "WF"),
`1995_Number` = c(1, 2, 3), check.names = F, stringsAsFactors = F)
新创建的列 1994_Number 应该是 (2, 1, 3)
【问题讨论】:
标签: r excel rstudio match matching