【发布时间】:2019-11-25 10:10:13
【问题描述】:
我有两个 data.tables。如果dfA 中的year 对应于year 一年前 在dfB .
例如,dfB 的第一行将与 dfA 的第一行合并,因为 dfB 的年份 2009 比 dfA 的年份 2010 早一年。
library(data.table)
dfA <- fread("
A B C D E F G Z iso year matchcode
1 0 1 1 1 0 1 0 NLD 2010 NLD2010
2 1 0 0 0 1 0 1 NLD 2014 NLD2014
3 0 0 0 1 1 0 0 AUS 2010 AUS2010
4 1 0 1 0 0 1 0 AUS 2006 AUS2006
5 0 1 0 1 0 1 1 USA 2008 USA2008
6 0 0 1 0 0 0 1 USA 2010 USA2010
7 0 1 0 1 0 0 0 USA 2012 USA2012
8 1 0 1 0 0 1 0 BLG 2008 BLG2008
9 0 1 0 1 1 0 1 BEL 2008 BEL2008
10 1 0 1 0 0 1 0 BEL 2010 BEL2010
11 0 1 1 1 0 1 0 NLD 2010 NLD2010
12 1 0 0 0 1 0 1 NLD 2014 NLD2014
13 0 0 0 1 1 0 0 AUS 2010 AUS2010
14 1 0 1 0 0 1 0 AUS 2006 AUS2006
15 0 1 0 1 0 1 1 USA 2008 USA2008
16 0 0 1 0 0 0 1 USA 2010 USA2010
17 0 1 0 1 0 0 0 USA 2012 USA2012
18 1 0 1 0 0 1 0 BLG 2008 BLG2008
19 0 1 0 1 1 0 1 BEL 2008 BEL2008
20 1 0 1 0 0 1 0 BEL 2010 BEL2010",
header = TRUE)
dfB <- fread("
A B C D H I J K iso year matchcode
1 0 1 1 1 0 1 0 NLD 2009 NLD2009
2 1 0 0 0 1 0 1 NLD 2014 NLD2014
3 0 0 0 1 1 0 0 AUS 2011 AUS2011
4 1 0 1 0 0 1 0 AUS 2007 AUS2007
5 0 1 0 1 0 1 1 USA 2007 USA2007
6 0 0 1 0 0 0 1 USA 2010 USA2010
7 0 1 0 1 0 0 0 USA 2013 USA2013
8 1 0 1 0 0 1 0 BLG 2007 BLG2007
9 0 1 0 1 1 0 1 BEL 2009 BEL2009
10 1 0 1 0 0 1 0 BEL 2012 BEL2012",
header = TRUE)
我想过尝试:
dfA <- merge(dfA , dfB, on =.(iso, year == year-1), all.x = TRUE, allow.cartesian=FALSE)
但这会在年份上产生匹配,这不是我想要的。
我相信roll 也会尝试找到最接近的匹配项。
我应该如何编写这个合并?
期望的输出:
library(data.table)
dfA <- fread("
A B C D E F G Z H I J K year_from_B iso year matchcode
1 0 1 1 1 0 1 0 1 0 1 0 2009 NLD 2010 NLD2010
2 1 0 0 0 1 0 1 NA NA NA NA NA NLD 2014 NLD2014
3 0 0 0 1 1 0 0 NA NA NA NA NA AUS 2010 AUS2010
4 1 0 1 0 0 1 0 NA NA NA NA NA AUS 2006 AUS2006
5 0 1 0 1 0 1 1 NA NA NA NA NA USA 2008 USA2008
6 0 0 1 0 0 0 1 NA NA NA NA NA USA 2010 USA2010
7 0 1 0 1 0 0 0 NA NA NA NA NA USA 2012 USA2012
8 1 0 1 0 0 1 0 0 0 1 0 2007 BLG 2008 BLG2008
9 0 1 0 1 1 0 1 NA NA NA NA NA BEL 2008 BEL2008
10 1 0 1 0 0 1 0 1 1 0 1 2009 BEL 2010 BEL2010
11 0 1 1 1 0 1 0 1 0 1 0 2009 NLD 2010 NLD2010
12 1 0 0 0 1 0 1 NA NA NA NA NA NLD 2014 NLD2014
13 0 0 0 1 1 0 0 NA NA NA NA NA AUS 2010 AUS2010
14 1 0 1 0 0 1 0 NA NA NA NA NA AUS 2006 AUS2006
15 0 1 0 1 0 1 1 NA NA NA NA NA USA 2008 USA2008
16 0 0 1 0 0 0 1 NA NA NA NA NA USA 2010 USA2010
17 0 1 0 1 0 0 0 NA NA NA NA NA USA 2012 USA2012
18 1 0 1 0 0 1 0 0 0 1 0 2007 BLG 2008 BLG2008
19 0 1 0 1 1 0 1 NA NA NA NA NA BEL 2008 BEL2008
20 1 0 1 0 0 1 0 1 1 0 1 2009 BEL 2010 BEL2010",
header = TRUE)
【问题讨论】:
-
@sindri_baldur 谢谢,但这不是我的意思。我不想添加行。我想为“match-1year”的行添加列。我将添加所需的输出。我
标签: r merge data.table