【发布时间】:2016-08-23 20:32:19
【问题描述】:
我想加入两个数据框。一些列名重叠,并且在数据框的重叠列之一中有NA 条目。这是一个简化的例子:
df1 <- data.frame(fruit = c('apples','oranges','bananas','grapes'), var1 = c(1,2,3,4), var2 = c(3,NA,6,NA), stringsAsFactors = FALSE)
df2 <- data.frame(fruit = c('oranges','grapes'), var2=c(5,6), var3=c(7,8), stringsAsFactors = FALSE)
我是否可以使用 dplyr 连接函数来连接这些数据框并自动优先处理非NA 条目,以便让“var2”列在连接的数据框中没有NA 条目?就像现在一样,如果我调用left_join,它会保留NA 条目,如果我调用full_join,它会复制行。
示例数据
> df1
fruit var1 var2
1 apples 1 3
2 oranges 2 NA
3 bananas 3 6
4 grapes 4 NA
> df2
fruit var2 var3
1 oranges 5 7
2 grapes 6 8
【问题讨论】: