【发布时间】:2021-04-21 00:25:58
【问题描述】:
我有 2 个具有不同信息的数据帧(两个数据帧中只有 1 列相同:subject)。此外,其中一个数据框比另一个更长(更多列和更多行)。
所以,我有这样的事情:
# drataframe 1
subject var1 var2
101 A B
102 C D
103 E F
...
# dataframe 2
subject varW varX varY varZ
101 1 2 1 4
101 2 1 1 4
101 4 1 1 4
102 2 1 2 5
102 1 1 2 5
102 2 4 2 5
103 2 3 3 1
103 1 2 3 1
103 4 1 3 1
请注意,每个主题在数据框 2 中重复多次,而在数据框 1 中,每个主题只出现一次。
我想要做的是将列 varY 和 varZ 附加到数据框 1。
我尝试使用select(选择这两列)然后inner_join(加入两个数据框)。但是,我为每个主题得到 3 行,因为每个主题在数据框 2 中重复 3 次。我希望数据框 1 中的每个主题在加入后只有 1 行,因为 varY 和 @ 中只有一个值每个主题987654328@。
换句话说,这将是我想要的输出:
subject var1 var2 varY varZ
101 A B 1 4
102 C D 2 5
103 E F 3 1
【问题讨论】: