【发布时间】:2020-10-10 08:18:41
【问题描述】:
我有两个数据框,我正在尝试根据 MarkerName、Allele1 和 Allele2 合并它们。我的问题是等位基因 1 和等位基因 2 列有时可以翻转并且是不同的情况(即下面两个示例中的第 1 行)。此外,有时 MarkerName 可能会重复(第 3 行和第 4 行)。
以下是示例:
MarkerName id Allele1 Allele2
1: 1:752721 rs3131972 A G
2: 1:791853 rs6684487 G A
3: 1:834056 rs28482280 A C
4: 1:834056 rs28482282 A CAC
5: 1:834059 rs28482242 A C,G
和
MarkerName Allele1 Allele2 Effect
1: 1:752721 g a -0.0018
2: 1:791853 g a 0.0408
3: 1:834056 a c 0.0079
有没有办法将 id 列添加到 R 中的第二个数据框?所以它最终看起来像这样:
MarkerName Allele1 Allele2 Effect id
1: 1:752721 g a -0.0018 rs3131972
2: 1:791853 g a 0.0408 rs6684487
3: 1:834056 a c 0.0079 rs28482280
【问题讨论】:
-
你会想要使用 dplyr,here 是一个基于多列使用 dplyr 连接的链接
-
输出看起来是
data.table(不是data.frame)。