【发布时间】:2015-11-06 22:19:12
【问题描述】:
我有一个如下的data.frame:
SNP A1 A2 EFF FRQ
rs12565286 C G -0.00225985777786465 .04354
rs11804171 A T -0.00530020318295282 .04485
rs3094315 C T -0.0042551489236695 .8364
rs12562034 A G -0.00911972489527125 .09763
rs12124819 G A 0.0250148724382224 .7744
rs2980319 A T 0.0178927256033542 .1306
rs4040617 A G -0.0173263263037023 .8707
我想删除任何具有 A1-A2 对的 C-G、G-C、A-T 或 T-A 的行。
例如,由于第一行有 A1 = C 和 A2 = G,我想删除该行。我还想删除第二行,因为它是 A-T 对。第三行是AG对,很好,我想保留它。
我想要的输出:
SNP A1 A2 EFF FRQ
rs3094315 C T -0.0042551489236695 .8364
rs12562034 A G -0.00911972489527125 .09763
rs12124819 G A 0.0250148724382224 .7744
rs4040617 A G -0.0173263263037023 .8707
【问题讨论】:
-
要排除不明确的 SNP,请查看 snpflip。
标签: r dataframe bioinformatics