【发布时间】:2019-12-05 15:52:13
【问题描述】:
我有一个如下所示的数据框:
ID Gene Tier Consequence
1314 ABC TIER1 missense
1314 PKD1 TIER1 frameshift
6245 BJD TIER1 splice_site_variant
1314 ADAMST TIER3 stop_gain
7631 PKD2 TIER1 missense
7631 BFH TIER2 stop_gain
5336 PKD1 TIER3 missense
1399 PKD1 TIER2 non-coding
我想对表进行子集化,以便在满足条件时删除所有具有相关 ID 的行。
如果存在基因 PKD1 或 PKD2 的行且层级为 TIER1 或“错义”出现在 PKD1 或 PKD2 是基因的行的结果部分,我想删除所有实例对应的身份证。 IE 结果表应如下所示:
ID Gene Tier Consequence
6245 BJD TIER1 splice_site_variant
1399 PKD1 TIER2 non-coding
我在使用 R 的 HPC 上的气闸中工作,因此进出 R 工具很棘手(dplyr 等),因此非常感谢使用内置 R 工具的解决方案。
非常感谢
【问题讨论】:
-
@A.S.K.那是因为我是个白痴,没有给你一个很好的例子。我已将其更新为更清楚一点对不起!我添加了 ID 1399,虽然它有 PKD1,但它是 TIER2,不是错义,所以不会被过滤。道歉。