【问题标题】:How to remove snps with missing names如何删除缺少名称的 snps
【发布时间】:2018-04-11 09:29:20
【问题描述】:

我有 1000 G 的 PLINK 格式数据集,有一些名称为 "." 的 snps,在 PLINK 中有什么方法可以删除该 snps?

我尝试了无法正常工作的 bcftool 视图。

【问题讨论】:

  • 您是否尝试过选项--exclude my_snps.txt,其中my_snps.txt 包含您要排除的SNP 的名称,例如"."
  • 如何过滤名称为“.”的 SNP? PLINK 中是否有任何直接命令,或者我应该尝试其他方法?
  • --exclude 记录在 PLINK 网站 here 上。您应该只需要一列文本,每个 SNP 一行。在您的情况下,一行应该完全包含 .

标签: genetics bcftools


【解决方案1】:

执行以下命令

 plink --bfile $YOUR_GENOTYPE_FILE --extract SNPS_TO_EXCLUDE.txt --make-bed --out $NEW_GENOTYPE_FILE

$ 变量是您想要的 PLINK BED/BIM/BAM 文件前缀。

SNPS_TO_EXCLUDE.txt 是什么样的?来自PLINK website

--extract 通常接受带有变体 ID 列表的文本文件(通常每行一个,但它们可以只用空格分隔),并从当前分析中删除所有未列出的变体。

--exclude 对所有列出的变体执行相同的操作。

因此,SNPS_TO_EXCLUDE.txt 应该包含带有“.”的行。

【讨论】:

  • 谢谢!全部排序
  • 很高兴听到!如果这回答了您的问题,那么请接受答案
猜你喜欢
  • 2021-04-29
  • 2020-08-12
  • 2021-03-26
  • 1970-01-01
  • 2020-07-01
  • 2015-10-18
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多