【问题标题】:Retrieving GWAS information with R使用 R 检索 GWAS 信息
【发布时间】:2011-10-11 09:24:48
【问题描述】:

我正在尝试从GWAS catalog 获取特定的疾病相关信息。这可以通过电子表格下载直接从网站上完成。但我想知道是否可以在 R 中以编程方式完成。任何建议将不胜感激。

谢谢。

Avoks

【问题讨论】:

    标签: r genetics


    【解决方案1】:

    检查函数 download.file() 和包 rcurl (http://cran.r-project.org/web/packages/RCurl/index.html) - 这应该可以满足您的需求

    【讨论】:

    • 谢谢 Rainer,我会去看看。
    【解决方案2】:

    您必须先下载 .tsv 文件并手动编辑它们。 这是因为 GWAS 目录文件包含 HTML 符号,如“白塞病”中的 §(定义特殊的第四个字母)。这些符号中的 # 将被 R 解释为行尾,因此您将收到错误消息,例如:

    第 2028 行没有 34 个元素

    所以你先下载它,在纯文本编辑器中打开,自动将每个 # 替换为空字符,然后才将其加载到 R 中:

    read.table("gwas_catalog_v1.0-associations_e91_r2018-02-21.tsv",sep="\t",h=T,stringsAsFactors = F,quote="")

    【讨论】:

      猜你喜欢
      • 2021-02-11
      • 2021-09-08
      • 2021-12-14
      • 1970-01-01
      • 2013-05-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多