【问题标题】:how to retrieve UCSC refseq genes in R bioconductor如何在 R bioconductor 中检索 UCSC refseq 基因
【发布时间】:2014-01-21 06:36:24
【问题描述】:

我正在分析一些 ChIP-seq 数据,并且能够使用基因组浏览器检索与每个芯片化染色体区域相关的序列元素。在解析和搜索特定主题后,我最终得到如下输出:

head (chr.reg)
 [,1]                      
 [1,] "chr1:181030981-181032670"
 [2,] "chr3:55709147-55709901"  
 [3,] "chr3:119813410-119814934"
 [4,] "chr4:185201060-185205420"
 [5,] "chr4:39610956-39611545"  
 [6,] "chr6:126253238-126253636"

这些染色体区域中的每一个都包含一个我感兴趣的转录因子基序。

我的问题如下: 有没有一种方法可以检索与这些区域中的每一个相关的 refseq 基因名称?我试图研究生物导体包,但我找不到任何一个,或者我只是忽略了一个!有人知道可以帮助我解决此问题的特定软件包吗?

提前致谢:)

【问题讨论】:

    标签: r bioconductor


    【解决方案1】:

    我相信答案就在ChIPpeakAnno 包中。 这是一个示例代码:

      require(ChIPpeakAnno)
      peak <- RangedData(space="chr4", IRanges(39610956, 39611545))#chromosome start, end
      data (TSS.human.GRCh37)
      ap <- annotatePeakInBatch(peak,Annotation=TSS.human.GRCh37 , PeakLocForDistance="end")
    

    输出如下所示:

    > ap
    
    RangedData with 1 row and 9 value columns across 1 space
                     space               ranges |        peak      strand
                  <factor>            <IRanges> | <character> <character>
    1 ENSG00000163683        4 [39610956, 39611545] |           1           -
                          feature start_position end_position insideFeature
                      <character>      <numeric>    <numeric>   <character>
    1 ENSG00000163683 ENSG00000163683       39552535     39640513        inside
                  distancetoFeature shortestDistance fromOverlappingOrNearest
                          <numeric>        <numeric>              <character>
    1 ENSG00000163683             28968            28968             NearestStart
    

    检索 ENSEMBL id 的 refseq 或基因符号:

    require (org.Hs.eg.db)
    gene.anno <- select(org.Hs.eg.db, keys= ap$feature,keytype = "ENSEMBL", columns=c("ENSEMBL",        
    "SYMBOL"))
    

    检索到的基因:

    > gene.anno
          ENSEMBL     ENTREZID SYMBOL       
    1 ENSG00000163683   201895 SMIM14 
    

    【讨论】:

      猜你喜欢
      • 2017-02-01
      • 2020-09-23
      • 1970-01-01
      • 2011-10-29
      • 2020-09-08
      • 1970-01-01
      • 2011-02-16
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多