【发布时间】:2016-10-11 21:50:14
【问题描述】:
我有以下问题: 我想在 GRanges (gr3) 给出的区间两侧找到 (chr1_gene) 中的下一个 5 基因,并生成一个数据帧,其中包含区间的 chr 起始端(来自 gr3)和每个 ensembl_transcript_id 的 i 列,最终为 NA。
非常感谢您的建议!
df <- data.frame(chrom=c("chr1","chr1"), start=c(5087459, 9995206 ), end=c(5097899, 10015020 ))
gr3 <- as(df, "GRanges")
library(biomaRt)
ensembl = useEnsembl(biomart="ensembl", dataset="hsapiens_gene_ensembl")
chr1_genes <- getBM(attributes=c('ensembl_gene_id',
'ensembl_transcript_id','hgnc_symbol','chromosome_name','start_position','end_position'), filters =
'chromosome_name', values ="1", mart = ensembl)
head(chr1_gene)
ensembl_gene_id ensembl_transcript_id hgnc_symbol chromosome_name start_position end_position
1 ENSG00000231510 ENST00000443270 1 5086459 5090899
2 ENSG00000162444 ENST00000315901 RBP7 1 9997206 10016020
3 ENSG00000162444 ENST00000294435 RBP7 1 9997206 10016020
4 ENSG00000270171 ENST00000602640 1 7693124 7694844
5 ENSG00000225643 ENST00000412797 1 25581478 25590356
6 ENSG00000116497 ENST00000530710 S100PBP 1 32816767 32858879
【问题讨论】: