【发布时间】:2017-11-14 16:49:08
【问题描述】:
我有一个如下所示的数据框:
chr alleles position
2 [A/T] 123456
3 [C/T] 5678910
8 [A/G] 8765435334
我想将每一行加载到变量中,例如:
library('BSgenome.Hsapiens.UCSC.hg19')
chr <- 'chr2'
alleles <- '[T/C]'
position <- 123456
offset <- 60
然后迭代地使用它们:
seq <- paste(getSeq(Hsapiens,chr,position-offset,position-1),
+ alleles,
+ getSeq(Hsapiens,chr,position+1,position+offset),
+ sep='')
最后将输出作为另一个数据框包含:
chr allele position seq
2 [A/T] 123456 "ACTTGGAGATTTGGAGGAAGCTCCAGAGAGAGAGAGGCTTCCCAGCGTGGACTTGAAAGA[A/T]GAAACCAGCATAGATAGCACCGTGAATGGTGAGTTGGAATTCCTGGTTTCACTTTTGTTA"
我已阅读 this thread,但很欣赏不需要索引的解决方案!
【问题讨论】:
-
getSeq()是来自加载的包(在这种情况下,是哪个?)还是您创建的函数(在这种情况下,您可以将该函数的源代码添加到您的问题中)? -
另外,
Hsapiens是您的数据框的名称吗? -
@Phil 为混淆道歉,是的,getSeq 来自
BSgenome.Hsapiens.UCSC.hg19库,Hsapiens是加载包的属性。 -
您能否更新您想要的输出以包含除列名之外的一些数据?
-
@seeellayewhy,感谢您的评论。我编辑了结果部分!
标签: r dataframe row bioconductor