【发布时间】:2011-09-26 04:14:53
【问题描述】:
感谢 diliop 为我之前的问题提出的精彩解决方案。
How to get pair-wise "sequence similarity score" for ~1000 proteins?
为了建立这个答案,我尝试编写一个循环来使用以下代码获取 1000 种蛋白质的所有成对“序列相似性得分”。
for (i in 1:1000){
score <- score(pairwiseAlignment(seqs[[i]]$seq, seqs[[i+1]]$seq, substitutionMatrix=BLOSUM100, gapOpening=0, gapExtension=-5))}
但是,我很难将每个分数转换为data.frame,像这样自动列出所有分数?
seq1 seq2 score
seq1 seq3 score
seq1 seq4 score
....
seq1000 seq1000 score
专家能否给我更多提示如何获得 1000 x 1000 蛋白质?
【问题讨论】:
-
score的结构(str)是什么? -
我将请求解释为如何构建一个 data.frame,它使用函数
score(pairwiseAlignment(...))从seq1和seq2的值计算score