【发布时间】:2012-06-19 18:28:28
【问题描述】:
我正在尝试计算一长串序列之间的成对差异的数量,并将其放回矩阵形式。这是我想做的一个玩具示例。
library(MiscPsycho)
b <- c("-BC", "ACB", "---") # Toy example of sequences
workb <- expand.grid(b,b)
new <- c(1:9)
# Need to get rid of this for loop somehow
for (i in 1:9) {
new[i] <- stringMatch(workb[i,1], workb[i,2], normalize="NO")
}
workb <- cbind(workb, new)
newmat <- reShape(workb$new, id=workb$Var1, colvar=workb$Var2)
a <- c("Subject1", "Subject2", "Subject3") #Relating it back to the subject ID
colnames(newmat) <- a
rownames(newmat) <- a
newmat
我对使用 apply 函数不是很熟悉,但我想用它来替换 for 循环,考虑到我有大量序列,它可能会变慢。 (stringMatch 函数来自 MiscPsycho)。请告诉我如何提高效率!
非常感谢!
【问题讨论】:
-
有什么方法可以让代码更高效吗?下面的不同解决方案适用于短序列,但我有几百个序列,我正在尝试为它们构建一个成对差分矩阵,并且每个序列都具有相同的长度(大约 300 个字符)。当我使用下面的代码时,只需半个多小时就可以制作一个比较 20 个序列的矩阵...
标签: r for-loop string-matching apply