【发布时间】:2017-08-14 19:49:07
【问题描述】:
我有一个数据框,它有两列,一列用于基因符号,另一列用于功能通路。路径列具有重复值,因为每个路径都有许多基因。我想对这个数据集重新排序,以便每一列都是一条通路,而这些列中的每一行都是属于该通路的一个基因。
起始数据框:
data.frame(pathway = c("p1", "p1", "p1", "p1", "p2", "p2", "p2"),
gene.symbol = c("G1", "G2", "G3", "G4", "G33", "G43", "G10"))
所需的数据框:
data.frame(p1 = c("G1", "G2", "G3", "G4"), p2 = c("G33", "G43", "G10",
""))
我知道并非所有列的长度都相同,并且使用空白值比 NA 更可取。
【问题讨论】:
-
由于列的长度不同,你最好创建一个标准的
list而不是data.frame,特别是因为第1行,第1列与第 1 行,第 2 列。
标签: r