【发布时间】:2011-09-29 23:31:41
【问题描述】:
我有一个大文本文件,每行中的字段数量可变。每行中的第一个条目对应于一个生物通路,每个后续条目对应于该通路中的一个基因。前几行可能如下所示
path1 gene1 gene2
path2 gene3 gene4 gene5 gene6
path3 gene7 gene8 gene9
我需要将这个文件作为一个列表读入R中,每个元素都是一个字符向量,列表中每个元素的名称是该行的第一个元素,例如:
> pathways <- list(
+ path1=c("gene1","gene2"),
+ path2=c("gene3","gene4","gene5","gene6"),
+ path3=c("gene7","gene8","gene9")
+ )
>
> str(pathways)
List of 3
$ path1: chr [1:2] "gene1" "gene2"
$ path2: chr [1:4] "gene3" "gene4" "gene5" "gene6"
$ path3: chr [1:3] "gene7" "gene8" "gene9"
>
> str(pathways$path1)
chr [1:2] "gene1" "gene2"
>
> print(pathways)
$path1
[1] "gene1" "gene2"
$path2
[1] "gene3" "gene4" "gene5" "gene6"
$path3
[1] "gene7" "gene8" "gene9"
...但我需要为数千行自动执行此操作。我看到了similar question posted here previously,但我无法从该线程中弄清楚如何做到这一点。
提前致谢。
【问题讨论】:
-
查看这篇文章以获得灵感,可能帮助stackoverflow.com/questions/6592850/…
-
感谢大家提供多样而优雅的解决方案。在不到一个小时的时间内 4 个有效答案是我使用 SO 的原因。非常感谢。
标签: list r text statistics