【发布时间】:2013-05-19 09:13:50
【问题描述】:
a<-as.factor(c('a','a','b','b','c','d'))
b<-as.factor(c('a','b','c','c','d','a'))
c<-as.factor(c('a','b','d','d','c','b'))
x<-data.frame(a,b,c)
a b c
1 a a a
2 a b b
3 b c d
4 b c d
5 c d c
6 d a b
我有一个非常大的数据表(使用 datatable 包),我想简单地 获取列名并将它们附加到行因子值以便于识别。
所以在上面的简单示例中(使用数据框进行说明)我会有一些东西 喜欢
a b c
a:a b:a c:a
a:a b:b c:b
a:b b:c c:d
..
..
a:d b:a c:b
我曾尝试(不成功)进行某种类型的应用和粘贴组合。 但我不能完全传递 colname 参数以正确粘贴到每一列。 关于如何为大型数据表完成这项任务的任何想法?数据表 方法会很好,但数据框也很好,因为它只是一次 行动。
【问题讨论】:
-
请问你到底为什么要做这样的手术???您需要将那些无用的前缀与整个巨大的数据框一起拖动,使其大两倍。如果是出于演示目的,请在打印结果时将其添加到最后。它对任何处理都没有用处......
-
我有一个大型数据挖掘操作,该操作结束拆分,然后对所有列属性进行操作,并将结果进一步拆分为小列表。我希望能够获取数百个列表和 rbind,然后对它们进行排序,但是 colnames 信息会丢失。如果我以这种方式进行预处理,我可以在最终聚合结果中跟踪它们。
-
@sashkello 前缀对数据框大小的影响可以忽略不计。 R 将因子作为数字索引存储到一组级别中,而不是作为实际字符串。
-
啊,好吧,他们是因素,对不起,误读了。在这种情况下是很合理的。