【发布时间】:2016-01-05 04:09:52
【问题描述】:
假设我有一张如下表:
A B
1 2
1 3
1 4
5 8
5 9
5 10
我想要如下输出:
B
A 2 3 4 8 9 10
1 1 1 1 0 0 0
5 0 0 0 1 1 1
是否有可以创建“指标矩阵”的包?真实数据集大约有 300,000,000 行和 2 列。 B列中的值实际上是变量,我想创建一个数据集来指示该变量是否“打开”。
【问题讨论】:
-
table(mydf)应该可以帮助您。 -
如果我做 table(mydf) 我得到一个错误: table(train) 中的错误:尝试使用 >= 2^31 个元素制作一个表格。
-
如果都是整数,则转成矩阵。
-
我正在使用 data.table 包,我想保留它的数据类型
-
使用
data.table你可以做类似dcast(dt, A~B, fun.aggregate=length)的事情
标签: r