【问题标题】:convert data.frame to data.table column missing将 data.frame 转换为 data.table 列丢失
【发布时间】:2013-05-19 13:20:44
【问题描述】:

遇到过这样的情况。尝试将“mtcars”类从 data.frame 转换为 data.table。

“mtcars”数据:

> mtcars
                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

原始类是“data.frame”。

> str(mtcars)
'data.frame':   32 obs. of  11 variables:
 $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

转换为data.table。发现汽车品牌专栏不见了。为什么?如何保留品牌栏目?

> mtcars2 <- data.table(mtcars)
> mtcars2
     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
 1: 21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
 2: 21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
 3: 22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

希望有一个最终数据格式如下的 data.table - 第一列品牌有一个新的列名称“品牌”。如何编码从原始“mtcars”数据集中添加“品牌”列?

Brands              mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

【问题讨论】:

    标签: r dataframe data.table


    【解决方案1】:

    缺少的是行名,而不是列之一。

    如果您希望 Brands 作为一列,手动方法是:

    data.table(Brands = rownames(mtcars), mtcars)
    

    交替:

    data.table(mtcars, keep.rownames = TRUE)
    

    但是,这不会使生成的 data.table 具有旧的行名,它只是为它们创建一个名为“rn”的列。这在文档中,?data.table


    或者,修改表,为DF = mtcars

    setDT(DF, keep.rownames = "Brands")
    

    次要问题:我们不能setDT(mtcars, ...),因为mtcars 是一个内置表。

    【讨论】:

    • 如果您想选择默认“rn”以外的其他名称,也可以写data.table(mtcars, keep.rownames = "Brands")。 (使用了data.table 的 CRAN 版本 1.10.4)。
    • @UweBlock 在 1.10.5 上进行测试,这不会创建品牌列。不过它确实适用于 setDT...我正在编辑它。谢谢
    猜你喜欢
    • 2013-05-07
    • 2016-08-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-08-18
    • 2011-10-27
    • 2015-07-09
    相关资源
    最近更新 更多