【问题标题】:Column name in variable using data.table and lapply使用 data.table 和 lapply 的变量中的列名
【发布时间】:2019-01-10 16:09:37
【问题描述】:

我有类似这样的数据:

set.seed(1)
testing1 <- data.table(type=c("stock","stock","bond","bond"),a=rnorm(4),b=rnorm(4),c=rnorm(4),d=rnorm(4),e=rnorm(4))

    type          a          b          c           d           e
1: stock -0.6264538  0.3295078  0.5757814 -0.62124058 -0.01619026
2: stock  0.1836433 -0.8204684 -0.3053884 -2.21469989  0.94383621
3:  bond -0.8356286  0.4874291  1.5117812  1.12493092  0.82122120
4:  bond  1.5952808  0.7383247  0.3898432 -0.04493361  0.59390132

这正是我想要的:

result1 <- testing1[,c(list(type=type),lapply(.SD, `-`, a)), .SDcols = b:e]

    type          b          c           d          e
1: stock  0.9559616  1.2022352  0.00521323  0.6102635
2: stock -1.0041117 -0.4890317 -2.39834321  0.7601929
3:  bond  1.3230577  2.3474098  1.96055953  1.6568498
4:  bond -0.8569561 -1.2054376 -1.64021441 -1.0013795

问题在于a 列是动态命名的。我想做这样的事情:

cn <- "a"
result2 <- testing1[,c(list(type=type), lapply(.SD, `-`, get(cn))), .SDcols = b:e]

但我收到错误消息:Error in FUN(X[[i]], ...) : non-numeric argument to binary operator

任何想法将不胜感激。谢谢。

【问题讨论】:

    标签: r data.table lapply


    【解决方案1】:

    我们可以利用[[ 从“testing1”中提取列。这里.SD 不起作用,因为.SDcols 中没有指定列

    testing1[,c(list(type=type),lapply(.SD, `-`, testing1[[cn]])), .SDcols = b:e]
    #   type          b          c           d          e
    #1: stock  0.9559616  1.2022352  0.00521323  0.6102635
    #2: stock -1.0041117 -0.4890317 -2.39834321  0.7601929
    #3:  bond  1.3230577  2.3474098  1.96055953  1.6568498
    #4:  bond -0.8569561 -1.2054376 -1.64021441 -1.0013795
    

    如果我们使用get,请确保环境与lapply 相同,环境来自.SD,其中没有“a”列。而是使用Map

    testing1[,  Map(`-`, .SD, list(get(cn))), .SDcols = b:e]
    

    【讨论】:

    • Perfect @akrun 都可以完美地处理我的真实数据。谢谢。
    猜你喜欢
    • 2018-11-25
    • 2018-07-28
    • 2013-04-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-01-01
    • 2017-10-24
    • 1970-01-01
    相关资源
    最近更新 更多