【发布时间】:2016-02-27 13:45:54
【问题描述】:
我想通过 data.table 上的字符名称调用函数。每个函数还有一个参数向量(因此有一长串函数可应用于 data.table)。参数是 data.table 列。我的第一个想法是 do.call 将是该任务的好方法。下面是一个简单的示例,其中包含一个要运行的函数名称以及要传递的列向量:
# set up dummy data
set.seed(1)
DT <- data.table(x = rep(c("a","b"),each=5), y = sample(10), z = sample(10))
# columns to use as function arguments
mycols <- c('y','z')
# function name
func <- 'sum'
# my current solution:
DT[, do.call(func, list(get('y'), get('z'))), by = x]
# x V1
# 1: a 47
# 2: b 63
我对此并不满意,因为它需要具体命名每一列。我只想传递一个字符向量mycols。
在这种情况下,我需要的其他解决方案是:
DT[, do.call(func, .SD), .SDcols = mycols, by = x]
但是自定义函数存在问题,唯一适合我的解决方案是第一个:
#own dummy function
myfunc <- function(arg1, arg2){
arg1+arg2
}
func <- 'myfunc'
DT[, do.call(func, list(get('y'), get('z'))), by = x]
# x V1
# 1: a 6
# 2: a 6
# 3: a 11
# 4: a 17
# 5: a 7
# 6: b 15
# 7: b 17
# 8: b 10
# 9: b 11
# 10: b 10
# second solution does not work
DT[, do.call(func, .SD), .SDcols = mycols, by = x]
# Error in myfunc(y = c(3L, 4L, 5L, 7L, 2L), z = c(3L, 2L, 6L, 10L, 5L)) :
# unused arguments (y = c(3, 4, 5, 7, 2), z = c(3, 2, 6, 10, 5))
据我了解,它假定 myfunc 具有参数 y, z,这是不正确的。应该有变量y,z 应该传递给参数arg1, arg2。
我也试过mget功能,但也没有成功:
DT[, do.call(func, mget(mycols)), by = x]
# Error: value for ‘y’ not found
我可能遗漏了一些相当明显的东西,在此先感谢您的指导。
【问题讨论】:
-
我会使用
call或as.call而不是do.call,它需要包装到eval中,但提供了更多的灵活性。类似eval(as.call(list(func, as.name("y"), as.name("z")))). -
@jangorecki 是的,这个
DT[, eval(call(func, as.name("y"), as.name("z"))), by = x]也适用于我。但我想使用字符向量mycols而不是明确命名y和z。 -
你在寻找类似
DT[, Reduce(func, mget(mycols)), by = x]的东西吗? -
@AnandaMahto 这与我正在寻找的非常接近。出于某种原因,如果您定义了具有超过 2 个参数的自定义函数,您的解决方案将引发错误
Error in f(init, x[[i]]) : argument "arg3" is missing, with no default。有什么想法吗?
标签: r data.table do.call