【发布时间】:2016-03-30 08:16:39
【问题描述】:
我正在尝试应用 dplyr 包并使用以下函数计算数据集中每个卡号的条目数:
freq<- function(data){
data <- complete.dupremoved[order(-complete.dupremoved$SUMMA),]
aggregate(count ~., data=transform(complete.dupremoved,count=1), length)
complete.dupremoved$count <-complete.dupremoved[complete.dupremoved$KLIENDIKAARDINR,]
sample <- count(complete.dupremoved, vars = "KLIENDIKAARDINR")
complete.dupremoved<- merge(complete.dupremoved,sample, by ="KLIENDIKAARDINR")
return(complete.dupremoved)
}
显示的错误是 Error: data_frames can only contain 1d atomic vectors and lists.
当我这样做时: lapply(complete.dupremoved,class)
有些列是 numeric 、 factor 、 character 、 integer 。任何解决方案如何解决这个问题? 调试器还提供以下内容:
function (x)
{
stopifnot(is.list(x))
if (length(x) == 0) {
x <- list()
class(x) <- c("tbl_df", "tbl", "data.frame")
attr(x, "row.names") <- .set_row_names(0)
return(x)
}
names_x <- names2(x)
if (any(is.na(names_x) | names_x == "")) {
stop("All columns must be named", call. = FALSE)
}
ok <- vapply(x, is_1d, logical(1))
**if (any(!ok)) {
stop("data_frames can only contain 1d atomic vectors and lists",
call. = FALSE)**
}
n <- unique(vapply(x, NROW, integer(1)))
if (length(n) != 1) {
stop("Columns are not all same length", call. = FALSE)
}
class(x) <- c("tbl_df", "tbl", "data.frame")
attr(x, "row.names") <- .set_row_names(n)
x
}
【问题讨论】:
-
你能举一个你的数据的小例子来重现错误吗?
-
'因子'-向量不是原子的。
-
@42-,但
is.atomic(factor("a"))返回TRUE..? -
我想我很困惑。我认为具有额外属性的向量不是“原子的”。注意
is.vector( factor("a") )返回[1] FALSE。因此,请遵循?is.atomic页面中的这句话:“通常将原子类型称为‘原子向量’,但请注意 is.vector 施加了进一步的限制:对象可以是原子的,但不能是向量(在这个意义上)。 "我特此将我的评论修改为“因素不是原子向量”。 -
@42-,这很有趣。我也刚刚了解到不可能做到
vector(mode = "factor", 0)。无论如何,关于错误消息,它可能与因素无关,因为允许data_frame(x = factor(1))。