【发布时间】:2022-11-30 19:56:59
【问题描述】:
ACCOUNT = c(M205109, M205109, M201212, M205668, M207954, M208966, M203465, M207622, M201869, M201869)
age = c(20, 20, 18, 29, 21, 19, 19, 23, 22, 22)
我正在使用的代码
library(tidyverse)
library(data.table)
library(dtplyr)
library(lubridate)
age_summary_all <- data %>%
distinct(ACCOUNT) %>%
summarise(min = min(age, na.rm=TRUE),
q1 = quantile(age, 0.25, na.rm=TRUE),
median = median(age,na.rm=TRUE),
mean = mean(age,na.rm=TRUE),
q3 = quantile(age, 0.75, na.rm=TRUE),
max = max(age, na.rm=TRUE))
我收到此错误:
summarise()中的错误:!计算min = min(age, na.rm = TRUE)时出现问题。由mask$eval_all_summarise()中的错误引起:! 未找到对象“年龄”真正奇怪的是,如果 distinct 被引用不同列的 group_by 子句替换,那么完全相同的代码运行良好,但我需要对独特的个体进行分析——数据的性质使得个体账户很可能在数据表中有多个条目。因此,对于上面的示例,我希望 summarize 子句的 n = 8。
所有的包绝对是最新的。
【问题讨论】: