【发布时间】:2018-06-07 08:20:42
【问题描述】:
我有以下提到的数据框:
Date ID
2018-04-01 K-1
2018-04-01 K-1
2018-04-02 K-2
2018-04-02 K-2
2018-04-03 K-2
2018-04-04 K-3
2018-05-01 K-5
2018-05-01 K-5
2018-05-02 K-6
2018-05-02 K-7
通过使用上面的数据框,我想要下面提到的两个矩阵,按日期分组:
New_DF1
Date Unique Count Duplicate_Count
2018-04-01 1 1
2018-04-02 1 1
2018-04-03 1 0
2018-04-04 1 0
2018-05-01 1 0
2018-05-02 2 0
New_DF2
Month Unique Count Duplicate_Count
May-18 4 2
Apr-18 3 0
我试过了:
DF%>%
group_by(Date) %>%
summarise(count = n_distinct(ID))
但它无法工作。
【问题讨论】:
-
我不明白你认为什么是唯一和重复的。你能解释一下吗?
-
@LAP for
DF_1Unique count应该是ID的不同计数,Duplicate_count应该是相同ID的额外计数(例如,如果只有一个K-1如果K-1的计数>1,则应为 0,假设为 3,而不是应为 2)。 -
@Moody_Mudskipper 从日期开始
-
好吧,你能解释一下为什么
2018-04-03没有唯一但只有一个重复值,而只有一个 K-2 值,是因为错误吗?还是因为 K2 在整个列上不是唯一的? -
为什么在你的
New_DF1中没有2018-05-03?
标签: r dataframe dplyr tidyr tidyverse