【发布时间】:2016-10-01 23:20:19
【问题描述】:
我开始对移动应用程序进行数据挖掘, 我有一个看起来像这样的数据库:
数据库 用户 ID 小时日期 01 18 01.01.2016 01 18 01.01.2016 01 14 02.01.2016 01 14 03.01.2016 02 21 03.01.2016 02 08 05.01.2016 02 08 05.01.2016 03 23 05.01.2016我想在此数据库中添加一个新列,用于汇总用户使用该应用程序的不同天数, 例如在这个数据库中,UserId#01 已经在平台上出现了三天,
预期的数据结果如下:
数据库 UserId 小时 日期 NumDates 01 18 01.01.2016 3 01 18 01.01.2016 3 01 14 02.01.2016 3 01 14 03.01.2016 3 02 21 03.01.2016 2 02 08 05.01.2016 2 02 08 05.01.2016 2 03 23 05.01.2016 1到目前为止,我已经使用了这个命令:
数据库["NumDates"] % group_by(UserId) %>% summarise(NumDates = length(unique(Date)))但它告诉我,当我需要 +600,000(我的数据库中的会话数)时,它只创建 5000 行(我的数据库中不同用户的数量)
如果有人可以帮助我,将不胜感激!
【问题讨论】:
标签: r data-mining calculated-columns