【发布时间】:2018-05-14 21:47:14
【问题描述】:
我在数据框中有一列日期,其中每个日期通常重复几次。这是我的数据框的一个示例,它的其他列中还有一些运动队的名称:
dput(mydf)
structure(list(date_game = structure(c(15643, 15643, 15643, 15644,
15644, 15644, 15646, 15646), class = "Date"), team_id = c("WAS",
"CLE", "LAL", "SAC", "CHI", "DET", "BOS", "MIL"), fran_id = c("Wizards",
"Cavaliers", "Lakers", "Kings", "Bulls", "Pistons", "Celtics",
"Bucks")), .Names = c("date_game", "team_id", "fran_id"), row.names = c(1L,
2L, 3L, 7L, 8L, 9L, 29L, 30L), class = "data.frame")
在这种情况下,mydf 有 3 个唯一日期,并且也会跳过一个日期。我的完整数据框有数百个独特的日期。对于此示例,我有兴趣向数据框添加一个新列(称为 date_number),如下所示:
mydf
date_game team_id fran_id date_number
1 2012-10-30 WAS Wizards 1
2 2012-10-30 CLE Cavaliers 1
3 2012-10-30 LAL Lakers 1
7 2012-10-31 SAC Kings 2
8 2012-10-31 CHI Bulls 2
9 2012-10-31 DET Pistons 2
29 2012-11-02 BOS Celtics 3
30 2012-11-02 MIL Bucks 3
就像标题所说的那样 - 从 date_number 列中的 1 开始,我想增加日期的序号。关键部分是该列是连续的,即使某些日期缺失。虽然 11-01 不存在,但 11-02 仍然设置为 3,而不是 4。
任何关于如何做到这一点的想法将不胜感激!
【问题讨论】:
标签: r data-manipulation