【发布时间】:2018-02-16 08:38:58
【问题描述】:
我有一个大型数据集(几百万个观察值),其中包含格式不一致的日期时间变量: "%Y-%m-%d %H:%M:%S" ; “%m/%d/%Y 和 %H:%M:%S”。
数据集如下所示:
df <- data.frame(var1 = c(1:6),
var2 = c("A", "B", "C", "A", "B", "C"),
datetime = c("2013-07-01 00:00:02", "2016-07-01 00:00:01",
"9/2/2014 00:01:20", "9/1/2014 00:00:25",
"1/1/2015 0:07", "6/1/2015 0:01"))
有没有一种有效的方法可以将 datetime 变量格式化为唯一、一致的日期时间格式?
【问题讨论】:
-
如果您没有不明确的日期(例如 2014 年 9 月 2 日),您可以使用任何时间包中的
anytime。事实上,您只能将as.POSIXct与您数据中的所有格式一起使用,并将结果合并到一个向量中