从 R 中的大型数据集中获取年份的更快方法答案

【问题标题】：Faster way to get year from large data set in R从 R 中的大型数据集中获取年份的更快方法
【发布时间】：2018-11-15 20:13:11
【问题描述】：

有没有更快的方法从 R 中的大型数据集（大约 1GB）中获取年份？

目前我用data$year <- format(as.Date(data$pickup_datatime), "%Y")来获取年份，但是花了很长时间。

【问题讨论】：

这两个功能都需要很长时间，还是其中之一？你可以试试lubridate::year() 而不是format。
您可以尝试substr 或stringi::stri_sub，而不是解析日期，就像我在这里抓取时间时所做的那样：Fastest way to extract hour from time (HH:MM)。在发布有关速度的问题时，如果您还提供足够大小的易于重现的数据来尝试代码，那就太好了。干杯。
Fastest way to extract hour from time (HH:MM)的可能重复
...或者至少发布一些示例数据。

标签： r date

【解决方案1】：

lubridate 包有一个内置函数可以从类似日期的对象中获取年份。这是您的案例的用途：

data$year <- lubridate::year(data$pickup_datatime)

【讨论】：