【发布时间】:2018-11-15 20:13:11
【问题描述】:
有没有更快的方法从 R 中的大型数据集(大约 1GB)中获取年份?
目前我用data$year <- format(as.Date(data$pickup_datatime), "%Y")来获取年份,但是花了很长时间。
【问题讨论】:
-
这两个功能都需要很长时间,还是其中之一?你可以试试
lubridate::year()而不是format。 -
您可以尝试
substr或stringi::stri_sub,而不是解析日期,就像我在这里抓取时间时所做的那样:Fastest way to extract hour from time (HH:MM)。在发布有关速度的问题时,如果您还提供足够大小的易于重现的数据来尝试代码,那就太好了。干杯。 -
...或者至少发布一些示例数据。