【问题标题】:Faster way to get year from large data set in R从 R 中的大型数据集中获取年份的更快方法
【发布时间】:2018-11-15 20:13:11
【问题描述】:

有没有更快的方法从 R 中的大型数据集(大约 1GB)中获取年份?

目前我用data$year <- format(as.Date(data$pickup_datatime), "%Y")来获取年份,但是花了很长时间。

【问题讨论】:

  • 这两个功能都需要很长时间,还是其中之一?你可以试试lubridate::year() 而不是format
  • 您可以尝试substrstringi::stri_sub,而不是解析日期,就像我在这里抓取时间时所做的那样:Fastest way to extract hour from time (HH:MM)。在发布有关速度的问题时,如果您还提供足够大小的易于重现的数据来尝试代码,那就太好了。干杯。
  • ...或者至少发布一些示例数据。

标签: r date


【解决方案1】:

lubridate 包有一个内置函数可以从类似日期的对象中获取年份。这是您的案例的用途:

data$year <- lubridate::year(data$pickup_datatime)

【讨论】:

    猜你喜欢
    • 2018-04-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-03-14
    • 2019-12-31
    • 1970-01-01
    • 2021-03-06
    • 2021-10-21
    相关资源
    最近更新 更多