【发布时间】:2013-06-18 18:03:51
【问题描述】:
目前正在尝试编写一些可以从小于日期 X 的有序列表中返回最后一个日期。
现在我有这个:它获取日期列表,并获取我们将要进行搜索的那一天的索引以及我们想要返回多少日期的范围。
之后,它会检查日期是否存在(例如 2 月 30 日)。如果日期不存在,它会将日期减 1,然后再次应用过滤器(否则它会尝试从 NA 中减去 1 天并失败)。
library(lubridate)
getDate <- function(dates,day,range){
if(range == 'single')
{return (day-1)}
z <- switch(range,
single = days(1),
month = days(30),
month3 = months(3),
month6 = months(6),
year = years(1)
)
new_day <-(dates[day]-z)
i <- 1
while (is.na(new_day)){
new_day <- dates[day] - days(i) - z
}
ind<-which.min(abs (diff <-(new_day-dates)))
if (diff[ind] < 0)
{ind <- ind -1}
return (ind[1])
}
虽然此功能有效,但问题在于速度效率。我感觉which.min(abs()) 远不是最快的,我想知道是否有更好的选择(除了编写我自己的搜索列表函数之外)。
stocks <- list(structure(list(sec = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0), min = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), hour = c(0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L), mday = c(2L, 3L, 4L, 7L, 8L, 9L, 10L, 11L, 14L, 15L, 16L, 17L,
18L, 22L, 23L, 24L, 25L, 28L, 29L, 30L, 31L, 1L, 4L, 5L, 6L), mon = c(0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L,
1L, 1L, 1L), year = c(108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L,
108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L, 108L,
108L, 108L, 108L), wday = c(3L, 4L, 5L, 1L, 2L, 3L, 4L, 5L, 1L, 2L, 3L, 4L, 5L,
2L, 3L, 4L, 5L, 1L, 2L, 3L, 4L, 5L, 1L, 2L, 3L), yday = c(1L, 2L, 3L, 6L, 7L,
8L, 9L, 10L, 13L, 14L, 15L, 16L, 17L, 21L, 22L, 23L, 24L, 27L, 28L, 29L, 30L,
31L, 34L, 35L, 36L), isdst = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L)), .Names = c("sec", "min",
"hour", "mday", "mon", "year", "wday", "yday", "isdst"), tzone = "UTC",
class = c("POSIXlt", "POSIXt")))
old_pos <- getDate(stocks[[1]],21,"month") #should return 0
old_pos <- getDate(stocks[[1]],22,"month") #should return 1
这不返回向量,也不返回日期,只返回一个索引,主要问题不在于工作(它确实如此),而是优化它。
该值稍后会在另一个函数中使用,一个可能的加速方法是首先将所有旧索引与新索引匹配,然后将其作为另一个列表返回。但是不确定它是否会提供任何加速。
【问题讨论】:
-
请提供一些可重复的数据进行测试。
-
pastebin.com/sDXMSft6 或 pastebin.com/vLVvwjHd(作为股票传递的唯一值是股票[[1]])
-
请提供
dput(head(stocks[[1]],20))的输出以及我们应该如何调用您的getDate函数的示例,而不是粘贴指向打印数据的链接。那么您的问题将包含一个最小值,reproducible example。 -
@Gray_Hound 您可以从我的回答中得到启发,创建一个具有预期结果的可重复示例。创建一个好的示例通常是解决问题的一半。
-
我同意其他人的观点,他们鼓励您改进提问方式。现在出现的问题中有太多不相关的代码和过多的数据。这不仅仅是将你拥有的任何东西倾倒在 SO 上的问题,而是提取它的肉并问这个问题。我在回答中回答了@agstudy 对您问题的重新表述。我怀疑也没有多少人愿意浏览你所介绍的内容。
标签: r list date search indexing