【问题标题】:Interpolate / Extend quarterly to monthly series插值/扩展季度到月度序列
【发布时间】:2014-09-23 14:31:29
【问题描述】:

我有一个包含季度观察的 data.frame。我现在想插入每月值(首选三次,线性很好)。中间目标应该是创建一个以DATE 为索引的data.frame,并为所有月度观察创建缺失值。

谷歌搜索表明我应该为整个时间范围创建一个空的 data.frame 然后合并它 - 但到目前为止我尝试过的都给了我错误。这是我的程序;但由于我是r 的新手,我愿意接受任何更改建议。

> str(ger)
'data.frame':   93 obs. of  2 variables:
 $ DATE : Date, format: "1991-01-01" "1991-04-01" "1991-07-01" "1991-10-01" ...
 $ VALUE: num  470780 468834 466332 472949 480359 ...
> head(ger)
        DATE    VALUE
1 1991-01-01 470780.3
2 1991-04-01 468834.0
3 1991-07-01 466331.6
4 1991-10-01 472949.0
5 1992-01-01 480359.2
6 1992-04-01 476744.5

emptyIndex <- seq(ger[1, 'DATE'], tail(ger[, 'DATE'], 1), by='1 month')
gerMonthly <- data.frame(DATE = emptyIndex, VALUE = NA)
merge(ger, gerMonthly, by='DATE', all.y = T)

这是我得到的最接近的,但它给了我一种不想要的列格式 - 肯定有一种更简洁的方法来获得我想要的东西?最后,给定格式,获取插值时间序列的最简洁方法是什么?

          DATE  VALUE.x VALUE.y
1   1991-01-01 470780.3      NA
2   1991-02-01       NA      NA
3   1991-03-01       NA      NA
4   1991-04-01 468834.0      NA
5   1991-05-01       NA      NA
6   1991-06-01       NA      NA

【问题讨论】:

    标签: r datetime merge interpolation


    【解决方案1】:

    我不太清楚您对不需要的列格式的评论,但如果您尝试使用三次插值获取插值,您可能会考虑类似下面的代码

    ger <- data.frame(DATE= as.Date(c("1991-01-01", "1991-04-01", "1991-07-01", "1991-10-01", "1992-01-01" )),
                  +                   VALUE= c(470780, 468834, 466332, 472949, 480359))
    DateSeq <- seq(ger$DATE[1],tail(ger$DATE,1),by="1 month")
    gerMonthly <- data.frame(DATE=DateSeq, Interp.Value=spline(ger, method="natural", xout=DateSeq)$y)
    merge(ger, gerMonthly, by='DATE', all.y = T)
    

    DATE 列需要采用日期格式,以便插值可以处理数值。 我通常使用“自然”三次样条,但也可以使用其他选项。 此格式同时显示输入值和结果,以便您检查插值是否合理,但如果您只想要插值结果,则可以使用 gerMonthly。

    【讨论】:

      猜你喜欢
      • 2021-05-26
      • 2018-11-16
      • 2020-07-12
      • 2018-08-30
      • 1970-01-01
      • 2015-11-26
      • 2014-07-03
      • 2020-11-16
      • 2017-03-08
      相关资源
      最近更新 更多