【发布时间】:2021-03-17 14:19:51
【问题描述】:
我正在尝试学习如何处理时间序列数据。我创建了一些假的每日数据,尝试按周汇总然后绘制它:
set.seed(123)
library(xts)
library(ggplot2)
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
final_data <- data.frame(date_decision_made, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars~format(as.Date(date_decision_made),
format="%W"),data=final_data, FUN=sum)
y.mon$week = y.mon$`format(as.Date(date_decision_made), format = "%W")`
g = ggplot(y.mon, aes(x = week, y=property_damages_in_dollars) + geom_line(aes(group=1))
该图似乎有效,但轴上只有 52 个“刻度”,而应该是该数量的两倍(有 2 年的数据)。我认为将数据从每日转换为每周时出现问题 - 有人可以告诉我如何解决这个问题吗?
在我的实际数据中,我有 30 年的数据。日期似乎很拥挤。我试图“取消”日期:
library(scales)
g + scale_x_date(date_breaks = "1 week", expand = c(0,0)) +
theme(axis.text.x = element_text(angle=90, vjust=.5))
但这也行不通。有人可以告诉我我做错了什么吗?
谢谢
注意:如果有两列,是否还可以使用聚合函数?
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
other_damages_in_dollars <- rnorm(731,10,10)
final_data <- data.frame(date_decision_made, other_damages_in_dollars, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars, other_damages_in_dollars ~format(as.Date(date_decision_made),
format="%Y/%m"),data=final_data, FUN=sum)
【问题讨论】:
-
如果有两列,是否还可以使用聚合函数? date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day") date_decision_made
标签: r plot time-series data-visualization aggregate-functions