【发布时间】:2020-06-21 00:31:55
【问题描述】:
我正在尝试清理有关 COVID19 新型冠状病毒的一些数据 (https://github.com/CSSEGISandData/COVID-19/blob/master/csse_covid_19_data/csse_covid_19_time_series/time_series_19-covid-Confirmed.csv) 以进行各种类型的分析(即,创建一个具有 100 例病例的国家图表,或跟踪一段时间内的死亡率每个国家/地区)。我使用了以日期为列,以国家为行的数据。我转置了 Dataframe,以便得到每个国家/地区的一列和一列日期,如下所示。
我试图通过以下代码将此数据帧作为时间序列对象读取:
covid19ts = ts(covid19, frequency = 365, start = c(2020,22))
结果如下。我没有将日期作为我的索引列,而是得到一个 1 - 47 之间的数字(记录的天数)。这导致我无法创建图表或进行任何有意义的分析。
我还使用 lubridate 包尝试了以下代码,结果相同:
covid19ts = ts(covid19, frequency = 365, start= decimal_date(as.Date("2020-01-22")))
如何将我的 ts 日期转换为实际日期以供图表和分析?
或者我可以使用一种完全不同的方法来更好地进行分析?
感谢您的帮助。
【问题讨论】:
标签: r dataframe date time-series