【发布时间】:2017-02-24 13:27:07
【问题描述】:
这是一个基本问题,但我尝试搜索并没有得到答案。
我有超过 1 万条时间序列记录,涉及 420 家不同的公司。对于每家公司,我都有一个时间戳(月/年)和一些变量。时间序列的长度不同。
在这个阶段,所有记录都在一个 dataframe 中,看起来像这样
Date Code Var1 Var2 Var3 Var3
01/01/2010 AAA
01/02/2010 AAA
01/03/2010 AAA
01/01/2010 BBB
01/02/2010 BBB
01/03/2010 BBB
01/04/2010 BBB
01/01/2010 CCC
01/02/2010 CCC
01/03/2010 CCC
稍后我需要进行互相关、时间序列聚类并构建向量自回归模型。
问题:
处理此类数据的准则是什么:
- 按原样使用dataframe
- 将其转换为每个公司的单独时间序列。
很高兴接受任何其他建议!
【问题讨论】:
标签: r dataframe time-series xts cross-correlation