【发布时间】:2015-01-06 15:26:10
【问题描述】:
我有一个时间序列数据集,其中包含 10000 行和 1 年的数据,看起来像这样
2012-01-01 06:23:02 c d10
2012-01-01 08:12:12 d d2
...........................
2012-12-31 08:22:24 s d5
它有 3 个字段
date_time, category1, category2 where category1 contains 4 categorical values (c,v,d,s) category2 contains 10 categorical values(d1....d10).
我想针对每个分类值 d1......d10 计算所有分类值 c、v、d、s 的单独计数。它应该就像 d1,d2..d10 相对于时间范围 0-1, 1-2, .... 22-23 存在多少 c,v,d,s
如何在从1-2、2-3、3-4、.....23-24开始的时间序列中表示上述数据
样本输出应该是这样的
1-2 2-3 3-4 ........23-24
d1 c=2,d=3,v=3s=4
d2 c=3 d=3,v=2,s=2
.....
d10
我曾尝试使用 lubridate,data.table 包,但找不到预期的解决方案
【问题讨论】:
-
不确定我是否理解您想要的输出
-
@mubarak 在预期的输出中,是
category c=2, d=3row.names 吗? -
hai @DavidArenburg 我再次编辑了问题,我想现在您可以确定我的问题了。
-
你想要的输出是一团糟,我不明白,@akruns 回答有帮助吗?
-
@mubarak 正如 David Arenburg 所说,所需的输出仍然不清楚。
标签: r time-series data.table timespan