【发布时间】:2014-04-14 17:50:48
【问题描述】:
我试图估计在给定时间步长(日期)内处于给定区域的人数(唯一“id”)在下一个时间步长中离开了该区域。这是数据的一小部分:
zone date id
802 2007-01-01 453444
803 2007-01-01 407680
803 2007-01-01 415786
804 2007-02-01 407680
802 2007-02-01 453444
802 2007-03-01 415786
804 2007-03-01 407680
802 2007-04-01 415786
802 2007-04-01 407680
804 2007-04-01 453444
801 2007-05-01 453444
804 2007-05-01 407680
804 2007-05-01 415786
804 2007-06-01 453444
801 2007-06-01 415786
804 2007-06-01 407680
803 2007-07-01 407680
803 2007-07-01 453444
804 2007-07-01 415786
所以我的问题是,我如何估计这些偏离?我正在尝试创建一个矩阵,该矩阵将如下所示,用于每个日期/区域的离开人数总和。非常感谢您提供的任何帮助。
zone 2005-07-01 2005-08-01 2005-09-01
1 103 0 1 0
2 106 0 0 3
3 107 0 0 0
4 1603 0 0 0
5 1607 0 0 0
6 2204 0 0 0
7 2206 0 3 1
8 2209 0 0 0
9 3106 0 0 0
10 3804 0 0 0
11 3806 0 0 0
我正在考虑类似于两步函数的东西 1.) 遍历所有单独的 ID,询问 date[t] 中的 zone[i] 是否 = date[t+1] 中的 zone[i],如果不产生一个“1”并存储在一个矩阵中(表示离开);然后 2.) 将所有 ID 中每个区域/日期的所有 1 相加,得出每个时间步长的每个区域的出发总和。类似的东西,但在制定该函数时遇到了麻烦
【问题讨论】:
-
你的数据很乱:id "415786" 被报告在同一天 (2007-04-01) 位于 802 和 804 区。你想怎么处理?
-
重复是我的错误。对不起!请参阅下面的下一条评论。
标签: r loops matrix time transition