【发布时间】:2018-08-21 00:10:15
【问题描述】:
我有两个数据框,我想“通过一定的条件组合它们”。我的第一个数据框有一周中的平均 Sms(avgSms) (1=Sunday, 2=Monday, 3=Tuesday...) ,小时和分钟:
df1:
I | Day_of_week | hour | min | AvgSms
#1 1 0 0 12
#2 1 0 30 20
#3 1 1 0 19
#4 1 1 30 11
#5 1 2 0 12
#6 1 2 30 7
... ... ... ... ....
#10 2 0 0 14
#11 2 0 30 20
#12 2 1 0 19
#13 2 1 30 11
... ... ... ... ....
#222 7 23 30 13
第二个数据帧有时间和短信,像这样:
df2: Time Sms
1 2012-01-01 00:00:00 10
2 2012-01-01 00:30:00 11
3 2012-01-01 01:00:00 13
4 2012-01-01 01:30:00 10
5 2012-01-01 02:00:00 7
6 2012-01-01 02:30:00 3
7 2012-01-01 03:00:00 3
8 2012-01-01 03:30:00 2
.......................
400 2015-12-31 23:30:00 16
我想添加到数据帧 2,数据帧 1 的各个 avgSms 取决于可变时间是第二个还是第三个以及 x 小时和 y 和分钟。
我想要这样的东西:
Time Sms avg
1 2012-01-01 00:00:00 10 12 --> 2012-01-01 was Sunday=1, h=0 and min=0
2 2012-01-01 00:30:00 11 20
3 2012-01-01 01:00:00 13 19
4 2012-01-01 01:30:00 10 11
5 2012-01-01 02:00:00 7 ..
6 2012-01-01 02:30:00 3
7 2012-01-01 03:00:00 3
8 2012-01-01 03:30:00 2
.......................
400 2015-12-31 23:30:00 16
【问题讨论】:
标签: r time aggregate-functions