【发布时间】:2018-04-25 07:42:29
【问题描述】:
我有这两个数据框:
设置A:
session_id datetime request
<int> <dttm> <dbl>
1 1105 2016-03-09 00:33:42 8
2 1105 2016-03-09 00:33:43 3
3 1107 2016-03-09 00:44:24 14
4 1107 2016-03-09 00:44:26 14
5 1108 2016-03-09 00:54:02 9
6 1108 2016-03-09 00:54:04 10
7 1109 2016-03-09 01:01:37 17
8 1109 2016-03-09 01:01:39 6
9 1110 2016-03-09 01:02:49 10
10 1110 2016-03-09 01:02:49 8
和setB:
session_id datetime request
<int> <dttm> <dbl>
1 1105 2016-03-09 00:33:45 3
2 1107 2016-03-09 00:44:29 7
3 1108 2016-03-09 00:54:06 10
4 1109 2016-03-09 01:01:40 6
5 1110 2016-03-09 01:02:51 5
6 1111 2016-03-09 01:18:36 14
7 1111 2016-03-09 01:18:38 16
8 1112 2016-03-09 01:21:20 1
9 1112 2016-03-09 01:21:21 19
10 1114 2016-03-09 01:29:58 13
现在我想对这两组做一些交集,但按 sessionid 分组
由于 setA 中的 sessionid 1105 包含请求 (3,7) ,我想与相同的 sessionid 进行交集,即 1105 在 setB 中包含请求 (3)
calc = intersect(setA$request,setB$request)
...但按 sessionid 分组。
希望你能明白。
【问题讨论】:
-
你能指定输出吗?您要求
intersection,但您给出的示例中的datetimes不同。你想丢弃datetime吗?还是您要求合并? -
放弃日期时间,我想根据请求变量的交叉点长度