【问题标题】:Select Earliest Date and Time from List of Distinct User Sessions从不同用户会话列表中选择最早的日期和时间
【发布时间】:2009-09-22 07:11:06
【问题描述】:

我有一个记录网站访问者活动的用户访问会话表:

accessid, userid, date, time, url

我正在尝试检索用户 ID 1234 的所有不同会话,以及每个不同会话的最早日期和时间。

SELECT 
    DISTINCT accessid, 
    date, 
    time 
FROM 
    accesslog 
WHERE userid = '1234' 
GROUP BY accessid

这为我提供了每个不同 accessid 中​​随机行的日期和时间。我已经阅读了许多推荐使用 min() 和 max() 的帖子,所以我尝试了:

SELECT DISTINCT accessid, MIN(DATE) AS date, MIN(TIME) AS time FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC

...甚至...

SELECT DISTINCT accessid, MIN(CONCAT(DATE, ' ', TIME)) AS datetime FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC

...但我从来没有得到最早日期和时间的正确结果。

排序这种查询的技巧是什么?

编辑-

发生了一些奇怪的事情......

Bill Karwin 下面发布的代码正确检索了 2009 年 9 月开始的会话的最早日期和时间。但是,对于在 2009-08 的某一天开始的会话,返回的是当月发生的第一次点击的时间和日期。换句话说,查询似乎没有跨越几个月!

示例数据集:

accessid    | userid    | date          | time
1           | 1234      | 2009-08-15    | 01:01:01
1           | 1234      | 2009-09-01    | 12:01:01
1           | 1234      | 2009-09-15    | 13:01:01
2           | 1234      | 2009-09-01    | 14:01:01
2           | 1234      | 2009-09-15    | 15:01:01

至少在我的实际数据表中,下面发布的查询会为两个 accessid 中​​的每一个找到以下 最早 日期和时间:

accessid    | userid    | date          | time
1           | 1234      | 2009-09-01    | 12:01:01
2           | 1234      | 2009-09-01    | 14:01:01

...我猜 accessid 2 的结果显示正确的唯一原因是因为它在上个月没有点击。

我疯了吗?

编辑 2 -

答案是肯定的,我要疯了。当放置在重复结构的表中时,查询适用于上述示例数据。

这是(截断的)原始数据。我包括了第一次点击,同一个月的另一次点击,下个月的第一次点击,然后是本月的最后一次点击。原始数据集在这些点之间有更多命中,总共 462 行。

accessid                            | date          | time
cbb82c08d3103e721a1cf0c3f765a842    | 2009-08-18    | 04:01:42
cbb82c08d3103e721a1cf0c3f765a842    | 2009-08-23    | 23:18:52
cbb82c08d3103e721a1cf0c3f765a842    | 2009-09-17    | 05:12:16
cbb82c08d3103e721a1cf0c3f765a842    | 2009-09-18    | 06:29:59

...查询原表时返回2009-09-17的值作为最早的值。但是,当我复制........哦,球。

这是因为 2009-08% 的点击有一个空的 userid 字段。

【问题讨论】:

  • 你在 accessid 中​​存储了什么?您想获取每个 accessid 的最短日期在哪里吗?
  • accessid 是每个唯一会话的分组 ID。因此,具有相同 accessid 的每一组页面都被视为一个用户会话。

标签: sql mysql greatest-n-per-group


【解决方案1】:

这是 StackOverflow 上每周多次出现的“greatest-n-per-group”问题的变体。

SELECT 
        a1.accessid, 
        a1.date, 
        a1.time 
FROM 
        accesslog a1
LEFT OUTER JOIN
        accesslog a2
  ON (a1.accessid = a2.accessid AND a1.userid = a2.userid
    AND (a1.date > a2.date OR a1.date = a2.date AND a1.time > a2.time))
WHERE a1.userid = '1234'
  AND a2.accessid IS NULL;

它的工作方式是我们尝试找到具有相同 accessid 和 userid 的行 (a2),以及比行 a1 更早的日期或时间。当我们找不到更早的行时,a1 必须最早的行。


关于您的评论,我刚刚使用您提供的示例数据进行了尝试。这是我得到的:

+----------+------------+----------+
| accessid | date       | time     |
+----------+------------+----------+
|        1 | 2009-08-15 | 01:01:01 | 
|        2 | 2009-09-01 | 14:01:01 | 
+----------+------------+----------+

我在 Mac OS X 上使用 MySQL 5.0.75。

【讨论】:

  • 我相信你,但它不起作用!这是最奇怪的事情...查询正在查找最早的日期和时间本月...对于上个月开始的会话,开始日期被视为第一天的最早时间仅在当月记录了一次命中。我会更新帖子的更多细节。
  • 谢谢比尔,我是个白痴。实际最早日期有一个空白用户 ID,因此被排除在外。 :)
  • 啊哈!是的,仔细检查数据总是值得的。干杯!
【解决方案2】:

试试这个

SELECT 
    accessid, 
    date, 
    time 
FROM 
    accesslog 
WHERE userid = '1234' 
GROUP BY accessid
HAVING MIN(date)

对于 userid = '1234',它将以最短时间返回所有唯一访问。

【讨论】:

  • HAVING 限制组,而不是组中的行。
猜你喜欢
  • 1970-01-01
  • 2014-01-24
  • 2016-12-30
  • 1970-01-01
  • 2014-12-10
  • 2021-06-19
  • 1970-01-01
  • 1970-01-01
  • 2017-02-18
相关资源
最近更新 更多