【问题标题】:Offset subquery in lead/lag超前/滞后中的偏移子查询
【发布时间】:2015-10-13 03:21:51
【问题描述】:

我有跟踪数据,我使用 LEAD 和 LAG 修改了开始和结束日期,以确保上一个结束时间等于下一个开始时间。这些查询在 groupId 上进行分区,按开始时间排序。

我的问题是当其中一条记录的开始和结束时间包含以下两条或更多条记录时。我需要标记这些包含的记录以供审核。

如果它只是一条记录,我对此没有任何问题,因为我可以使用 LAG 查询查看上一个结束时间,然后标记它。但是如果后面是两条或更多条记录,没有偏移量参数我不能这样做。

我在编写偏移子查询时遇到问题,以便它正确检查具有包含范围的记录。

GroupId  Id          Start                 End
1613833 81477   19/04/2014 10:47    19/04/2014 14:38
1613833 38813   19/04/2014 14:38    19/04/2014 17:45
1613833 15874   19/04/2014 14:46    19/04/2014 15:00
1613833 89773   19/04/2014 15:00    19/04/2014 16:30

在这种情况下,将使用

标记记录 15874
LAG(END) OVER (PARTITION BY GroupId ORDER BY Start) > END

,但 89773 不会。

我不知道如何编写处理这种情况的偏移子查询。

谁能帮忙?

【问题讨论】:

    标签: sql sql-server tsql window-functions


    【解决方案1】:

    你不想要lag()/lead()。只需使用exists

    select t.*
    from table t
    where exists (select 1
                  from table t2
                  where t2.groupid = t.groupid and
                        t2.start < t.start and
                        t2.end > t.end
                 );
    

    【讨论】:

    • 这适用于一个小子集,但对于我的完整数据集来说太慢了
    • 尝试在table(groupid, start, end)上添加索引。
    猜你喜欢
    • 2021-07-08
    • 1970-01-01
    • 2013-06-04
    • 2017-03-30
    • 2018-09-24
    • 2014-02-21
    • 2017-02-07
    • 2012-05-30
    • 1970-01-01
    相关资源
    最近更新 更多