【问题标题】:SQL select data and grouping data by date rangeSQL选择数据并按日期范围分组数据
【发布时间】:2021-06-10 05:30:39
【问题描述】:

我有这样的数据表

price date type
1000 2021-03-13 A
1000 2021-03-14 A
1000 2021-03-15 A
1300 2021-03-16 A
1000 2021-03-17 A
1300 2021-03-18 A
1000 2021-03-19 A
1500 2021-03-20 A
1500 2021-03-21 A
1500 2021-03-22 A
2000 2021-03-13 B
2000 2021-03-14 B
2000 2021-03-15 B
2000 2021-03-16 B
2000 2021-03-17 B

我想查询这样的数据

price startDate endDate type
1000 2021-03-13 2021-03-15 A
1300 2021-03-16 2021-03-16 A
1000 2021-03-17 2021-03-17 A
1300 2021-03-18 2021-03-18 A
1000 2021-03-19 2021-03-19 A
1500 2021-03-20 2021-03-22 A
2000 2021-03-13 2021-03-17 B

下面是我当前的sql,但它根本不正确

SELECT MIN(date) as startDate, MAX(date) as endDate, price, type                                      
                            FROM prices 
                            GROUP BY type, price
                            ORDER BY type, MIN(date)

【问题讨论】:

  • 你的mysql版本是多少?
  • 您如何确保数据按此顺序显示?
  • 什么是空白没有被另一条记录填补,即当记录 (1300,2021-03-16,A) 不存在时?

标签: mysql sql


【解决方案1】:

这是一个间隙和孤岛问题,处理它的一种简单方法是使用行数差异法。假设您使用的是 MySQL 8+,以下应该可以工作:

WITH cte AS (
    SELECT *, ROW_NUMBER() OVER (PARTITION BY type ORDER BY date) rn1,
              ROW_NUMBER() OVER (PARTITION BY type, price ORDER BY date) rn2
    FROM prices
)

SELECT price, MIN(date) AS startDate, MAX(date) AS endDate, type
FROM cte
GROUP BY price, type, rn1 - rn2
ORDER BY type, startDate;

Demo

【讨论】:

  • 它不会检测到没有用其他价格填补的空白,即如果您删除价格为 1300 的记录。这是故意的吗?
  • @Turo 您会看到一些边缘情况,这些情况在 OP 中对我来说并非全部可见。在进行编辑之前,我将等待 OP 的反馈。
  • 我希望你能发布一个解决方案 ;-) 我还没有找到它......
  • @Turo 。 . .日期在问题中没有空白。 OP 没有解释在这种情况下该怎么做。在我看来,这回答了这个问题,并且是解决这个问题的最佳方法之一。 (我能想到一种简化,但不值得回答。)
【解决方案2】:
SELECT MIN(date) as startDate, MAX(date) as endDate, price, type    
FROM prices
GROUP BY type, price
ORDER BY MIN(date) ASC

此查询可能适用于按日期升序排列数据

【讨论】:

  • 太简单了,不会产生预期的结果
【解决方案3】:

如果不使用 CTE,您可以使用以下查询:

SELECT w1.price, w1.date, w2.date, w1.type FROM
(
  SELECT * FROM mytable t1
  WHERE NOT EXISTS (
    SELECT 1 FROM mytable t2
    WHERE 
      t1.price = t2.price AND
      t1.type = t2.type AND
      DATEDIFF(t2.date, t1.date) = -1
  )
) w1
INNER JOIN
(
  SELECT * FROM mytable t1
  WHERE NOT EXISTS (
    SELECT 1 FROM mytable t2
    WHERE 
      t1.price = t2.price AND
      t1.type = t2.type AND
      DATEDIFF(t2.date, t1.date) = +1
  )
) w2
ON
w1.price = w2.price AND
w1.type = w2.type AND
w1.date <= w2.date AND
NOT EXISTS (
  SELECT * FROM mytable t1
  WHERE NOT EXISTS (
    SELECT 1 FROM mytable t2
    WHERE 
      t1.price = t2.price AND
      t1.type = t2.type AND
      DATEDIFF(t2.date, t1.date) = +1
  )
  AND
  w1.price = t1.price AND
  w1.type = t1.type AND
  w1.date <= t1.date AND t1.date < w2.date
)
  1. 获取每个时期的更小和更大的日期。
  2. 加入这些表。
  3. 获取较小日期和较大日期之间的行。

DB Fiddle

【讨论】:

  • @banku。 . .这绝对不是解决问题的最简单方法。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-06-21
  • 2018-09-13
  • 2018-03-13
相关资源
最近更新 更多