【问题标题】:SQL Grouping by year gives incorrect resultsSQL 按年份分组给出不正确的结果
【发布时间】:2021-03-26 13:03:46
【问题描述】:

我正在尝试按月、销售区域和类型汇总销售日期。问题是,当我尝试按年份分组时,结果会发生变化。

我的简化查询如下:

SELECT
DAB700.DATUM,DAB000.X_REGION,DAB700.BELEG_ART, // the date, sales region, order type
   // calculate the number of orders per month
   COUNT (DISTINCT CASE WHEN MONTH(DAB700.DATUM) =  1 THEN DAB700.BELEG_NR END) as jan,
   COUNT (DISTINCT CASE WHEN MONTH(DAB700.DATUM) =  2 THEN DAB700.BELEG_NR END) as feb,
   COUNT (DISTINCT CASE WHEN MONTH(DAB700.DATUM) =  3 THEN DAB700.BELEG_NR END) as mar
FROM "DAB700.ADT" DAB700
left join "DAB050.ADT" DAB050 on DAB700.BELEG_NR = DAB050.ANUMMER // join to table 050, to pull in order info
left join "DF030000.DBF" DAB000 on DAB050.KDNR = DAB000.KDNR // join table 000 to table 050, to pull in customer info
left join "DAB055.ADT" DAB055 on DAB050.ANUMMER = left (DAB055.APNUMMER,6)// join table 055 to table 050, to pull in product info
WHERE (DAB700.BELEG_ART = 10 OR DAB700.BELEG_ART = 20) AND (DAB700.DATUM>={d '2021-01-01'}) AND (DAB700.DATUM<={d '2021-01-11'}) AND DAB055.ARTNR <> '999999' AND DAB055.ARTNR <> '999996' AND DAB055.TERMIN <> 'KW.22.22' AND DAB055.TERMIN <> 'KW.99.99' AND DAB050.AUF_ART = 0
group by DAB700.DATUM,DAB000.X_REGION,DAB700.BELEG_ART   

这会返回以下数据,这是正确的(手动检查):

| DATUM      | X_REGION | BELEG_ART | jan | feb | mar |
|------------|----------|-----------|-----|-----|-----|
| 04.01.2021 | 1        | 10        | 3   | 0   | 0   |
| 04.01.2021 | 3        | 10        | 2   | 0   | 0   |
| 04.01.2021 | 4        | 10        | 1   | 0   | 0   |
| 04.01.2021 | 4        | 20        | 1   | 0   | 0   |
| 04.01.2021 | 6        | 20        | 2   | 0   | 0   |
| 05.01.2021 | 1        | 10        | 1   | 0   | 0   |
and so on....

一月的记录总数为 117(正确)。

现在我想汇总一行中的数据(例如,按地区和类型分组的数据)..

所以我改变了我的代码,这样我就有了:

SELECT
YEAR(DAB700.DATUM),

group by YEAR(DAB700.DATUM)

其余代码保持不变。

现在我的结果是:

| EXPR | X_REGION | BELEG_ART | jan | feb | mar |
|------|----------|-----------|-----|-----|-----|
| 2021 | 1        | 10        | 16  | 0   | 0   |
| 2021 | 1        | 20        | 16  | 0   | 0   |
| 2021 | 2        | 10        | 19  | 0   | 0   |
| 2021 | 2        | 20        | 22  | 0   | 0   |
| 2021 | 3        | 10        | 12  | 0   | 0   |
| 2021 | 3        | 20        | 6   | 0   | 0   |

视觉上是正确的。但是,一月份的总数现在是 116。相差 1。我做错了什么?

如何保留第一个代码的结果 - 但它是否按照第二个集合呈现?

【问题讨论】:

    标签: sql grouping advantage-database-server


    【解决方案1】:

    你算不同 BELEG_NR。这就是与众不同的地方。让我们看一个例子。假设您的表包含四行:

    DATUM X_REGION BELEG_ART BELEG_NR
    04.01.2021 1 10 100
    04.01.2021 1 10 200
    05.01.2021 1 10 100
    05.01.2021 1 10 300

    这为您提供每天、地区和 belegart:

    DATUM X_REGION BELEG_ART DISTINCT COUNT BELEG_NR
    04.01.2021 1 10 2
    05.01.2021 1 10 2

    每年,地区和贝莱加特

    YEAR X_REGION BELEG_ART DISTINCT COUNT BELEG_NR
    2021 1 10 3

    BELEG_NR 100 每天不会出现超过一次,因此每个实例都会被计算在内。但它在一年中出现两次,因此只计算一次而不是两次。

    【讨论】:

    • 您好,Thorsten,谢谢!你的解释很有道理。我需要详细检查数据,看看是否合适。如果是这样,在一行(每个地区和类型)上显示每月唯一订单的解决方案是什么?有什么建议吗?
    • 嗯,似乎一个beleg_nr 可以关联多个datum。所以问题是:从商业角度来看,这意味着什么?你应该数还是不数?一个解决方案可能是根本不计算不同的。或者只计算每个beleg_nr 的第一个datum。或者计算不同的datum + beleg_nr...我当然不能回答这个问题。
    • 啊好主意 - 我认为选择第一个日期,对于任何 beleg_nr 都是最好的解决方案,然后计算那些......我会将问题标记为已回答!
    猜你喜欢
    • 1970-01-01
    • 2012-05-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-08-27
    • 2017-12-14
    相关资源
    最近更新 更多