【问题标题】:Drop duplicates based on Two distinct column values in snowflake table根据雪花表中两个不同的列值删除重复项
【发布时间】:2021-08-15 23:33:14
【问题描述】:

我正在尝试删除基于两列的重复行。如下表的示例

表名称为 REFF_TABLE

LOCATIONID  TICKER  ROW_KEY
AB            PA    201605
AB            PA    201605
AB            PA    201606
AB            PA    201606
DA            PB    201705
DA            PB    201706
DA            PB    201707
DE            PC    201808
DE            PC    201809

我想通过考虑两列来删除重复行 - LOCATIONID, TICKER 。这里需要取ROW_KEY的最大值

最终输出表如下

LOCATIONID  TICKER  ROW_KEY
AB            PA    201606
DA            PB    201707
DE            PC    201809

请帮我解决这个问题

【问题讨论】:

标签: snowflake-cloud-data-platform


【解决方案1】:

一个典型的 SQL GROUP BY 就足够了:

select locationid, ticker, max(row_key) row_key
from table
group by locationid, ticker

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-01-10
    • 2019-08-09
    • 2017-03-02
    • 2021-02-09
    • 1970-01-01
    • 2021-09-06
    • 2021-11-23
    • 1970-01-01
    相关资源
    最近更新 更多