根据雪花表中两个不同的列值删除重复项答案

【问题标题】：Drop duplicates based on Two distinct column values in snowflake table根据雪花表中两个不同的列值删除重复项
【发布时间】：2021-08-15 23:33:14
【问题描述】：

我正在尝试删除基于两列的重复行。如下表的示例

表名称为 REFF_TABLE

LOCATIONID  TICKER  ROW_KEY
AB            PA    201605
AB            PA    201605
AB            PA    201606
AB            PA    201606
DA            PB    201705
DA            PB    201706
DA            PB    201707
DE            PC    201808
DE            PC    201809

我想通过考虑两列来删除重复行 - LOCATIONID, TICKER 。这里需要取ROW_KEY的最大值

最终输出表如下

LOCATIONID  TICKER  ROW_KEY
AB            PA    201606
DA            PB    201707
DE            PC    201809

请帮我解决这个问题

【问题讨论】：

到目前为止你尝试过什么？你在哪里卡住了？
希望 2015 年 StackOverflow 上的这篇文章对您有所帮助：stackoverflow.com/questions/30243945/…

标签： snowflake-cloud-data-platform

【解决方案1】：

一个典型的 SQL GROUP BY 就足够了：

select locationid, ticker, max(row_key) row_key
from table
group by locationid, ticker

【讨论】：