【发布时间】:2021-03-16 20:56:37
【问题描述】:
我有一个大的 Postgres 数据集表, 表('tbl')有 4 列, 和类似的数据:
| ID | address | x,y |
|---|---|---|
| 1 | 22 E 4th Ave, Cordele, GA, 11015 | x1,y1 |
| 2 | 22 E 4th Ave, Cordele, GA 11015 | x2,y2 |
| 3 | 408 E 5th Ave, Cordele, CA 11215 | x2,y2 |
| 4 | 408 E 5th Ave, Cordele, CA, 11215 | x2,y2 |
| 5 | 408 E 5th Ave, vic, VA, 11215 | x2,y2 |
| 6 | 408 E 5th Ave, vic, VA, 11215 | x3,y3 |
我的问题是,如何找到所有具有相似地址的地址(相似地址意味着忽略状态和 zip 之间的逗号,这是唯一应该忽略的部分),但是有不同'x,y' 值
在上面的例子中,id 1 和 2 应该被返回,因为它们有相同的地址(用逗号区分)但是不同的 'x,y' 值。
不应返回 ID 3 和 4,因为它们的 'x,y' 值相同。
不应返回 ID 5 和 6,因为它们的地址值相同。
*我可以指望地址格式总是有一个状态和一个 zip
【问题讨论】:
标签: sql postgresql street-address