PostgreSQL - 在比较距离的纬度和经度上优化连接答案

【问题标题】：PostgreSQL - optimising joins on latitudes and longitudes comparing distancesPostgreSQL - 在比较距离的纬度和经度上优化连接
【发布时间】：2013-01-04 08:09:39
【问题描述】：

我有两张表，比如 A 和 B，其中包含两列城市信息：纬度和经度。 A 包含 100,000 条记录，B 包含 1,000,000 条记录。我的目标是找到距离 A 1 公里以内的 B 行（对于 A 中的每一行）。我该如何有效地做到这一点？我的目标是不到 30 分钟。

以下查询需要很长时间（我相信这是 100,000 * 1,000,000 = 1000 亿行比较的叉积的结果！）：

select *
from A
inner join B
on is_nearby(A.latitude, A.longitude, B.latitude, B.longitude)

is_nearby() 只是一个简单的函数，用于查找经纬度之间的差异。

我对A的一行做了测试，每行大约需要5秒。根据我的计算，查询需要几个星期才能完成执行，这是不可接受的。

【问题讨论】：

我曾考虑过使用 PostGIS，但我不确定它是否会显着提高性能。有人有更好的主意吗？
你看右边相关问题（如this one）的答案了吗？
我尝试了 PostGIS 解决方案，它就像一个魅力。谢谢！

标签： postgresql join query-optimization postgis

【解决方案1】：

是的，PostGIS 会让事情变得更快，因为它 (a) 知道如何将纬度和经度转换为公里（我将使用下面的 geography type），并且 (b) 支持 GiST index，它最适合 GIS。

假设您的系统上有 PostGIS 版本 2，请升级您的数据库和表格：

CREATE EXTENSION postgis;

-- Add a geog column to each of your tables, starting with table A
ALTER TABLE A ADD COLUMN geog geography(Point,4326);
UPDATE A SET geog = ST_MakePoint(longitude, latitude);
CREATE INDEX ON A USING GIST (geog);
--- ... repeat for B, C, etc.

现在寻找距离 A 1 公里以内的 B 行（对于 A 中的每一行）：

SELECT A.*, B.*, ST_Distance(A.geog, B.geog)/1000 AS dist_km
FROM A
JOIN B ON ST_DWithin(A.geog, B.geog, 1000);

【讨论】：

我注意到上述解决方案的性能显着提高（至少 100 倍），这正是我所需要的。感谢您的反馈！