【问题标题】:PostgreSQL - optimising joins on latitudes and longitudes comparing distancesPostgreSQL - 在比较距离的纬度和经度上优化连接
【发布时间】:2013-01-04 08:09:39
【问题描述】:

我有两张表,比如 A 和 B,其中包含两列城市信息:纬度和经度。 A 包含 100,000 条记录,B 包含 1,000,000 条记录。我的目标是找到距离 A 1 公里以内的 B 行(对于 A 中的每一行)。我该如何有效地做到这一点?我的目标是不到 30 分钟。

以下查询需要很长时间(我相信这是 100,000 * 1,000,000 = 1000 亿行比较的叉积的结果!):

select *
from A
inner join B
on is_nearby(A.latitude, A.longitude, B.latitude, B.longitude)

is_nearby() 只是一个简单的函数,用于查找经纬度之间的差异。

我对A的一行做了测试,每行大约需要5秒。根据我的计算,查询需要几个星期才能完成执行,这是不可接受的。

【问题讨论】:

  • 我曾考虑过使用 PostGIS,但我不确定它是否会显着提高性能。有人有更好的主意吗?
  • 你看右边相关问题(如this one)的答案了吗?
  • 我尝试了 PostGIS 解决方案,它就像一个魅力。谢谢!

标签: postgresql join query-optimization postgis


【解决方案1】:

是的,PostGIS 会让事情变得更快,因为它 (a) 知道如何将纬度和经度转换为公里(我将使用下面的 geography type),并且 (b) 支持 GiST index,它最适合 GIS。

假设您的系统上有 PostGIS 版本 2,请升级您的数据库和表格:

CREATE EXTENSION postgis;

-- Add a geog column to each of your tables, starting with table A
ALTER TABLE A ADD COLUMN geog geography(Point,4326);
UPDATE A SET geog = ST_MakePoint(longitude, latitude);
CREATE INDEX ON A USING GIST (geog);
--- ... repeat for B, C, etc.

现在寻找距离 A 1 公里以内的 B 行(对于 A 中的每一行):

SELECT A.*, B.*, ST_Distance(A.geog, B.geog)/1000 AS dist_km
FROM A
JOIN B ON ST_DWithin(A.geog, B.geog, 1000);

【讨论】:

  • 我注意到上述解决方案的性能显着提高(至少 100 倍),这正是我所需要的。感谢您的反馈!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-09-02
  • 1970-01-01
  • 2011-10-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多