【发布时间】:2010-09-14 19:24:25
【问题描述】:
这是一次冒险。我从位于 my previous question 的循环重复查询开始,但每个循环都会遍历所有 1700 万条记录,这意味着需要数周时间(仅运行 *select count * from MyTable* 需要我的服务器 4:30 分钟使用 MSSQL 2005)。我从这个网站和post 获得了一些信息。
并且已经到达下面的查询。问题是,对于任何类型的性能,这是对 1700 万条记录运行的正确查询类型吗?如果不是,那是什么?
SQL 查询:
DELETE tl_acxiomimport.dbo.tblacxiomlistings
WHERE RecordID in
(SELECT RecordID
FROM tl_acxiomimport.dbo.tblacxiomlistings
EXCEPT
SELECT RecordID
FROM (
SELECT RecordID, Rank() over (Partition BY BusinessName, latitude, longitude, Phone ORDER BY webaddress DESC, caption1 DESC, caption2 DESC ) AS Rank
FROM tl_acxiomimport.dbo.tblacxiomlistings
) al WHERE Rank = 1)
【问题讨论】:
标签: sql sql-server duplicate-data sql-delete