【发布时间】:2011-06-02 17:50:46
【问题描述】:
我有这样的表格数据:
id,time,otherdata
a,1,fsdfas
a,2,fasdfag
a,3,fasdfas
a,7,asfdsaf
b,8,fasdf
a,8,asdfasd
a,9,afsadfa
b,10,fasdf
...
所以本质上,我可以按我想要的顺序选择所有数据,方法是:
select * from mytable ordered by id,time;
所以我按照我想要的顺序获取所有记录,首先按 id 排序,然后按时间排序。但不是获取所有记录,我需要每个 id 的最新 3 次。
答案:
嗯,我想出了怎么做。我对它的速度感到惊讶,因为我正在处理几百万行数据并且花了大约 11 秒。我在 sql 脚本中编写了一个过程来执行此操作,这就是它的样子。 --注意,不是获取最后3个,而是获取最后“n”行数据。
use my_database;
drop procedure if exists getLastN;
drop table if exists lastN;
-- Create a procedure that gets the last three records for each id
delimiter //
create procedure getLastN(n int)
begin
# Declare cursor for data iterations, and variables for storage
declare idData varchar(32);
declare done int default 0;
declare curs cursor for select distinct id from my_table;
declare continue handler for not found set done = 1;
open curs;
# Create a temporary table to contain our results
create temporary table lastN like my_table;
# Iterate through each id
DATA_LOOP: loop
if done then leave DATA_LOOP; end if;
fetch curs into idData;
insert into lastThree select * from my_table where id = idData order by time desc limit n;
end loop;
end//
delimiter ;
call getLastN(3);
select * from lastN;
很抱歉,如果这不完全有效,我不得不更改变量名称和其他东西来混淆我的工作,但我运行了这段确切的代码并得到了我需要的东西!
【问题讨论】:
标签: mysql sql-order-by limit greatest-n-per-group