Mysql分组排序的三种方法以及substring_index

用惯了hive的row_number，在Mysql中想要使用分组排序的功能时，却发现不那么简单 —— 貌似不能一个函数解决。

有时候又特别需要使用，怎么办呢？不慌，这也还是有方法的。

首先建立数据表：

create table t_variable
(
name_people VARCHAR(255) NOT NULL comment \'姓名\',
grade VARCHAR(255) NOT NULL comment \'年级\',
course VARCHAR(255) NOT NULL comment \'科目\',
score VARCHAR(255) NOT NULL comment \'分数\'
)ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=\'test_变量\';

insert into t_variable(name_people, grade, course, score) values(\'花满楼\',5,\'数学\',86);
insert into t_variable(name_people, grade, course, score) values(\'陆小凤\',5,\'数学\',94);
insert into t_variable(name_people, grade, course, score) values(\'西门吹雪\',5,\'数学\',90);
insert into t_variable(name_people, grade, course, score) values(\'花满楼\',5,\'语文\',97);
insert into t_variable(name_people, grade, course, score) values(\'陆小凤\',5,\'语文\',95);
insert into t_variable(name_people, grade, course, score) values(\'西门吹雪\',5,\'语文\',89);
insert into t_variable(name_people, grade, course, score) values(\'花满楼\',5,\'科学\',93);
insert into t_variable(name_people, grade, course, score) values(\'陆小凤\',5,\'科学\',96);
insert into t_variable(name_people, grade, course, score) values(\'西门吹雪\',5,\'科学\',94);

那么，分组排序：

方法一：使用变量@ —— 还可以选择排名在第几的人。

select
    name_people,
    course,
    score,
    @ss,
    @tt,
    if(@ss=course, @tt:=@tt+1, @tt:=1) as rk,
    @ss:=course as a_course
from 
(
select
    * 
from 
    t_variable
order by 
    course,
    score desc    # 先按分组字段和排序字段进行整体排序，这样相同选择字段的记录就会前后排列
) as t1
cross join       #直接笛卡尔积
(
    select 
      @ss:=\'\',  #初始值
      @tt:=0
) as t2;

方法二：group_concat —— 同一分组内的值先连接，再选取；#[Err] 1140 - In aggregated query without GROUP BY, expression #1，使用group_concat必须用group by

select     
  course,
  group_concat(score order by score desc) as sc   #连接的是排序字段
from 
    t_variable   
group by 
  course   #分组字段

可使用 substring_index 进行选择第几个：

select     
  course,
  substring_index(group_concat(score order by score desc),\',\',1) as sc
from 
    t_variable 
group by 
  course

当然，如果要知道是哪条记录在排名第一的位置，需要用这个结果与原始表join选择一下。

方法三：通过join查询实现

select 
    *
from 
(
    select 
        a.course,
        a.score,
        count(*) as sc
        from t_variable as a
        left join 
            t_variable as b
            on 
                a.course=b.course    #本来的分组字段
                and 
                a.score<=b.score     #本来的排序字段
        group by 
            course,                  #此时才对以上结果进行分组
            score
) as c
where 
    c.sc=1;

这个稍微复杂一点，是通过join之后，进行筛选，再对筛选结果分组计数得到，只需要看个中间表即可 —— 因为最大值小于等于的值只有它本身，也就是对小于等于的记录进行计数count时，值会为1，其他非最大值都会大于1：

select 
        a.course,
        a.score,
        count(*) as sc
        from t_variable as a
        left join 
            t_variable as b
            on 
                a.course=b.course
                and 
                a.score<=b.score
        group by 
            course,    
            score;

附：substring_index —— SUBSTRING_INDEX(str,delim,count)，用于获取子字符串

-- str:待处理字符串
-- delim:分隔符
-- count:计数值

若count是正数，则从左往右数，第count个分隔符左边的字符串
若count是负数，则从右往左数，第count个分隔符右边的字符串

select substring_index(\'烽火台、长城、颐和园、北海\',\'、\',1)
select substring_index(\'烽火台、长城、颐和园、北海\',\'、\',3)

select substring_index(\'烽火台、长城、颐和园、北海\',\'、\',-2)

select substring_index(substring_index(\'烽火台、长城、颐和园、北海\',\'、\',2),\'、\',\'-1\')  #如果选中间的子字符串，可以嵌套

参考：

https://blog.csdn.net/m0_37797991/article/details/80511855

https://www.cnblogs.com/mqxs/p/7380933.html