本文内容
- 问题
- 存储结构
- 算法1:简单SQL查询
- 算法2:均匀分区设计
- 算法3:树形分区设计
- 算法4:积分排名数组
该文具体出自哪里,不是很确定,而我是在某个微信公众号上看到的~文中的内容比较有启发性的~
问题
某海量用户网站,用户拥有积分,积分可能会在使用过程中随时更新。现在要为该网站设计一种算法,在每次用户登录时显示其当前积分排名。用户最大规模为2亿;积分为非负整数,且小于100万。
PS:据说这是迅雷的一道面试题,不过问题本身具有很强的真实性,所以本文打算按照真实场景来考虑,而不局限于面试题的理想环境。
存储结构
首先,我们用一张用户积分表user_score来保存用户的积分信息。
表结构:
示例数据:
下面的算法会基于这个基本的表结构来进行。
算法1:简单SQL查询
首先,很容易想到的解决方案是,用一条简单的SQL语句查询出积分大于该用户积分的用户数量:
as rankfrom user_score t1, user_score t2
where t1.uid = @uid and t2.score > t1.score