Mysql分库分表 - 爱码网

介绍

分表场景
对于访问极为频繁且数据量巨大的单表来说，我们首先要做的就是减少单表的记录条数，以便减少数据查询所需要的时间，提高数据库的吞吐量（每秒能查询到的数据量），这就是所谓的分表！

分库场景
分表能够解决单表数据量过大带来的查询效率下降的问题，但是，却无法给数据库的并发处理能力带来质的提升。面对高并发的读写访问，当数据库master服务器无法承载写操作压力时，不管如何扩展slave服务器，此时都没有意义了。【MySQL主从复制模式，“一主多从” 方式做集群，这样MySQL数据库的查询可以支持更高的并发量，但是写入因为要互斥使得并发量不能得到提升】

垂直分表
拆分是基于关系型数据库中的“列”（字段）进行的。通常情况，某个表中的字段比较多，可以新建立一张“扩展表”，将不经常使用或者长度较大的字段拆分出去放到“扩展表”中。
【拆分字段的操作建议在数据库设计阶段就做好。如果是在发展过程中拆分，则需要改写以前的查询语句，会额外带来一定的成本和风险，建议谨慎。】

垂直分库
一个数据库由很多表的构成，每个表对应着不同的业务，垂直切分是指按照业务将表进行分类，分布到不同的数据库上面，这样也就将数据或者说压力分担到不同的库上面
Mysql分库分表

水平分表
水平分表也称为横向分表，就是将表中不同的数据行按照一定规律分布到不同的数据库表中（这些表保存在同一个数据库中），这样来降低单表数据量，优化查询性能。最常见的方式就是通过主键或者时间等字段进行Hash和取模后拆分
【水平分表，能够降低单表的数据量，一定程度上可以缓解查询性能瓶颈。但本质上这些表还保存在同一个库中，所以库级别还是会有IO瓶颈。所以，一般不建议采用这种做法】

水平分库分表
相对于垂直拆分，水平拆分不是将表做分类，而是按照某个字段的某种规则来分散到多个库之中，每个表中包含一部分数据。简单来说，我们可以将数据的水平切分理解为是按照数据行的切分，就是将表中的某些行切分到一个数据库，而另外的某些行又切分到其他的数据库中
Mysql分库分表

问题

跨库join问题
在拆分之前，系统中很多列表和详情页所需的数据是可以通过sql join来完成的。而拆分后，数据库可能是分布式在不同实例和不同的主机上，join将变得非常麻烦。而且基于架构规范，性能，安全性等方面考虑，一般是禁止跨库join的；
【代理中间件Mycat使用全局表的方案，解决此问题，但是其只允许两分片表的join】【使用中间件mycat做分库分表，它可以代理后端的N个MySQL数据库，使得它前面的应用层代码无需改变】
全局唯一ID问题
在数据库进行分片之后（即水平拆分后），每个表的主键都是单独自增的，这样会导致水平分表后各个表的id会重复；
分布式的全局唯一ID生成可以用雪花算法，然后Mycat有自己的一套方案解决ID唯一问题