!16 问题起源! :MobilePatternService校验手机号码优化思考。
1.手机号段保存在数据库,计划使用redis做缓存优化
2.太过依赖redis,redis宕机怎么办?
3.redis缓存击穿问题(访问绝对不存在于缓存和数据库数据时,数据库压力大)。
4.基于数据量不大(40多万),数据的不可变性布隆过滤器完美适配这些问题。
!16 布隆过滤器定义! :是一种空间效率极高的概率型算法和数据结构,特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”,这就是布隆过滤器的基本思想。详细定义见文末参考文档。
使用方式:引入maven依赖
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>22.0</version>
</dependency>
效率验证:对比list和布隆过滤器的空间利用效率 :
1.同时向list和布隆过滤器内插入1000万条字符串数据,利用内存监控工具插件实例大小
private BloomFilter<String> bf;
private List<String> list;
/**
* 初始化布隆过滤器
*/
@PostConstruct
public void init() {
// 创建布隆过滤器(默认3%误差),可以设置,设置误差率越小所需内存越大
//create(过滤类型, 期望容量, 误差率),误差率越小,所需内存越大
bf = BloomFilter.create(Funnels.stringFunnel(Charsets.UTF_8), 10000000);
list = Lists.newArrayList();
for (int i = 0; i < 10000000; i++) {
bf.put("阿双方均卡视角发大水发卡司法所发大水发士大夫" + i);
list.add("阿双方均卡视角发大水发卡司法所发大水发士大夫" + i);
}
}
2.内存监控结果:
list:1200m内存占用
布隆过滤器:9m内存占用
具体用法:
使用场景示例
原流程:
1,查询redis缓存,有则直接返回,没有则查询数据库,存在则插入redis并返回。
存在问题:缓存击穿,缓存雪崩
缓存击穿的布隆过滤器解决方案:
public class MobilePatternBiz {
private BloomFilter<String> bf;
@PostConstruct
public void init(){
//将数据从数据库取出,必须分页取出,此处略
List<MobilePattern>allMobilePatterns = mobilePatternService.getAllMobilePattern();
//创建布隆过滤器(默认3%误差),可以设置,设置误差率越小所需内存越大
bf = BloomFilter.create(Funnels.stringFunnel(Charsets.UTF_8), allMobilePatterns .size());
//将号码前缀存入布隆过滤器
for(MobilePattern mobilePattern: allMobilePatterns ){
bf.put(mobilePattern.getMobilePrefix());
}
}
/**
* 校验单个Mobile是否合法
* @param mobile
* @return
*/
public boolean validateMobile(String mobile) {
//如果布隆过滤器中不存在这个号码前缀直接返回,则此号码一定不存在于数据库,挡掉此流量,节约查询资源
if(!bf.mightContain(mobile.subString(0,7)){
System.out.println("此号码不合法");
return false;
}
//查询缓存,如果缓存中存在直接返回缓存数据
Object mobilePattern= redisTemplate.get(mobile);
if(mobilePattern!=null){
return true ;
}
//如果缓存不存在查询数据库
MobilePattern mobilePattern=mobilePatternService.getMobilePattern(randomUser);
if(mobilePattern== null){
return false;
}
//将mysql数据库查询到的数据写入到redis中
redisTemplate.set(mobile,mobilePattern.getMobilePrefix());
return true;
}
}
布隆过滤器使用场景:
1.大数据去重。
2.阻挡查询流量,减少磁盘io。
3.解决缓存穿透问题
4.垃圾邮件过滤
参考文档:
1.https://blog.csdn.net/fouy_yun/article/details/81075432
2.https://www.cnblogs.com/liyulong1982/p/6013002.html
3.https://www.jianshu.com/p/28dd26aaf2ee