比特币 比较火  书本资料也较少

对cache缓存的概念就不讲了  

Filter 判断这个元素在不在 经过filter判断这个元素在不在如果不在的话肯定就不在

而如果在的话(有误差)在从数据库和内存中取

chache和filter 有一定的异曲同工之妙

我们来讲一下hash函数

布隆过滤器 算法篇

 

 作用就是通过映射拿到值

hash有个问题 即使value 冲突 ?怎么解决 把映射到同一个value的key作为拉链存起来 比如列表

filter和上述hash一样 不过是把

一个元素 散射到二进制向量里面来

 

布兰过滤器实现过程

映射到很长很长的二进制向量 比如int就是64的二进制向量

而布隆过滤器可以检索一个元素是否在一个集合中 

布隆过滤器优点和缺点

空间复杂度 事件复杂度远远小于其他算法  

缺点是勿失识别率和删除困难

为什么那么快

因为是二进制所以快 但是也无法避免一个新的问题 就是准确率低 (天下没有一块完整的蛋糕 不然为什么不直接用他?)

勿识别率低那么为什么还要?

首先讲一下他的勿识别率

首先元素在的时候才会有勿识别率  不在的时候肯定是不在的

如果在任何条件下 识别率都只有80%这样的情况 那么这个算法肯定是没用的 

布隆过滤器实现原理

布隆过滤器 算法篇

 

 对于任何一个元素 使用映射函数 映射到 向量里 把 0 置为1  

新来一个w 用来查询 如果映射0的情况 那么这个w肯定不存在 

布隆过滤器 算法篇

 

 大白话 :通过左边A和E把向量描红  右边有三个元素需要查找ACB 

发现a有 c没有 b有 实际上b是没有的 所以这就导致了勿失别

怎么解决勿失别

filter主要工作就是帮助过滤一下不存在的元素 所以说和cache一样挡了一层 如果不存在再去数据库查找 

所以后面还要跟一层数据管理系统 比如mysql 后面的是数据权威机构过滤器和cache是预先处理模块

 

 

 

 

 

 

 

 

 

 

相关文章:

  • 2021-12-31
猜你喜欢
  • 2021-08-07
  • 2021-04-28
  • 2022-01-15
  • 2022-02-12
  • 2021-07-11
  • 2021-06-16
相关资源
相似解决方案