比特币 比较火 书本资料也较少
对cache缓存的概念就不讲了
Filter 判断这个元素在不在 经过filter判断这个元素在不在如果不在的话肯定就不在
而如果在的话(有误差)在从数据库和内存中取
chache和filter 有一定的异曲同工之妙
我们来讲一下hash函数
作用就是通过映射拿到值
hash有个问题 即使value 冲突 ?怎么解决 把映射到同一个value的key作为拉链存起来 比如列表
filter和上述hash一样 不过是把
一个元素 散射到二进制向量里面来
布兰过滤器实现过程
映射到很长很长的二进制向量 比如int就是64的二进制向量
而布隆过滤器可以检索一个元素是否在一个集合中
布隆过滤器优点和缺点
空间复杂度 事件复杂度远远小于其他算法
缺点是勿失识别率和删除困难
为什么那么快
因为是二进制所以快 但是也无法避免一个新的问题 就是准确率低 (天下没有一块完整的蛋糕 不然为什么不直接用他?)
勿识别率低那么为什么还要?
首先讲一下他的勿识别率
首先元素在的时候才会有勿识别率 不在的时候肯定是不在的
如果在任何条件下 识别率都只有80%这样的情况 那么这个算法肯定是没用的
布隆过滤器实现原理
对于任何一个元素 使用映射函数 映射到 向量里 把 0 置为1
新来一个w 用来查询 如果映射0的情况 那么这个w肯定不存在
大白话 :通过左边A和E把向量描红 右边有三个元素需要查找ACB
发现a有 c没有 b有 实际上b是没有的 所以这就导致了勿失别
怎么解决勿失别
filter主要工作就是帮助过滤一下不存在的元素 所以说和cache一样挡了一层 如果不存在再去数据库查找
所以后面还要跟一层数据管理系统 比如mysql 后面的是数据权威机构 而过滤器和cache是预先处理模块