1.定义

  • 哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。 也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希函数,存放记录的数组叫做哈希表。

  • 给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的存储位置,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数。说白了,hash函数就是根据key计算出应该存储地址的位置,而哈希表是基于哈希函数建立的一种查找表。

例子:让哈希函数H(x)映射数组中索引x%10处的值。例如,如果值列表是[11,12,13,14,15],则它将分别存储在数组或哈希表中的位置{1,2,3,4,5}。
数据结构-重中之重-搞懂哈希表

2.哈希函数的构造方法

  • 构造函数时容易遇到的 “冲突”
    两个关键字key1!=key2,但是却有f(key1)=f(key2),这种现象,我们称为“冲突”,并把key1与key2称为这个散列函数的同义词。
  • 好的哈希函数的评价标准:
    1)计算简单
    2)散列地址分布均匀

2.1直接定址法

数据结构-重中之重-搞懂哈希表

2.2 数字分析法

数据结构-重中之重-搞懂哈希表

  • 数字分析法通常适合处理关键字位数比较大的情况,如果事先知道关键字的分布且关键字的若干位分布较均匀,就可以考虑用这个方法。

2.3 平方取中法

  • 取关键字平方后的中间几位作为哈希地址。

  • 平方取中法比较适合于不知道关键字的分布,而位数又不是很大的情况。

2.4 折叠法

数据结构-重中之重-搞懂哈希表
数据结构-重中之重-搞懂哈希表

2.5 除留余数法

数据结构-重中之重-搞懂哈希表

  • 本方法的关键在于选择合适的p值。
  • 一般情况下,若散列表表长为m,p为小于或等于表长(最好接近m)的最小质数或不包含小于20质因数的合数。这样可以减少地址的重复(冲突)。
    例子:
    数据结构-重中之重-搞懂哈希表

2.6随机数法

数据结构-重中之重-搞懂哈希表
数据结构-重中之重-搞懂哈希表

3.处理冲突的方法

3.1 开放定址法

数据结构-重中之重-搞懂哈希表

  • 所谓的开放定址法就是一旦发生了冲突,就去寻找下一个空的散列地址,只要散列表足够大,空的散列表地址总能找到,并将记录存入。
  • 公式:数据结构-重中之重-搞懂哈希表
    其中,H(key)为哈希函数,m为哈希表长度,did_i为增量序列,有以下三种取法:
    数据结构-重中之重-搞懂哈希表
    注意:
    did_i取二次探测再散列时表长m必须为4j+3的质数(二次探测再散列表长有限制)
    随机探测时m和di没有公因子(随机探测di有限制)

3.2 再哈希法

数据结构-重中之重-搞懂哈希表

3.3 链地址法

数据结构-重中之重-搞懂哈希表

  • 将所有关键字为同义词的记录存储在同一线性链表中,我们称这种表为同义词子表,在散列表中只存储所有同义词子表的头指针。即产生hash冲突后在存储数据后面加一个指针,指向后面冲突的数据

数据结构-重中之重-搞懂哈希表

3.4 公共溢出区法

数据结构-重中之重-搞懂哈希表
例子:
数据结构-重中之重-搞懂哈希表

4.python-hash表的实现

1.选择哈希函数
2.选择解决冲突的方法

5.hash表的查找

数据结构-重中之重-搞懂哈希表
哈希表的查找时间复杂度:O(1)

相关文章:

  • 2021-07-08
  • 2021-07-23
  • 2021-12-25
  • 2022-01-04
  • 2021-12-24
  • 2021-10-01
猜你喜欢
  • 2022-01-07
  • 2021-09-17
相关资源
相似解决方案