一 、什么是哈希表
哈希表的英文叫 Hash Table,也可以称为散列表或者 Hash 表。哈希表用的是数组支持按照下标随机访问数据的特性,所以哈希表其实就是数组的一种扩展,由数组演化而来。可以说,如果没有数组,就没有散列表。哈希表存储的是由键(key)和值(value)组成的数据。
二、哈希表的结构
JDK1.8以前哈希表是由数组+链表组成
JDK1.8开始哈希表是由数组+链表+红黑树组成
加入红黑树的好处:
链表的特点是增删快,查询慢。所以链表越长就会导致查询越慢,而红黑树恰好解决这一问题。
数组类型:哈希表的数组类型是java.util包下的HashMap$Node类型的数组
/**
* Basic hash bin node, used for most entries. (See below for
* TreeNode subclass, and in LinkedHashMap for its Entry subclass.)
*/
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
数组长度:
未定义数组长度会创建一个初始化长度为16的数组
如果定义了数组长度则数组是最接近二的n次方。例:定义长度为100的数组实际长度为128=2的6次方。
三、哈希表的新增
- 计算新增元素的哈希值。
- 用hash%数组长度,计算索引值。
- 判断该索引值位置是否为空; 1. 如果该索引值为空直接新增;2. 如果不为空,则判断该索引值位置的元素是否重复; 1. 如果重复则不新增;2. 如果不重复则新增到链表的最后。
//判断是否重复的规则
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
判断是否重复的规则可以理解为
比较两个元素的的哈希值是否相同 && (地址值相同 || equals相同)
true为重复,不新增;false为不重复,新增。
可以借助下图来理解
注意:equals()方法是object类的方法,比较的是地址值。如果要比较内容需要重写hashCode()方法和equals()方法。
四、哈希表的扩容
哈希表的底层数组会在一下两种情况下扩容:
- 当同一索引值下的元素超过8个且数组长度小于64;
- 数组的索引值占有率超过0.75时(0.75为加载因子,加载因子是可以自己设置的,0.75是默认值)
扩容后的新容量 = 旧容量 << 1;
扩容后的新容量就等于旧容量的二倍。
可以借助下面的图来理解:
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
如图所示,当数组长度为16,索引值0下面的元素超过8个,数组就会扩容,数组长度变为32,而索引值0会与索引值16平分索引值0下的元素。直到数组长度达到64,那么此时,索引值0会与索引值32平分,索引自16会与索引值48平分。
什么情况下链表转红黑树?
当数组的长度大于64且同一索引值位置下元素超过8.
如图所示:
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
版权归原作者 柒画503 所有, 如有侵权,请联系我们删除。