为什么 HashMap 的长度是 2 的幂次方?

在分析 HashMap 的长度为什么是 2 的幂次方之前,先来了解一下 HashMap 的内部实现原理。HashMap 基于数组和链表(或红黑树)实现,用于存储键值对。在 HashMap 中,存储数据的底层结构是一个数组,数组中的每个元素都是一个链表的头结点,用于解决哈希冲突的问题。

1. 哈希冲突
当不同的 key 经过哈希函数计算后得到的哈希值相同,这就是哈希冲突。哈希函数的目的是将不同的 key 均匀地分布到数组中的不同位置,以减少哈希冲突的概率。然而,由于哈希函数具有一定的局限性,无法完全避免哈希冲突的发生。

2. 解决哈希冲突的方法
为了解决哈希冲突,HashMap 使用了链表和红黑树的组合数据结构。当多个 key 映射到数组的同一个位置时,它们被放入同一个链表中。当链表的长度大于 8 时,链表会转化为红黑树,以提高查找效率。

3. 容量和负载因子
HashMap 的容量是指数组的大小,而负载因子是指数组中已有元素和数组总长度的比值。在 HashMap 中,负载因子的默认值为 0.75。当数组中已有元素的数量超过了负载因子与数组长度的乘积,就会触发扩容操作,即重新计算数组长度并重新分配元素。

4. 2 的幂次方长度的好处
HashMap 的容量采用 2 的幂次方长度是为了提高散列的效果。HashMap 中的哈希函数将 key 映射到数组中的某个位置,该位置的计算方式是 (key.hashCode() & (capacity-1)),其中 capacity 表示数组的长度。由于整数的二进制表示中,除了第一位为 1,其他位均为 0,因此 capacity-1 的二进制形式的所有位都为 1。这就保证了 (key.hashCode() & (capacity-1)) 对 capacity 取模的结果的合理性。

通过采用 2 的幂次方作为长度,当 capacity 为 2 的幂次方时,capacity-1 的二进制形式中,除了最高位为 0,其他位都为 1。这样做的好处是,位运算 (key.hashCode() & (capacity-1)) 只保留了 hashCode 的几位有效位,也就是当前元素在数组中的索引位置。这样就能够更好地分散元素,减少哈希冲突的发生。

综上所述,HashMap 的长度为 2 的幂次方有助于减少哈希冲突的发生,提高 HashMap 的性能和效率。这是为了通过位运算 (key.hashCode() & (capacity-1)) 更好地分散元素,减少冲突所采取的一种优化策略。