从HashMap源角度解释一下为什么对象的hashcode()和equals()方法要一起重写

最新推荐文章于 2026-06-25 18:32:41 发布

原创最新推荐文章于 2026-06-25 18:32:41 发布 · 1.2k 阅读

19 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#哈希算法 #散列表 #算法

整个逻辑链条的核心在于 HashMap 如何确定一个键 (key) 的位置以及如何解决哈希冲突。我们将通过 put 和 get 方法的执行流程来清晰地看到这两个方法是如何被协同使用的。

1. HashMap 的存储结构：数组 + 链表/红黑树

首先，要明白 HashMap 的底层是一个 Node<K,V>[] table 数组。数组的每个位置称为一个 “桶” (bucket) 或 “槽” (slot)。
当你放入一个键值对时，HashMap 会根据键的 hashCode() 值经过一番运算，得到这个键值对应在数组中的下标索引。

2. put(K key, V value) 方法流程分析

当我们调用 map.put(key, value) 时，源码中的核心逻辑如下（简化版）：

计算哈希值，确定桶索引：

// 计算 key 的哈希值 (并非直接使用 hashCode(), 还会进行扰动处理)
int hash = hash(key);
// 根据哈希值和数组长度，通过 (n - 1) & hash 计算数组下标 i
int i = indexFor(hash, table.length); // JDK8 中这步直接内联在代码里

这一步完全依赖 key.hashCode()。如果两个逻辑相等的 key 对象返回不同的 hashCode，它们极有可能被分配到不同的桶中。
遍历链表/树，查找 key 是否已存在：
找到数组下标 i 后，会遍历该位置上的链表（或红黑树）。

// 伪代码，表示遍历过程
for (Node<K,V> e = table[i]; e != null; e = e.next) {
// 这是一个非常关键的条件判断！
if (e.hash == hash &&
((e.key == key) || (key != null && key.equals(e.key)))) {
// 找到了已存在的 key，进行覆盖操作
V oldValue = e.value;
e.value = value;
return oldValue;
}
}

这个 if 判断条件是整个流程的灵魂，它分两步进行短路与 (&&) 判断，目的是为了高效：
- 第一重检查 e.hash == hash：先比较当前遍历到的节点 e 的哈希值是否和要插入的 key 的哈希值相等。这是一个非常快的 int 比较。如果哈希值都不同，那么 key 肯定不同，就直接跳过，无需调用耗时的 equals 方法。这解释了为什么不同对象尽量要有不同的哈希值（性能优化）。
- 第二重检查：如果哈希值相同（发生了哈希碰撞），则再进行深入的比较。它又分两步：
  - (e.key == key)：先检查是否是同一个对象（引用地址相同），这是最快的判断。
  - (key != null && key.equals(e.key))：如果不是同一个对象，再调用我们重写的 equals() 方法进行逻辑相等的判断。
执行插入：
- 如果在上面的遍历中找到了相同的 key，则覆盖旧的 value。
- 如果没找到，则在链表（或树）的末尾创建一个新节点，将新的键值对插入。

3. get(Object key) 方法流程分析

get 方法的逻辑与 put 几乎一模一样：

计算 key 的 hashCode() 找到桶的位置 i。
遍历桶中的链表/树，使用相同的判断条件：if (e.hash == hash && ((e.key == key) || (key != null && key.equals(e.key))))。
如果找到，返回 value；如果找不到，返回 null。

4. 源码视角下的结论与反例论证

现在，让我们回到最初的问题：为什么必须一起重写？

场景再现（只重写 equals，不重写 hashCode）：

假设有一个类 MyKey，我们只重写了 equals（认为某个字段相同即相等），但没有重写 hashCode。

创建两个逻辑相等的对象：
MyKey key1 = new MyKey(1, "A");
MyKey key2 = new MyKey(1, "A"); // 根据 equals，key1.equals(key2) 为 true
执行 map.put(key1, "Value1")：
- HashMap 调用 key1.hashCode()。由于没重写，使用 Object 的默认实现，返回值为 H1。
- 根据 H1 计算出索引 i，将 <key1, "Value1"> 放入对应的桶中。
执行 map.get(key2)：
- HashMap 调用 key2.hashCode()。由于没重写，使用 Object 的默认实现。key1 和 key2 是两个不同的对象，它们的默认哈希值极大概率不同（比如返回 H2, H1 != H2）。
- 根据 H2 计算出的索引 j，极大可能 i != j。
- HashMap 会去索引为 j 的桶里查找。而这个桶里根本没有元素（或者有其它不相关的元素）。
- 因此，HashMap 直接返回 null，告诉你找不到这个键。尽管 key1.equals(key2) 为 true！

这就是 Bug 产生的根源。 HashMap 的整个查询机制第一步永远是靠 hashCode 定位桶。如果桶都定位错了，它根本就没机会去调用你精心重写的 equals 方法。

总结

从 HashMap 源码的角度看，hashCode() 和 equals() 的分工非常明确：

hashCode() 的作用：定位，快速确定键值对在哈希表数组中的可能位置（哪个桶）。这是高效访问的第一道关卡。
equals() 的作用：确认，在哈希冲突发生（即找到同一个桶）后，比较键的逻辑内容是否真正相等。这是确保准确性的最后一道关卡。

它们的关系是协同作战：

hashCode 不相等 → equals 一定没机会被调用 → 对象一定不相等（对于 HashMap 而言）。
hashCode 相等 → 再调用 equals 进行最终确认。

因此，如果你重写了 equals，改变了对象相等的语义，就必须同时重写 hashCode，确保语义上相等的对象也能被 HashMap 的第一道关卡（hashCode）引导到同一个桶里，这样你的第二道关卡（equals）才有用武之地。否则，整个 HashMap 的存储和检索逻辑都会出错。这就是Java对象契约（hashCode 与 equals 必须一致）的强制性和重要性。