秒速pk10概率_为什么要重写hashcode和equals方法?初级程序员在面试中很少能说清楚。

  • 时间:
  • 浏览:2

     我在面试 Java初级开发的以后 ,一直会问:你有这麼 重写过hashcode措施?不少候选人直接说没写过。或者你想,或许真的没写过,于是就再通过另俩个 那此的难题确认:你在用HashMap的以后 ,键(Key)每种,有这麼 放过自定义对象?而这种以后 ,候选人说放过,于是另俩个 那此的难题的回答就自相矛盾了。

    最近问下来,这种那此的难题普遍回答不大好,于是在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由此亲戚亲戚他们就自然清楚上述那此的难题的答案了。

1 通过Hash算法来了解HashMap对象的高效性

    亲戚亲戚他们先复习数据特征里的另俩个 知识点:在另俩个 长度为n(假设是60 00)的线性表(假设是ArrayList)里,存放着无序的数字;肯能亲戚亲戚他们要找另俩个 指定的数字,就不得不通过从头到尾依次遍历来查找,另另俩个 的平均查找次数是n除以2(这里是60 00)。

亲戚亲戚他们再来观察Hash表(这里的Hash表纯粹是数据特征上的概念,和Java无关)。它的平均查找次数接近于1,代价相当小,关键是在Hash表里,存装在 其中的数据和它的存储位置是用Hash函数关联的。

    亲戚亲戚他们假设另俩个 Hash函数是x*x%5。当然实际具体情况里不肯能用这麼 简单的Hash函数,亲戚亲戚他们这里纯粹为了说明方便,而Hash表是另俩个 长度是11的线性表。肯能亲戚亲戚他们要把6装在 其中,这麼 亲戚亲戚他们首先会对6用Hash函数计算一下,结果是1,所以亲戚亲戚他们就把6装在 到索引号是1这种位置。同样肯能亲戚亲戚他们要放数字7,经过Hash函数计算,7的结果是4,这麼 它将被装在 索引是4的这种位置。这种效果如下图所示。

    另另俩个 做的好处非常明显。比如亲戚亲戚他们要从中找6这种元素,亲戚亲戚他们都都要先通过Hash函数计算6的索引位置,或者直接从1号索引里找到它了。

不过亲戚亲戚他们会遇到“Hash值冲突”这种那此的难题。比如经过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的解决方案。效果如下图所示。

 

    具体的做法是,为所有Hash值是i的对象建立另俩个 同义词链表。假设亲戚亲戚他们在装在 8的以后 ,发现4号位置肯能被占,这麼 就会新建另俩个 链表结点装在 8。同样,肯能亲戚亲戚他们要找8,这麼 发现4号索引里都是8,那会沿着链表依次查找。

    实在亲戚亲戚他们还是无法彻底解决Hash值冲突的那此的难题,或者Hash函数设计合理,仍能保证同义词链表的长度被控制在另俩个 合理的范围里。这里讲的理论知识暂且无的放矢,亲戚亲戚他们能在后文里清晰地了解到重写hashCode措施的重要性。

2 为那此要重写equals和hashCode措施

    当亲戚亲戚他们用HashMap存入自定义的类时,肯能不重写这种自定义类的equals和hashCode措施,得到的结果会和亲戚亲戚他们预期的不一样。亲戚亲戚他们来看WithoutHashCode.java这种例子。

在其中的第2到第18行,亲戚亲戚他们定义了另俩个 Key类;在其中的第3行定义了唯一的另俩个 属性id。当前亲戚亲戚他们先注释掉第9行的equals措施和第16行的hashCode措施。    

1	import java.util.HashMap;
2	class Key {
3		private Integer id;
4		public Integer getId() 
5	{return id; }
6		public Key(Integer id) 
7	{this.id = id;	}
8	//故意先注释掉equals和hashCode措施
9	//	public boolean equals(Object o) {
10	//		if (o == null || !(o instanceof Key)) 
11	//		{ return false;	} 
12	//		else 
13	//		{ return this.getId().equals(((Key) o).getId());}
14	//	}
15		
16	//	public int hashCode() 
17	//	{ return id.hashCode();	}
18	}
19	
20	public class WithoutHashCode {
21		public static void main(String[] args) {
22			Key k1 = new Key(1);
23			Key k2 = new Key(1);
24			HashMap<Key,String> hm = new HashMap<Key,String>(); 
25			hm.put(k1, "Key with id is 1");		
26			System.out.println(hm.get(k2));		
27		}
28	}

    在main函数里的第22和23行,亲戚亲戚他们定义了另俩个 Key对象,它们的id都是1,就好比它们是两把相同的都能打开同一扇门的钥匙。

    在第24行里,亲戚亲戚他们通过泛型创建了另俩个 HashMap对象。它的键每种都都要存放Key类型的对象,值每种都都要存储String类型的对象。

    在第25行里,亲戚亲戚他们通过put措施把k1和一串字符装在 到hm里; 而在第26行,亲戚亲戚他们想用k2去从HashMap里得到值;这就好比亲戚亲戚他们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果都是亲戚亲戚他们想象中的那个字符串,也不null。

    愿因有另俩个 —这麼 重写。第一是这麼 重写hashCode措施,第二是这麼 重写equals措施。

   当亲戚亲戚他们往HashMap里放k1时,首先会调用Key这种类的hashCode措施计算它的hash值,以后把k1装在 hash值所指引的内存位置。

    关键是亲戚亲戚他们这麼 在Key里定义hashCode措施。这里调用的仍是Object类的hashCode措施(所有的类都是Object的子类),而Object类的hashCode措施返回的hash值实在是k1对象的内存地址(假设是60 0)。

    

    肯能亲戚亲戚他们以后是调用hm.get(k1),这麼 亲戚亲戚他们会再次调用hashCode措施(还是返回k1的地址60 0),以后根据得到的hash值,能这麼快地找到k1。

    但亲戚亲戚他们这里的代码是hm.get(k2),当亲戚亲戚他们调用Object类的hashCode措施(肯能Key里没定义)计算k2的hash值时,实在得到的是k2的内存地址(假设是60 0)。肯能k1和k2是另俩个 不同的对象,所以它们的内存地址一定不需要相同,也也不说它们的hash值一定不同,这也不亲戚亲戚他们无法用k2的hash值去拿k1的愿因。

    当亲戚亲戚他们把第16和17行的hashCode措施的注释加带后,会发现它是返回id属性的hashCode值,这里k1和k2的id都是1,所以它们的hash值是相等的。

    亲戚亲戚他们再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是60 ,把k1对象装在 到对应的位置。而取k2时,是先计算它的hash值(肯能k2的id也是1,这种值也是60 ),以后到这种位置去找。

    但结果会出乎亲戚亲戚他们意料:明明60 号位置肯能有k1,但第26行的输出结果依然是null。其愿因也不这麼 重写Key对象的equals措施。

    HashMap是用链地址法来解决冲突,也也不说,在60 号位置上,有肯能所处着多个用链表形式存储的对象。它们通过hashCode措施返回的hash值都是60 。

     当亲戚亲戚他们通过k2的hashCode到60 号位置查找时,实在会得到k1。但k1有肯能仅仅是和k2具有相同的hash值,但暂且和k2相等(k1和k2两把钥匙暂且能开同一扇门),这种以后 ,就都要调用Key对象的equals措施来判断两者否有相等了。

    肯能亲戚亲戚他们在Key对象里这麼 定义equals措施,系统就不得不调用Object类的equals措施。肯能Object的固有措施是根据另俩个 对象的内存地址来判断,所以k1和k2一定不需要相等,这也不为那此依然在26行通过hm.get(k2)依然得到null的愿因。

    为了解决这种那此的难题,亲戚亲戚他们都要打开第9到14行equals措施的注释。在这种措施里,或者另俩个 对象都是Key类型,或者它们的id相等,它们就相等。

3 对面试那此的难题的说明

    肯能在项目里一直会用到HashMap,所以我在面试的以后 都是问这种那此的难题∶你有这麼 重写过hashCode措施?你在使用HashMap时有这麼 重写hashCode和equals措施?你是缘何写的?

    根据问下来的结果,我发现初级多线程 员对这种知识点普遍没掌握好。重申一下,肯能亲戚亲戚他们要在HashMap的“键”每种存放自定义的对象,一定要在这种对象里用被委托人的equals和hashCode措施来覆盖Object里的同名措施。 

     本文是从Java核心技术及面试指南这本书中相关内容改编而来。