广州网站开发费用,专业的上海网站建设,江苏网站建设找哪家,宁波建设网站多少钱哈希表
概述
给美分数据分配一个编号,放入表格(数组)
建立编号与表格索引的关系,将来就可以通过编号快速查找数据
理想情况编号当唯一,数组能容纳所有数据现实是不能说为了容纳所有数据造一个超大数组,编号也可能重复
解决
有限长度的数组,以[拉链]方式存储数据允许编号适…哈希表
概述
给美分数据分配一个编号,放入表格(数组)
建立编号与表格索引的关系,将来就可以通过编号快速查找数据
理想情况编号当唯一,数组能容纳所有数据现实是不能说为了容纳所有数据造一个超大数组,编号也可能重复
解决
有限长度的数组,以[拉链]方式存储数据允许编号适当重复,通过数据自身来进行区分
代码
基础代码
public class HahTable {//节点类static class Entry{int hash; //哈希码Object key; //键Object value; //值Entry next;public Entry(int hash, Object key, Object value) {this.hash hash;this.key key;this.value value;}}//创建一个数组,数组里面装的是Entry节点,也就是链表的头节点Entry[] table new Entry[16];int size 0; //元素个数
}
获取 这里实际上可以使用取余运算,如果key值是9,8对数组的长度进行求余数,可以得出来是0,所以可以在数组0的那根链表上继续进行查找 可以看出索引3位置处就没有元素,返回的就是null
//根据hash码获取valueprivate Object get(int hash,Object key){//hash码与数组的长度减一,实际上取到的就是索引值int index hash (table.length - 1);//如果数组的该索引位置处没有值的话,也不会有对应的value值,所以可以直接返回if(table[index] null){return null;}//将table数组处index索引位置处的链表找到Entry p table[index];//遍历链表while (p ! null){//如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回if(p.key.equals(key)){return p;}p p.next;}//找到最后都没有的话,返回null值return null;}
插入 插入实际上也是,索引3位置处并没有内容,所以可以直接插入,而其他索引位置处就需要找到链表进行对应的位置插入了 //向hash表存入新的key,value如果key重复,则更新valueprivate void put(int hash,Object key,Object value){//hash码与数组的长度减一,实际上取到的就是索引值int index hash (table.length - 1);//接下来会有两种情况//第一种:index索引位置处有空位置,直接新增if(table[index] null){table[index] new Entry(hash,key,value);}else{//第二种:index索引位置处没有空位,沿着链表查找,有key值的话,更新,没有的话新增Entry p table[index];//遍历链表while (true){//如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回if(p.key.equals(key)){p.value value;return;}if(p.next null){break;}p p.next;}//此时的p就是最后一个节点p.next new Entry(hash,key,value);}size;}
删除
//根据hash码删除,返回删除的valueprivate Object remove(int hash,Object key){//hash码与数组的长度减一,实际上取到的就是索引值int index hash (table.length - 1);//如果数组的index位置处为null直接返回nullif(table[index] null){return null;}//找到数组索引位置处的链表Entry p table[index];Entry prev null;//设置删除节点的父节点while (p ! null){if(p.key.equals(key)){//找到了删除节点//如果删除的是头节点的话,将数组索引位置处的元素设置为链表头节点的下一个元素if(prev null){table[index] p.next;}else{//如果不是的话,将父节点的next指向儿子节点的next,这样就把儿子节点忽略掉了prev.next p.next;}return p.value;}prev p; //将当前节点设置称为删除节点的父节点p p.next;}return null;} 此时会出现一个问题,就是如果说元素内容并不多,但是数组长度会很长则造成了空间的浪费,如果说数组长度不长,但是元素足够多就会导致增删改查的效率变低,所以需要在合适的时候对数组进行扩容,这里就引出了一个新的名词负载因子 扩容
负载因子公式如下图所示 从上面可以看出n代表的是元素的个数,m代表的是数组的长度,他们的比值最好在4分之3左右扩容之后一般采取的办法是容量进行翻倍 float loadFactor 0.75f;//负载因子大小 12称为阈值int threshold (int) (loadFactor * table.length);//这个实际上计算的实际上就是阈值//向hash表存入新的key,value如果key重复,则更新valueprivate void put(int hash,Object key,Object value){//hash码与数组的长度减一,实际上取到的就是索引值int index hash (table.length - 1);//接下来会有两种情况//第一种:index索引位置处有空位置,直接新增if(table[index] null){table[index] new Entry(hash,key,value);}else{//第二种:index索引位置处没有空位,沿着链表查找,有key值的话,更新,没有的话新增Entry p table[index];//遍历链表while (true){//如果链表的key和传过来的key值相等的话可以直接将key值当值节点返回if(p.key.equals(key)){p.value value;return;}if(p.next null){break;}p p.next;}//此时的p就是最后一个节点p.next new Entry(hash,key,value);}size;if(size threshold){resize();}}/*** 扩容方法*/private void resize() {Entry[] newTable new Entry[table.length 1]; //移位比直接乘以2效率更高for (int i 0; i table.length; i) {Entry p table[i];if(p ! null){//拆分链表,移动到新的数组/*拆分规律* 一个链表最多拆成两个* hash table.length 0 的一组* hash table.length ! 1 的一组*/}}table newTable;//扩容完成之后将新数组赋值给旧数组threshold threshold (int) (loadFactor * table.length);} 讲到这里就需要科普一个知识了 0 (二进制: 0000) (按位与) 8 (二进制: 1000) 结果0 8 (二进制: 1000) (按位与) 8 (二进制: 1000) 结果8 16 (二进制: 10000) (按位与) 8 (二进制: 1000) 结果0 24 (二进制: 11000) (按位与) 8 (二进制: 01000) 结果8 可以看出如果最后四位的值相等的时候结果为8否则结果为0 /*** 扩容方法*/private void resize() {// 创建新的Entry数组长度为原数组的两倍通过位运算效率更高Entry[] newTable new Entry[table.length 1];// 遍历原数组for (int i 0; i table.length; i) {Entry p table[i];// 如果当前位置有链表if(p ! null){// 拆分链表,移动到新的数组/*拆分规律* 一个链表最多拆成两个* hash table.length 0 的一组* hash table.length ! 1 的一组*/// 创建两个新的链表一个是a另一个是bEntry a null;Entry b null;Entry aHead null;Entry bHead null;// 递归遍历链表while (p ! null){// 如果当前节点的hash与数组的长度 0的时候添加到a否则添加到bif((p.hash table.length) 0){if(a ! null){a.next p;}else{aHead p;}// 分配到aa p;}else{if(b ! null){b.next p;}else{bHead p;}// 分配到bb p;}// 进行递归遍历p p.next;}// 将链表a添加到新数组的原位置if(a ! null ){a.next null;newTable[i] aHead;}// 将链表b添加到新数组的原位置的后半部分if(b ! null ){b.next null;newTable[i table.length] bHead;}}}// 扩容完成之后将新数组赋值给旧数组table newTable;// 更新阈值threshold (int) (loadFactor * table.length);}哈希算法
概述 hash算法是将任意对象,分配一个编号的过程,其中编号是一个有限范围内的数字(如int范围内),hash算法是一种将任意长度的数据通过一个算法变成固定长度数据的过程这个固定长度的数据就是hash值。hash算法可以将任意大小的数据压缩到固定大小的值。常见的hash算法有MD5、SHA1、SHA256、SHA512、CRC32等。其中MD5和SHA系列算法是最常用的hash算法。这些算法在计算hash值时都考虑了原始数据的每一个字节一旦改动原始数据的任何一个字节所得到的hash值都会有明显的不同。因此hash算法被广泛应用于数据完整性校验和加密等方面。 在java里面可以调用对象的HashCode方法来进行获取
字符串生成hash的方法
public static void main(String[] args) {String str abc;System.out.println(str.hashCode());System.out.println();int hash 0;for (int i 0; i str.length(); i) {char c str.charAt(i);hash hash * 31 c;}System.out.println(hash);}