百度站长平台验证网站,企业安全文化建设的内容,asp 做网站,做网站的时候宽度都怎么弄1. 是什么
1.1 定义 由于数据量过大#xff0c;单个Master复制集难以承担#xff0c;因此需要对多个复制集进行集群#xff0c;形成水平扩展每个复制集只负责存储整个数据集 的一部分#xff0c;这就是Redis的集群#xff0c;其作用是提供在多个Redis节点间共享数据的程序…1. 是什么
1.1 定义 由于数据量过大单个Master复制集难以承担因此需要对多个复制集进行集群形成水平扩展每个复制集只负责存储整个数据集 的一部分这就是Redis的集群其作用是提供在多个Redis节点间共享数据的程序集。 1.2 官网 https://redis.io/docs/reference/cluster-spec/ 1.3 一图 1.4 一句话 Redis集群是一个提供在多个Redis节点间共享数据的程序集 Redis集群可以支持多个Master 2. 能干吗
2.1 Redis集群支持多个Master每个Master又可以挂载多个slave 读写分离 支持数据的高可用 支持海量数据的读写存储操作 2.2 由于Cluster自带Sentinel的故障转移机制内置了高可用的支持无需再去使用哨兵功能
2.3 客户端与Redis的节点连接不再需要连接集群中所有的节点只需要任意连接集群中的一个可用节点即可
2.4 槽位slot负责分配到各个物理服务节点由对应的集群来负责维护节点、插槽和数据之间的关系
3. 集群算法-分片-槽位slot
3.1 官网出处 翻译说明 3.2 redis集群的槽位slot 3.3 redis集群的分片 分片是什么 使用Redis集群时我们会将存储的数据分散到多台redis机器上这称为分片。简言之集群中的每个Redis实例都被认为是整个数据的一个分片。 如何找到给定key的分片 为了找到给定key的分片我们对key进行CRC16(key)算法处理并通过对总分片数量取模。然后 使用确定性哈希函数这意味着给定的key 将多次始终映射到同一个分片我们可以推断将来读取特定key的位置。 3.4 他两的优势 最大优势方便扩缩容和数据分派查找 3.5 slot槽位映射一般业界有3种解决方案 1. 哈希取余分区 2亿条记录就是2亿个k,v我们单机不行必须要分布式多机假设有3台机器构成一个集群用户每次读写操作都是根据公式 hash(key) % N个机器台数计算出哈希值用来决定数据映射到哪一个节点上。 优点 简单粗暴直接有效只需要预估好数据规划好节点例如3台、8台、10台就能保证一段时间的数据支撑。使用Hash算法让固定的一部分请求落到同一台服务器上这样每台服务器固定处理一部分请求并维护这些请求的信息起到负载均衡分而治之的作用。 缺点 原来规划好的节点进行扩容或者缩容就比较麻烦了额不管扩缩每次数据变动导致节点有变动映射关系需要重新进行计算在服务器个数固定不变时没有问题如果需要弹性扩容或故障停机的情况下原来的取模公式就会发生变化Hash(key)/3会变成Hash(key) /?。此时地址经过取余运算的结果将发生很大变化根据公式获取的服务器也会变得不可控。 某个redis机器宕机了由于台数数量变化会导致hash取余全部数据重新洗牌。 缺点 : 原来规划好的节点进行扩容或者缩容就比较麻烦了额不管扩缩每次数据变动导致节点有变动映射关系需要重新进行计算在服务器个数固定不变时没有问题如果需要弹性扩容或故障停机的情况下原来的取模公式就会发生变化Hash(key)/3会变成Hash(key) /?。此时地址经过取余运算的结果将发生很大变化根据公式获取的服务器也会变得不可控。 某个redis机器宕机了由于台数数量变化会导致hash取余全部数据重新洗牌。 2. 致性哈希算法分区 1) 是什么 一致性Hash算法背景 一致性哈希算法在1997年由麻省理工学院中提出的设计目标是为了解决 分布式缓存数据变动和映射问题某个机器宕机了分母数量改变了自然取余数不OK了。 2) 能干嘛 提出一致性Hash解决方案目的是当服务器个数发生变动时尽量减少影响客户端到服务器的映射关系 3) 3大步骤 ~ 算法构建一致性哈希环 一致性哈希环 一致性哈希算法必然有个hash函数并按照算法产生hash值这个算法的所有可能哈希值会构成一个全量集这个集合可以成为一个hash空间[0,2^32-1]这个是一个线性空间但是在算法中我们通过适当的逻辑控制将它首尾相连(0 2^32),这样让它逻辑上形成了一个环形空间。 它也是按照使用取模的方法前面笔记介绍的节点取模法是对节点服务器的数量进行取模。而一致性Hash算法是对2^32取模简单来说一致性Hash算法将整个哈希值空间组织成一个虚拟的圆环如假设某哈希函数H的值空间为0-2^32-1即哈希值是一个32位无符号整形整个哈希环如下图整个空间按顺时针方向组织圆环的正上方的点代表00点右侧的第一个点代表1以此类推2、3、4、……直到2^32-1也就是说0点左侧的第一个点代表2^32-1 0和2^32-1在零点中方向重合我们把这个由2^32个点组成的圆环称为Hash环。 ~ redis服务器IP节点映射 节点映射 将集群中各个IP节点映射到环上的某一个位置。 将各个服务器使用Hash进行一个哈希具体可以选择服务器的IP或主机名作为关键字进行哈希这样每台机器就能确定其在哈希环上的位置。假如4个节点NodeA、B、C、D经过IP地址的哈希函数计算(hash(ip))使用IP地址哈希后在环空间的位置如下 ~ key落到服务器的落键规则 当我们需要存储一个kv键值对时首先计算key的hash值hash(key)将这个key使用相同的函数Hash计算出哈希值并确定此数据在环上的位置从此位置沿环顺时针“行走”第一台遇到的服务器就是其应该定位到的服务器并将该键值对存储在该节点上。 如我们有Object A、Object B、Object C、Object D四个数据对象经过哈希计算后在环空间上的位置如下根据一致性Hash算法数据A会被定为到Node A上B被定为到Node B上C被定为到Node C上D被定为到Node D上。 4) 优点 ~ 一致性哈希算法的容错性 容错性 假设Node C宕机可以看到此时对象A、B、D不会受到影响。一般的在一致性Hash算法中如果一台服务器不可用则受影响的数据仅仅是此服务器到其环空间中前一台服务器即沿着逆时针方向行走遇到的第一台服务器之间数据其它不会受到影响。简单说就是C挂了受到影响的只是B、C之间的数据且这些数据会转移到D进行存储。 ~ 一致性哈希算法的扩展性 扩展性 数据量增加了需要增加一台节点NodeXX的位置在A和B之间那收到影响的也就是A到X之间的数据重新把A到X的数据录入到X上即可 不会导致hash取余全部数据重新洗牌。 5) 缺点 Hash环的数据倾斜问题 一致性Hash算法在服务节点太少时容易因为节点分布不均匀而造成数据倾斜被缓存的对象大部分集中缓存在某一台服务器上问题 例如系统中只有两台服务器 6) 小总结 为了在节点数目发生改变时尽可能少的迁移数据 将所有的存储节点排列在收尾相接的Hash环上每个key在计算Hash后会顺时针找到临近的存储节点存放。 而当有节点加入或退出时仅影响该节点在Hash环上顺时针相邻的后续节点。 优点 加入和删除节点只影响哈希环中顺时针方向的相邻的节点对其他节点无影响。 缺点 数据的分布和节点的位置有关因为这些节点不是均匀的分布在哈希环上的所以数据在进行存储时达不到均匀分布的效果。 3. 哈希槽分区 ~ 是什么 1 为什么出现 哈希槽实质就是一个数组数组[0,2^14 -1]形成hash slot空间。 2 能干什么 解决均匀分配的问题在数据和节点之间又加入了一层把这层称为哈希槽slot用于管理数据和节点之间的关系现在就相当于节点上放的是槽槽里放的是数据。 槽解决的是粒度问题相当于把粒度变大了这样便于数据移动。哈希解决的是映射问题使用key的哈希值来计算所在的槽便于数据分配 3 多少个hash槽 一个集群只能有16384个槽编号0-163830-2^14-1。这些槽会分配给集群中的所有主节点分配策略没有要求。 集群会记录节点和槽的对应关系解决了节点和槽的关系后接下来就需要对key求哈希值然后对16384取模余数是几key就落入对应的槽里。HASH_SLOT CRC16(key) mod 16384。以槽为单位移动数据因为槽的数目是固定的处理起来比较容易这样数据移动问题就解决了。 HASH SLOT CRC16(key) mod 16384 ~ 哈希槽计算 Redis 集群中内置了 16384 个哈希槽redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时redis先对key使用crc16算法算出一个结果然后用结果对16384求余数[ CRC16(key) % 16384]这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽也就是映射到某个节点上。如下代码key之A 、B在Node2 key之C落在Node3上 3.6 经典面试题
3.6.1 为什么redis集群的最大槽数是16384个? Redis集群并没有使用一致性hash而是引入了哈希槽的概念。Redis 集群有16384个哈希槽每个key通过CRC16校验后对16384取模来决定放置哪个槽集群的每个节点负责一部分hash槽。但为什么哈希槽的数量是163842^14个呢 CRC16算法产生的hash值有16bit该算法可以产生2^1665536个值。 换句话说值是分布在0~65535之间有更大的65536不用为什么只用16384就够 作者在做mod运算的时候为什么不mod65536而选择mod16384 HASH_SLOT CRC16(key) mod 65536为什么没启用 https://github.com/redis/redis/issues/2576 3.6.2 说明1 正常的心跳数据包带有节点的完整配置可以用幂等方式用旧的节点替换旧节点以便更新旧的配置。 这意味着它们包含原始节点的插槽配置该节点使用2k的空间和16k的插槽但是会使用8k的空间使用65k的插槽。 同时由于其他设计折衷Redis集群不太可能扩展到1000个以上的主节点。 因此16k处于正确的范围内以确保每个主机具有足够的插槽最多可容纳1000个矩阵但数量足够少可以轻松地将插槽配置作为原始位图传播。请注意在小型群集中位图将难以压缩因为当N较小时位图将设置的slot / N位占设置位的很大百分比。 3.6.3 说明2 (1)如果槽位为65536发送心跳信息的消息头达8k发送的心跳包过于庞大。 在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。 当槽位为65536时这块的大小是: 65536÷8÷10248kb 在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。 当槽位为16384时这块的大小是: 16384÷8÷10242kb 因为每秒钟redis节点需要发送一定数量的ping消息作为心跳包如果槽位为65536这个ping消息的消息头太大了浪费带宽。 (2)redis的集群主节点数量基本不可能超过1000个。 集群节点越多心跳包的消息体内携带的数据越多。如果节点过1000个也会导致网络拥堵。因此redis作者不建议redis cluster节点数量超过1000个。 那么对于节点数在1000以内的redis cluster集群16384个槽位够用了。没有必要拓展到65536个。 (3)槽位越小节点少的情况下压缩比高容易传输 Redis主节点的配置信息中它所负责的哈希槽是通过一张bitmap的形式来保存的在传输过程中会对bitmap进行压缩但是如果bitmap的填充率slots / N很高的话(N表示节点数)bitmap的压缩率就很低。 如果节点数很少而哈希槽数量很多的话bitmap的压缩率就很低。 3.6.4 计算结论 3.7 Redis集群不保证强一致性这意味着在特定的条件下Redis集群可能会丢掉一些被系统收到的写入请求命令 4. 集群常用操作指令和CRC16算法分析
4.1 不在同一个slot槽位下的多键操作支持不好通识占位符登场 不在同一个slot槽位下的键值无法使用mset、mget等多键操作 可以通过{}来定义同一个组的概念使key中{}内相同内容的键值对放到一个slot槽位去对照下图类似k1k2k3都映射为x自然槽位一样 4.2 Redis集群有16384个哈希槽每个key通过CRC16校验后对16384取模来决定放置哪个槽集群的每个节点负责一部分hash槽 源码解读 4.3 常用命令
4.3.1 集群是否完整才能对外提供服务 默认YES现在集群架构是3主3从的redis cluster由3个master平分16384个slot每个master的小集群负责1/3的slot对应一部分数据。 cluster-require-full-coverage 默认值 yes , 即需要集群完整性方可对外提供服务 通常情况如果这3个小集群中任何一个1主1从挂了你这个集群对外可提供的数据只有2/3了 整个集群是不完整的 redis 默认在这种情况下是不会对外提供服务的。 如果你的诉求是 集群不完整的话也需要对外提供服务需要将该参数设置为no 这样的话你挂了的那个小集群是不行了但是其他的小集群仍然可以对外提供服务。 cluster-require-full-coverage 4.3.2 CLUSTER COUNTKEYSINSLOT 槽位数字编号 1该槽位被占用 0该槽位没占用 4.3.3 CLUSTER KEYSLOT 键名称 该键应该存在哪个槽位上