jsp做的婚恋网站,做死活题网站,如何建立自己的手机网站,深圳宝安区网站建设公司什么是redis#xff1f; Redis 本质上是一个 Key-Value 类型的内存数据库#xff0c; 整个数据库加载在内存当中进行操作#xff0c; 定期通过异步操作把数据库数据 flush 到硬盘上进行保存。
因为是纯内存操作#xff0c; Redis 的性能非常出色#xff0c; 每秒可以处理…什么是redis Redis 本质上是一个 Key-Value 类型的内存数据库 整个数据库加载在内存当中进行操作 定期通过异步操作把数据库数据 flush 到硬盘上进行保存。
因为是纯内存操作 Redis 的性能非常出色 每秒可以处理超过 10 万次读写操作 是已知性能 最快的 Key-Value DB。 Redis 的出色之处不仅仅是性能 Redis 最大的魅力是支持保存多种数据结构 此外单个 value 的最大限制是 1GB 不像 memcached 只能保存 1MB 的数据 因此 Redis 可以用 来实现很多有用的功能比方说用他的 List 来做 FIFO 双向链表实现一个轻量级的高性 能 消息队列服务 用他的 Set 可以做高性能的 tag 系统等等。
另外 Redis 也可以对存入的Key-Value 设置 expire 时间 因此也可以被当作一 个功能加强版的 memcached 来用。 Redis 的主要缺点是数据库容量受到物理内存的限制 不能用作海量数据的高性能读写 因此 Redis 适合的场景主要局限在较小数据量的高性能操作和运算上 相比 memcached 有哪些优势
redis支持更丰富的数据类型支持更复杂的应用场景Redis不仅仅支持简单的k/v类型的数据同时还提供listsetzsethash等数据结构的存储。memcache支持简单的数据类型String。Redis支持数据的持久化可以将内存中的数据保持在磁盘中重启的时候可以再次加载进行使用,而Memecache把数据全部存在内存之中。集群模式memcached没有原生的集群模式需要依靠客户端来实现往集群中分片写入数据但是 redis 目前是原生支持 cluster 模式的.Memcached是多线程非阻塞IO复用的网络模型Redis使用单线程的多路 IO 复用模型。Redis 的全称是什么 Remote Dictionary Server。
支持哪几种数据类型 String、 List、 Set、 Sorted Set、 hashes Redis 有哪几种数据淘汰策略 noeviction:返回错误当内存限制达到并且客户端尝试执行会让更多内存被使用的命令大 部分的写入指令 但 DEL 和几个例外 allkeys-lru: 尝试回收最少使用的键LRU 使得新添加的数据有空间存放。 volatile-lru: 尝试回收最少使用的键LRU 但仅限于在过期集合的键,使得新添加的数据 有空间存放。 allkeys-random: 回收随机的键使得新添加的数据有空间存放。 volatile-random: 回收随机的键使得新添加的数据有空间存放但仅限于在过期集合的键。 volatile-ttl: 回收在过期集合的键 并且优先回收存活时间TTL 较短的键,使得新添加的 数据有空间存放
redis为什么采用跳表而不是红黑树
在做范围查找的时候平衡树比skiplist操作要复杂。在平衡树上我们找到指定范围的小值之后还需要以中序遍历的顺序继续寻找其它不超过大值的节点。如果不对平衡树进行一定的改造这里的中序遍历并不容易实现。而在skiplist上进行范围查找就非常简单只需要在找到小值之后对第1层链表进行若干步的遍历就可以实现。 平衡树的插入和删除操作可能引发子树的调整逻辑复杂而skiplist的插入和删除只需要修改相邻节点的指针操作简单又快速。 从内存占用上来说skiplist比平衡树更灵活一些。一般来说平衡树每个节点包含2个指针分别指向左右子树而skiplist每个节点包含的指针数目平均为1/(1-p)具体取决于参数p的大小。如果像Redis里的实现一样取p1/4那么平均每个节点包含1.33个指针比平衡树更有优势。 查找单个keyskiplist和平衡树的时间复杂度都为O(log n)大体相当而哈希表在保持较低的哈希值冲突概率的前提下查找时间复杂度接近O(1)性能更高一些。所以我们平常使用的各种Map或dictionary结构大都是基于哈希表实现的。 从算法实现难度上来比较skiplist比平衡树要简单得多。
介绍一下HyperLogLog
HyperLogLog 是一种概率数据结构用来估算数据的基数。数据集可以是网站访客的 IP 地址E-mail 邮箱或者用户 ID。
基数就是指一个集合中不同值的数目比如 a, b, c, d 的基数就是 4a, b, c, d, a 的基数还是 4。虽然 a 出现两次只会被计算一次。
使用 Redis 统计集合的基数一般有三种方法分别是使用 Redis 的 HashMapBitMap 和 HyperLogLog。前两个数据结构在集合的数量级增长时所消耗的内存会大大增加但是 HyperLogLog 则不会。
Redis 的 HyperLogLog 通过牺牲准确率来减少内存空间的消耗只需要12K内存在标准误差0.81%的前提下能够统计2^64个数据。所以 HyperLogLog 是否适合在比如统计日活月活此类的对精度要不不高的场景。
这是一个很惊人的结果以如此小的内存来记录如此大数量级的数据基数。 为什么 Redis 需要把所有数据放到内存中 Redis 为了达到最快的读写速度将数据都读到内存中 并通过异步的方式将数据写入磁盘。 所以 Redis 具有快速和数据持久化的特征。 如果不将数据放在内存中 磁盘 I/O 速度为严重 影响 Redis 的性能。 在内存越来越便宜的今天 Redis 将会越来越受欢迎。 Redis支持的数据类型
String字符串
格式: set key value
string类型是二进制安全的。意思是redis的string可以包含任何数据。比如jpg图片或者序列化的对象 。
string类型是Redis最基本的数据类型一个键最大能存储512MB。 Hash哈希
格式: hmset name key1 value1 key2 value2
Redis hash 是一个键值(keyvalue)对集合。
Redis hash是一个string类型的field和value的映射表hash特别适合用于存储对象。 List列表
Redis 列表是简单的字符串列表按照插入顺序排序。你可以添加一个元素到列表的头部左边或者尾部右边
格式: lpush name value
在 key 对应 list 的头部添加字符串元素
格式: rpush name value
在 key 对应 list 的尾部添加字符串元素
格式: lrem name index
key 对应 list 中删除 count 个和 value 相同的元素
格式: llen name
返回 key 对应 list 的长度 Set集合
格式: sadd name value
Redis的Set是string类型的无序集合。
集合是通过哈希表实现的所以添加删除查找的复杂度都是O(1)。 zset(sorted set有序集合)
格式: zadd name score value
Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。
zset的成员是唯一的,但分数(score)却可以重复。 sds相对c的改进 获取长度c字符串并不记录自身长度所以获取长度只能遍历一遍字符串redis直接读取len即可。 缓冲区安全c字符串容易造成缓冲区溢出比如程序员没有分配足够的空间就执行拼接操作。而redis会先检查sds的空间是否满足所需要求如果不满足会自动扩充。 内存分配由于c不记录字符串长度对于包含了n个字符的字符串底层总是一个长度n1的数组每一次长度变化总是要对这个数组进行一次内存重新分配的操作。因为内存分配涉及复杂算法并且可能需要执行系统调用所以它通常是比较耗时的操作。
redis链表源码有什么特性 双端、无环、带长度记录、
多态使用 void* 指针来保存节点值 可以通过 dup 、 free 、 match 为节点值设置类型特定函数 可以保存不同类型的值。
字典是如何实现的
其实字典这种数据结构也内置在很多高级语言中但是c语言没有所以redis自己实现了。
应用也比较广泛比如redis的数据库就是字典实现的。不仅如此当一个哈希键包含的键值对比较多或者都是很长的字符串redis就会用字典作为哈希键的底层实现。
LRUredis里的具体实现
LRU全称是Least Recently Used即最近最久未使用的意思。
LRU算法的设计原则是如果一个数据在最近一段时间没有被访问到那么在将来它被访问的可能性也很小。也就是说当限定的空间已存满数据时应当把最久没有被访问到的数据淘汰。
redis原始的淘汰算法简单实现当需要淘汰一个key时随机选择3个key淘汰其中间隔时间最长的key。**基本上我们随机选择key淘汰key效果很好。后来随机3个key改成一个配置项N随机key。但把默认值提高改成5个后效果大大提高。考虑到它的效果你根本不用修改他。
redis的持久化
RDB持久化可以手动执行也可以配置定期执行可以把某个时间的数据状态保存到RDB文件中反之我们可以用RDB文件还原数据库状态。
AOF持久化是通过保存服务器执行的命令来记录状态的。还原的时候再执行一遍即可。 如何选择合适的持久化方式 一般来说 如果想达到足以媲美 PostgreSQL 的数据安全性 你应该同时使用两种持久 化功能。 如果你非常关心你的数据 但仍然可以承受数分钟以内的数据丢失 那么你可以 只使用 RDB 持久化。 有很多用户都只使用 AOF 持久化 但并不推荐这种方式 因为定时生成 RDB 快照 snapshot 非常便于进行数据库备份 并且 RDB 恢复数据集的速度也要比 AOF 恢复 的速度要快 除此之外 使用 RDB 还可以避免之前提到的 AOF 程序的 bug。
Redis 集群方案应该怎么做 都有哪些方案 1.twemproxy 大概概念是 它类似于一个代理方式 使用方法和普通 Redis 无任何区别 设 置 好它 下 属 的多 个 Redis 实 例 后 使 用 时在 本 需 要 连接 Redis 的 地 方改 为 连接 twemproxy 它会以一个代理的身份接收请求并使用一致性 hash 算法 将请求转接到具 体 Redis 将结果再返回 twemproxy。 使用方式简便(相对 Redis 只需修改连接端口) 对 旧项目扩展的首选。 问题 twemproxy 自身单端口实例的压力 使用一致性 hash 后 对 Redis 节点数量改变时候的计算值的改变 数据无法自动移动到新的节点。 2. codis 目前用的最多的集群方案 基本和 twemproxy 一致的效果 但它支持在 节点 数量改变情况下 旧节点数据可恢复到新 hash 节点。 3. Redis cluster3.0 自带的集群 特点在于他的分布式算法不是一致性 hash 而是 hash 槽的概念 以及自身支持节点设置从节点。 具体看官方文档介绍。 4.在业务代码层实现 起几个毫无关联的 Redis 实例 在代码层 对 key 进行 hash 计算 然后去对应的 Redis 实例操作数据。 这种方式对 hash 层代码要求比较高 考虑部分包括 节点失效后的替代算法方案 数据震荡后的自动脚本恢复 实例的监控 等等 MySQL 里有 2000w 数据 Redis 中只存 20w 的数据
如何保证 Redis 中的数据都是热点数据 Redis 内存数据集大小上升到一定大小的时候 就会施行数据淘汰策略
Redis 有哪些适合的场景 1、 会话缓存Session Cache 最常用的一种使用 Redis 的情景是会话缓存session cache。 用 Redis 缓存会话比其他 存储如 Memcached 的优势在于 Redis 提供持久化。 当维护一个不是严格要求一致性 的缓存时 如果用户的购物车信息全部丢失 大部分人都会不高兴的 现在 他们还会这样 吗 幸运的是 随着 Redis 这些年的改进 很容易找到怎么恰当的使用 Redis 来缓存会话的文 档。 甚至广为人知的商业平台 Magento 也提供 Redis 的插件。 2、 全页缓存FPC 除基本的会话 token 之外 Redis 还提供很简便的 FPC 平台。 回到一致性问题 即使重启 了 Redis 实例 因为有磁盘的持久化 用户也不会看到页面加载速度的下降 这是一个极 大改进 类似 PHP 本地 FPC。 再次以 Magento 为例 Magento 提供一个插件来使用 Redis 作为全页缓存后端。 此外 对 WordPress 的用户来说 Pantheon 有一个非常好的插件 wp-Redis 这个插件 能帮助你以最快速度加载你曾浏览过的页面。 3、 队列 Reids 在内存存储引擎领域的一大优点是提供 list 和 set 操作这使得 Redis 能作为一个 很好的消息队列平台来使用。 Redis 作为队列使用的操作 就类似于本地程序语言如 Python 对 list 的 push/pop 操作。 如果你快速的在 Google 中搜索“Redis queues” 你马上就能找到大量的开源项目 这些 项目的目的就是利用 Redis 创建非常好的后端工具 以满足各种队列需求。 例如 Celery 有一个后台就是使用 Redis 作为 broker 你可以从这里去查看。 4、 排行榜/计数器 Redis在内存中对数字进行递增或递减的操作实现的非常好。集合Set和有序集合Sorted Set 也使得我们在执行这些操作的时候变的非常简单 Redis 只是正好提供了这两种数据 结构。 所以 我们要从排序集合中获取到排名最靠前的 10 个用户–我们称之为 “user_scores” 我们只需要像下面一样执行即可 当然 这是假定你是根据你用户的分数做递增的排序。 如果你想返回用户及用户的分数 你 需要这样执行 ZRANGE user_scores 0 10 WITHSCORES Agora Games 就是一个很好的例子 用 Ruby 实现的 它的排行榜就是使用 Redis 来存储 数据的 你可以在这里看到。 5、 发布/订阅 最后 是 Redis 的发布/订阅功能。 发布/订阅的使用场景确实非 常多。 我已看见人们在社交网络连接中使用 还可作为基于发布/订阅的脚本触发器 甚至 用 Redis 的发布/订阅功能来建立聊天系统。 说说 Redis 哈希槽的概念 Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念 Redis 集群有 16384 个哈希槽 每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽 集群的每个节点负责一部分 hash 槽
为什么Redis集群有16384个槽
(1)如果槽位为65536发送心跳信息的消息头达8k发送的心跳包过于庞大。
如上所述在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。 当槽位为65536时这块的大小是: 65536÷8÷10248kb 因为每秒钟redis节点需要发送一定数量的ping消息作为心跳包如果槽位为65536这个ping消息的消息头太大了浪费带宽。
(2)redis的集群主节点数量基本不可能超过1000个。
如上所述集群节点越多心跳包的消息体内携带的数据越多。如果节点过1000个也会导致网络拥堵。因此redis作者不建议redis cluster节点数量超过1000个。 那么对于节点数在1000以内的redis cluster集群16384个槽位够用了。没有必要拓展到65536个。
(3)槽位越小节点少的情况下压缩比高
Redis主节点的配置信息中它所负责的哈希槽是通过一张bitmap的形式来保存的在传输过程中会对bitmap进行压缩但是如果bitmap的填充率slots / N很高的话(N表示节点数)bitmap的压缩率就很低。 如果节点数很少而哈希槽数量很多的话bitmap的压缩率就很低。
Redis 集群会有写操作丢失吗 为什么 Redis 并不能保证数据的强一致性 这意味这在实际中集群在特定的条件下可能会丢失写操 作。
Redis 集群方案应该怎么做都有哪些方案 1.twemproxy大概概念是它类似于一个代理方式 使用时在本需要连接 redis 的地方改为连接 twemproxy 它会以一个代理的身份接收请求并使用一致性 hash 算法将请求转接到具体 redis将结果再返回 twemproxy。 缺点 twemproxy 自身单端口实例的压力使用一致性 hash 后对 redis 节点数量改变时候的计算值的改变数据无法自动移动到新的节点。
2.codis目前用的最多的集群方案基本和 twemproxy 一致的效果但它支持在 节点数量改变情况下旧节点数据可恢复到新 hash 节点
3.redis cluster3.0 自带的集群特点在于他的分布式算法不是一致性 hash而是 hash 槽的概念以及自身支持节点设置从节点。具体看官方文档介绍。
为什么要做 Redis 分区 分区可以让 Redis 管理更大的内存 Redis 将可以使用所有机器的内存。 如果没有分区 你 最多只能使用一台机器的内存。 分区使 Redis 的计算能力通过简单地增加计算机得到成倍提 升,Redis 的网络带宽也会随着计算机和网卡的增加而成倍增长。
Redis 分区有什么缺点 涉及多个 key 的操作通常不会被支持。 例如你不能对两个集合求交集 因为他们可能被存 储到不同的 Redis 实例实际上这种情况也有办法 但是不能直接使用交集指令。 同时操作多个 key,则不能使用 Redis 事务. 分区使用的粒度是key不能使用一个非常长的排序key存储一个数据集The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set . 当使用分区的时候 数据处理会非常复杂 例如为了备份你必须从不同的 Redis 实例和主 机同时收集 RDB / AOF 文件。 分区时动态扩容或缩容可能非常复杂。 Redis 集群在运行时增加或者删除 Redis 节点 能 做到最大程度对用户透明地数据再平衡但其他一些客户端分区或者代理分区方法则不支持 这种特性。 然而 有一种预分片的技术也可以较好的解决这个问题。 Redis 与其他 key-value 存储有什么不同 Redis 有着更为复杂的数据结构并且提供对他们的原子性操作这是一个不同于其他数据库 的进化路径。 Redis 的数据类型都是基于基本数据结构的同时对程序员透明 无需进行额外 的抽象。 Redis 运行在内存中但是可以持久化到磁盘所以在对不同数据集进行高速读写时需要权衡 内存 应为数据量不能大于硬件内存。 在内存数据库方面的另一个优点是 相比在磁盘上 相同的复杂的数据结构 在内存中操作起来非常简单 这样 Redis 可以做很多内部复杂性 很强的事情。 同时 在磁盘格式方面他们是紧凑的以追加的方式产生的 因为他们并不需 要进行随机访问 Redis 的内存用完了会发生什么 如果达到设置的上限 Redis 的写命令会返回错误信息但是读命令还可以正常返回。 或 者你可以将 Redis 当缓存来使用配置淘汰机制当 Redis 达到内存上限时会冲刷掉旧的内容。
Redis 是单线程的 如何提高多核 CPU 的利用率 可以在同一个服务器部署多个 Redis 的实例 并把他们当作不同的服务器来使用 在某些时 候 无论如何一个服务器是不够的 所以 如果你想使用多个 CPU 你可以考虑一下分片shard。 一个 Redis 实例最多能存放多少的 keys List、 Set、Sorted Set 他们最多能存放多少元素 理论上 Redis 可以处理多达 232 的 keys 并且在实际中进行了测试 每个实例至少存放了 2亿 5 千万的 keys。 我们正在测试一些较大的值。 任何 list、 set、 和 sorted set 都可以放 232 个元素。 换句话说 Redis 的存储极限是系统中的可用内存值 修改配置不重启 Redis 会实时生效吗 针对运行实例 有许多配置选项可以通过 CONFIG SET 命令进行修改 而无需执行任何 形式的重启。 从 Redis 2.2 开始 可以从 AOF 切换到 RDB 的快照持久性或其他方式 而不需要重启 Redis。 检索 ‘CONFIG GET *’ 命令获取更多信息。 但偶尔重新启动是必须的 如为升级 Redis 程序到新的版本 或者当你需要修改某些目前 CONFIG 命令还不支持的配置参数的时候
哨兵
Redis sentinel 是一个分布式系统中监控 redis 主从服务器并在主服务器下线时自动进行故障转移。其中三个特性
监控Monitoring Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。
提醒Notification 被监控的某个 Redis 服务器出现问题时 Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。
自动故障迁移Automatic failover 当一个主服务器不能正常工作时 Sentinel 会开始一次自动故障迁移操作。
特点
1、保证高可用
2、监控各个节点
3、自动故障迁移
缺点主从模式切换需要时间丢数据
没有解决 master 写的压力 缓存穿透 一般的缓存系统都是按照key去缓存查询如果不存在对应的value就去后端系统查找比如DB。
一些恶意的请求会故意查询不存在的key,请求量很大就会对后端系统造成很大的压力。这就叫做缓存穿透。 如何避免
1对查询结果为空的情况也进行缓存这样再次访问时缓存层会直接返回空值。缓存时间设置短一点或者该key对应的数据insert了之后清理缓存。
2对一定不存在的key进行过滤。具体请看布隆过滤器 缓存击穿 是针对缓存中没有但数据库有的数据。
场景是当Key失效后假如瞬间突然涌入大量的请求来请求同一个Key这些请求不会命中Redis都会请求到DB导致数据库压力过大甚至扛不住挂掉。
解决办法
1、设置热点Key自动检测热点Key将热点Key的过期时间加大或者设置为永不过期或者设置为逻辑上永不过期
2、加互斥锁。当发现没有命中Redis去查数据库的时候在执行更新缓存的操作上加锁当一个线程访问时其它线程等待这个线程访问过后缓存中的数据会被重建这样其他线程就可以从缓存中取值。 缓存雪崩 是指大量Key同时失效对这些Key的请求又会打到DB上同样会导致数据库压力过大甚至挂掉。
解决办法
1让Key的失效时间分散开可以在统一的失效时间上再加一个随机值或者使用更高级的算法分散失效时间。
2构建多个redis实例个别节点挂了还有别的可以用。
3多级缓存比如增加本地缓存减小redis压力。
4对存储层增加限流措施当请求超出限制提供降级服务一般就是返回错误即可 单线程的redis为什么这么快
(一)纯内存操作 (二)单线程操作避免了频繁的上下文切换 (三)采用了非阻塞I/O多路复用机制
其实就是历史遗留问题非要吹的这么好。。。 redis采用的删除策略 redis采用的是定期删除惰性删除策略。 为什么不用定时删除策略? 定时删除,用一个定时器来负责监视key,过期则自动删除。虽然内存及时释放但是十分消耗CPU资源。在大并发请求下CPU要将时间应用在处理请求而不是删除key,因此没有采用这一策略. 定期删除惰性删除是如何工作的呢? 定期删除redis默认每个100ms检查是否有过期的key,有过期key则删除。需要说明的是redis不是每个100ms将所有的key检查一次而是随机抽取进行检查(如果每隔100ms,全部key进行检查redis岂不是卡死)。因此如果只采用定期删除策略会导致很多key到时间没有删除。 于是惰性删除派上用场。也就是说在你获取某个key的时候redis会检查一下这个key如果设置了过期时间那么是否过期了如果过期了此时就会删除。 为什么Redis的操作是原子性的怎么保证原子性的 对于Redis而言命令的原子性指的是一个操作的不可以再分操作要么执行要么不执行。 Redis的操作之所以是原子性的是因为Redis是单线程的。 Redis本身提供的所有API都是原子操作Redis中的事务其实是要保证批量操作的原子性。 多个命令在并发中也是原子性的吗 不一定 将get和set改成单命令操作incr 。使用Redis的事务或者使用RedisLua的方式实现.
消息队列
不要使用redis去做消息队列这不是redis的设计目标。但实在太多人使用redis去做去消息队列redis的作者看不下去。
kafka才好用