怎么做一网站,wordpress+模板宽度,备案后的域名改网站名,服务器怎样建设网站Redis五种数据类型及应用场景
MySqlMemcached架构的问题
实际MySQL是适合进行海量数据存储的#xff0c;通过Memcached将热点数据加载到cache#xff0c;加速访问#xff0c;很多公司都曾经使用过这样的架构#xff0c;但随着业务数据量的不断增加#xff0c;和访问量的…Redis五种数据类型及应用场景
MySqlMemcached架构的问题
实际MySQL是适合进行海量数据存储的通过Memcached将热点数据加载到cache加速访问很多公司都曾经使用过这样的架构但随着业务数据量的不断增加和访问量的持续增长我们遇到了很多问题
1.MySQL需要不断进行拆库拆表Memcached也需不断跟着扩容扩容和维护工作占据大量开发时间。
2.Memcached与MySQL数据库数据一致性问题。
3.Memcached数据命中率低或down机大量访问直接穿透到DBMySQL无法支撑。
4.跨机房cache同步问题。
众多NoSQL百花齐放如何选择
最近几年业界不断涌现出很多各种各样的NoSQL产品那么如何才能正确地使用好这些产品最大化地发挥其长处是我们需要深入研究和思考的问题实际归根结底最重要的是了解这些产品的定位并且了解到每款产品的tradeoffs在实际应用中做到扬长避短总体上这些NoSQL主要用于解决以下几种问题
1.少量数据存储高速读写访问。此类产品通过数据全部in-momery 的方式来保证高速访问同时提供数据落地的功能实际这正是Redis最主要的适用场景。
2.海量数据存储分布式系统支持数据一致性保证方便的集群节点添加/删除。
3.这方面最具代表性的是dynamo和bigtable 2篇论文所阐述的思路。前者是一个完全无中心的设计节点之间通过gossip方式传递集群信息数据保证最终一致性后者是一个中心化的方案设计通过类似一个分布式锁服务来保证强一致性,数据写入先写内存和redo log然后定期compat归并到磁盘上将随机写优化为顺序写提高写入性能。
4.Schema freeauto-sharding等。比如目前常见的一些文档数据库都是支持schema-free的直接存储json格式数据并且支持auto-sharding等功能比如mongodb。
Redis最适合所有数据in-momory的场景虽然Redis也提供持久化功能但实际更多的是一个disk-backed的功能跟传统意义上的持久化有比较大的差别那么可能大家就会有疑问似乎Redis更像一个加强版的Memcached那么何时使用Memcached,何时使用Redis呢?
如果简单地比较Redis与Memcached的区别大多数都会得到以下观点
1 、Redis不仅仅支持简单的k/v类型的数据同时还提供listsetzsethash等数据结构的存储。 2 、Redis支持数据的备份即master-slave模式的数据备份。 3 、Redis支持数据的持久化可以将内存中的数据保持在磁盘中重启的时候可以再次加载进行使用。
通过一张图了解下Redis内部内存管理中是如何描述这些不同数据类型的 首先Redis内部使用一个redisObject对象来表示所有的key和valueredisObject最主要的信息如上图所示type代表一个value对象具体是何种数据类型encoding是不同数据类型在redis内部的存储方式比如typestring代表value存储的是一个普通字符串那么对应的encoding可以是raw或者是int如果是int则代表实际redis内部是按数值型类存储和表示这个字符串的当然前提是这个字符串本身可以用数值表示比如:“123” 456这样的字符串。
这里需要特殊说明一下vm字段只有打开了Redis的虚拟内存功能此字段才会真正的分配内存该功能默认是关闭状态的。通过上图我们可以发现Redis使用redisObject来表示所有的key/value数据是比较浪费内存的当然这些内存管理成本的付出主要也是为了给Redis不同数据类型提供一个统一的管理接口实际作者也提供了多种方法帮助我们尽量节省内存使用我们随后会具体讨论。
Redis支持5种数据类型string字符串hash哈希list列表set集合及zset(sorted set有序集合)。
① string 是 redis 最基本的类型你可以理解成与 Memcached 一模一样的类型一个 key 对应一个 value。value其实不仅是String也可以是数字。string 类型是二进制安全的。意思是 redis 的 string 可以包含任何数据。比如jpg图片或者序列化的对象。string 类型是 Redis 最基本的数据类型string 类型的值最大能存储 512MB。
常用命令get、set、incr、decr、mget等。
应用场景String是最常用的一种数据类型普通的key/ value 存储都可以归为此类即可以完全实现目前 Memcached 的功能并且效率更高。还可以享受Redis的定时持久化操作日志及 Replication等功能。除了提供与 Memcached 一样的get、set、incr、decr 等操作外Redis还提供了下面一些操作
获取字符串长度往字符串append内容设置和获取字符串的某一段内容设置及获取字符串的某一位bit批量设置一系列字符串的内容
使用场景常规key-value缓存应用。常规计数: 微博数, 粉丝数。
实现方式String在redis内部存储默认就是一个字符串被redisObject所引用当遇到incr,decr等操作时会转成数值型进行计算此时redisObject的encoding字段为int。
redis 127.0.0.1:6379 SET name runoob
OK
redis 127.0.0.1:6379 GET name
runoob在以上实例中我们使用了 Redis 的 SET 和 GET 命令。键为 name对应的值为 runoob。
注意:一个键最大能存储512MB。
② Redis hash 是一个键值(key value)对集合。Redis hash 是一个 string 类型的 field 和 value 的映射表hash 特别适合用于存储对象。
常用命令hget,hset,hgetall 等。
应用场景我们简单举个实例来描述下Hash的应用场景比如我们要存储一个用户信息对象数据包含以下信息
用户ID为查找的key存储的value用户对象包含姓名年龄生日等信息如果用普通的key/value结构来存储主要有以下2种存储方式 第一种方式将用户ID作为查找key,把其他信息封装成一个对象以序列化的方式存储这种方式的缺点是增加了序列化/反序列化的开销并且在需要修改其中一项信息时需要把整个对象取回并且修改操作需要对并发进行保护引入CAS等复杂问题。 第二种方法是这个用户信息对象有多少成员就存成多少个key-value对儿用用户ID对应属性的名称作为唯一标识来取得对应属性的值虽然省去了序列化开销和并发问题但是用户ID为重复存储如果存在大量这样的数据内存浪费还是非常可观的。
那么Redis提供的Hash很好的解决了这个问题Redis的Hash实际是内部存储的Value为一个HashMap并提供了直接存取这个Map成员的接口如下图 也就是说Key仍然是用户ID, value是一个Map这个Map的key是成员的属性名value是属性值这样对数据的修改和存取都可以直接通过其内部Map的Key(Redis里称内部Map的key为field), 也就是通过 key(用户ID) field(属性标签) 就可以操作对应属性数据了既不需要重复存储数据也不会带来序列化和并发修改控制的问题很好的解决了问题。
这里同时需要注意Redis提供了接口(hgetall)可以直接取到全部的属性数据但是如果内部Map的成员很多那么涉及到遍历整个内部Map的操作由于Redis单线程模型的缘故这个遍历操作可能会比较耗时而另其它客户端的请求完全不响应这点需要格外注意。
使用场景存储部分变更数据如用户信息等。
实现方式上面已经说到Redis Hash对应Value内部实际就是一个HashMap实际这里会有2种不同实现这个Hash的成员比较少时Redis为了节省内存会采用类似一维数组的方式来紧凑存储而不会采用真正的HashMap结构对应的value redisObject的encoding为zipmap当成员数量增大时会自动转成真正的HashMap此时encoding为ht。
redis HSET myhash field1 Hello field2 World
OK
redis HGET myhash field1
Hello
redis HGET myhash field2
World实例中我们使用了 Redis HMSET, HGET 命令HMSET 设置了两个 fieldvalue 对, HGET 获取对应 field 对应的 value。每个 hash 可以存储 232 -1 键值对40多亿。
③ Redis list 列表是简单的字符串列表按照插入顺序排序。你可以添加一个元素到列表的头部左边或者尾部右边。
常用命令lpush添加左边元素,rpush,lpop移除左边第一个元素,rpop,lrange获取列表片段LRANGE key start stop等。
应用场景Redis list的应用场景非常多也是Redis最重要的数据结构之一比如twitter的关注列表粉丝列表等都可以用Redis的list结构来实现。
List 就是链表相信略有数据结构知识的人都应该能理解其结构。使用List结构我们可以轻松地实现最新消息排行等功能。List的另一个应用就是消息队列 可以利用List的PUSH操作将任务存在List中然后工作线程再用POP操作将任务取出进行执行。Redis还提供了操作List中某一段的api你可以直接查询删除List中某一段的元素。
实现方式Redis list的实现为一个双向链表即可以支持反向查找和遍历更方便操作不过带来了部分额外的内存开销Redis内部的很多实现包括发送缓冲队列等也都是用的这个数据结构。
Redis的list是每个子元素都是String类型的双向链表可以通过push和pop操作从列表的头部或者尾部添加或者删除元素这样List即可以作为栈也可以作为队列。 获取越接近两端的元素速度越快但通过索引访问时会比较慢。
使用场景
消息队列系统使用list可以构建队列系统使用sorted set甚至可以构建有优先级的队列系统。比如将Redis用作日志收集器实际上还是一个队列多个端点将日志信息写入Redis然后一个worker统一将所有日志写到磁盘。
取最新N个数据的操作记录前N个最新登陆的用户Id列表超出的范围可以从数据库中获得。
//把当前登录人添加到链表里
ret r.lpush(login:last_login_times, uid)
//保持链表只有N位
ret redis.ltrim(login:last_login_times, 0, N-1)
//获得前N个最新登陆的用户Id列表
last_login_list r.lrange(login:last_login_times, 0, N-1)比如微博
在Redis中我们的最新微博ID使用了常驻缓存这是一直更新的。但是我们做了限制不能超过5000个ID因此我们的获取ID函数会一直询问Redis。只有在start/count参数超出了这个范围的时候才需要去访问数据库。我们的系统不会像传统方式那样“刷新”缓存Redis实例中的信息永远是一致的。SQL数据库或是硬盘上的其他类型数据库只是在用户需要获取“很远”的数据时才会被触发而主页或第一个评论页是不会麻烦到硬盘上的数据库了。
redis 127.0.0.1:6379 lpush runoob redis
(integer) 1
redis 127.0.0.1:6379 lpush runoob mongodb
(integer) 2
redis 127.0.0.1:6379 lpush runoob rabitmq
(integer) 3
redis 127.0.0.1:6379 lrange runoob 0 10
1) rabitmq
2) mongodb
3) redis
redis 127.0.0.1:6379列表最多可存储 232 - 1 元素 (4294967295, 每个列表可存储40多亿)。
④ Redis set是string类型的无序集合。集合是通过hashtable实现的概念和数学中个的集合基本类似可以交集并集差集等等set中的元素是没有顺序的。所以添加删除查找的复杂度都是O(1)。
sadd 命令添加一个 string 元素到 key 对应的 set 集合中成功返回1如果元素已经在集合中返回 0如果 key 对应的 set 不存在则返回错误。
常用命令sadd,spop,smembers,sunion 等。
应用场景Redis set对外提供的功能与list类似是一个列表的功能特殊之处在于set是可以自动排重的当你需要存储一个列表数据又不希望出现重复数据时set是一个很好的选择并且set提供了判断某个成员是否在一个set集合内的重要接口这个也是list所不能提供的。
Set 就是一个集合集合的概念就是一堆不重复值的组合。利用Redis提供的Set数据结构可以存储一些集合性的数据。
案例在微博中可以将一个用户所有的关注人存在一个集合中将其所有粉丝存在一个集合。Redis还为集合提供了求交集、并集、差集等操作可以非常方便的实现如共同关注、共同喜好、二度好友等功能对上面的所有集合操作你还可以使用不同的命令选择将结果返回给客户端还是存集到一个新的集合中。
实现方式 set 的内部实现是一个 value永远为null的HashMap实际就是通过计算hash的方式来快速排重的这也是set能提供判断一个成员是否在集合内的原因。
使用场景
①交集并集差集(Set)
//book表存储book名称
set book:1:name ”The Ruby Programming Language”
set book:2:name ”Ruby on rail”
set book:3:name ”Programming Erlang”
//tag表使用集合来存储数据因为集合擅长求交集、并集
sadd tag:ruby 1
sadd tag:ruby 2
sadd tag:web 2
sadd tag:erlang 3
//即属于ruby又属于web的书
inter_list redis.sinter(tag.web, tag:ruby)
//即属于ruby但不属于web的书
inter_list redis.sdiff(tag.ruby, tag:web)
//属于ruby和属于web的书的合集
inter_list redis.sunion(tag.ruby, tag:web)②获取某段时间所有数据去重值
这个使用Redis的set数据结构最合适了只需要不断地将数据往set中扔就行了set意为集合所以会自动排重。
sadd key memberredis 127.0.0.1:6379 sadd runoob redis
(integer) 1
redis 127.0.0.1:6379 sadd runoob mongodb
(integer) 1
redis 127.0.0.1:6379 sadd runoob rabitmq
(integer) 1
redis 127.0.0.1:6379 sadd runoob rabitmq
(integer) 0
redis 127.0.0.1:6379 smembers runoob
1) redis
2) rabitmq
3) mongodb注意:以上实例中 rabitmq 添加了两次但根据集合内元素的唯一性第二次插入的元素将被忽略。集合中最大的成员数为 232 - 1(4294967295, 每个集合可存储40多亿个成员)。
⑤ Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
zadd 命令添:加元素到集合元素在集合中存在则更新对应score。
常用命令zadd,zrange,zrem,zcard等
使用场景Redis sorted set的使用场景与set类似区别是set不是自动有序的而sorted set可以通过用户额外提供一个优先级(score)的参数来为成员排序并且是插入有序的即自动排序。当你需要一个有序的并且不重复的集合列表那么可以选择sorted set数据结构比如twitter 的public timeline可以以发表时间作为score来存储这样获取时就是自动按时间排好序的。和Set相比Sorted Set关联了一个double类型权重参数score使得集合中的元素能够按score进行有序排列redis正是通过分数来为集合中的成员进行从小到大的排序。zset的成员是唯一的,但分数(score)却可以重复。比如一个存储全班同学成绩的Sorted Set其集合value可以是同学的学号而score就可以是其考试得分这样在数据插入集合的时候就已经进行了天然的排序。另外还可以用Sorted Set来做带权重的队列比如普通消息的score为1重要消息的score为2然后工作线程可以选择按score的倒序来获取工作任务。让重要的任务优先执行。
实现方式Redis sorted set的内部使用HashMap和跳跃表(SkipList)来保证数据的存储和有序HashMap里放的是成员到score的映射而跳跃表里存放的是所有的成员排序依据是HashMap里存的score,使用跳跃表的结构可以获得比较高的查找效率并且在实现上比较简单。
zadd key score memberredis 127.0.0.1:6379 zadd runoob 0 redis
(integer) 1
redis 127.0.0.1:6379 zadd runoob 0 mongodb
(integer) 1
redis 127.0.0.1:6379 zadd runoob 0 rabitmq
(integer) 1
redis 127.0.0.1:6379 zadd runoob 0 rabitmq
(integer) 0
redis 127.0.0.1:6379 ZRANGEBYSCORE runoob 0 1000
1) mongodb
2) rabitmq
3) redis各个数据类型应用场景
类型简介特性场景String(字符串)二进制安全可以包含任何数据,比如jpg图片或者序列化的对象,一个键最大能存储512M—Hash(字典)键值对集合,即编程语言中的Map类型适合存储对象,并且可以像数据库中update一个属性一样只修改某一项属性值(Memcached中需要取出整个字符串反序列化成对象修改完再序列化存回去)存储、读取、修改用户属性List(列表)链表(双向链表)增删快,提供了操作某一段元素的API1、最新消息排行等功能(比如朋友圈的时间线) 2、消息队列Set(集合)哈希表实现,元素不重复1、添加、删除、查找的复杂度都是O(1) 2、为集合提供了求交集、并集、差集等操作1、共同好友 2、利用唯一性,统计访问网站的所有独立ip 3、好友推荐时,根据tag求交集,大于某个阈值就可以推荐Sorted Set(有序集合)将Set中的元素增加一个权重参数score,元素按score有序排列数据插入集合时,已经进行天然排序1、排行榜 2、带权重的消息队列Redis实际应用场景
Redis在很多方面与其他数据库解决方案不同它使用内存提供主存储支持而仅使用硬盘做持久性的存储它的数据模型非常独特用的是单线程。另一个大区别在于你可以在开发环境中使用Redis的功能但却不需要转到Redis。
转向Redis当然也是可取的许多开发者从一开始就把Redis作为首选数据库但设想如果你的开发环境已经搭建好应用已经在上面运行了那么更换数据库框架显然不那么容易。另外在一些需要大容量数据集的应用Redis也并不适合因为它的数据集不会超过系统可用的内存。所以如果你有大数据应用而且主要是读取访问模式那么Redis并不是正确的选择。
然而我喜欢Redis的一点就是你可以把它融入到你的系统中来这就能够解决很多问题比如那些你现有的数据库处理起来感到缓慢的任务。这些你就可以通过Redis来进行优化或者为应用创建些新的功能。在本文中我就想探讨一些怎样将Redis加入到现有的环境中并利用它的原语命令等功能来解决 传统环境中碰到的一些常见问题。在这些例子中Redis都不是作为首选数据库。
1、显示最新的项目列表
下面这个语句常用来显示最新项目随着数据多了查询毫无疑问会越来越慢。
SELECT * FROM foo WHERE ... ORDER BY time DESC LIMIT 10 在Web应用中“列出最新的回复”之类的查询非常普遍这通常会带来可扩展性问题。这令人沮丧因为项目本来就是按这个顺序被创建的但要输出这个顺序却不得不进行排序操作。
类似的问题就可以用Redis来解决。比如说我们的一个Web应用想要列出用户贴出的最新20条评论。在最新的评论边上我们有一个“显示全部”的链接点击后就可以获得更多的评论。
我们假设数据库中的每条评论都有一个唯一的递增的ID字段。我们可以使用分页来制作主页和评论页使用Redis的模板每次新评论发表时我们会将它的ID添加到一个Redis列表
LPUSH latest.comments ID 我们将列表裁剪为指定长度因此Redis只需要保存最新的5000条评论
LTRIM latest.comments 0 5000 每次我们需要获取最新评论的项目范围时我们调用一个函数来完成使用伪代码
FUNCTION get_latest_comments(start, num_items): id_list redis.lrange(latest.comments,start,startnum_items - 1) IF id_list.length num_items id_list SQL_DB(SELECT ... ORDER BY time LIMIT ...) END RETURN id_list
END 这里我们做的很简单。在Redis中我们的最新ID使用了常驻缓存这是一直更新的。但是我们做了限制不能超过5000个ID因此我们的获取ID函数会一直询问Redis。只有在start/count参数超出了这个范围的时候才需要去访问数据库。我们的系统不会像传统方式那样“刷新”缓存Redis实例中的信息永远是一致的。SQL数据库或是硬盘上的其他类型数据库只是在用户需要获取“很远”的数据时才会被触发而主页或第一个评论页是不会麻烦到硬盘上的数据库了。
2、删除与过滤
我们可以使用LREM来删除评论。如果删除操作非常少另一个选择是直接跳过评论条目的入口报告说该评论已经不存在。
redis 127.0.0.1:6379 LREM KEY_NAME COUNT VALUE有些时候你想要给不同的列表附加上不同的过滤器。如果过滤器的数量受到限制你可以简单的为每个不同的过滤器使用不同的Redis列表。毕竟每个列表只有5000条项目但Redis却能够使用非常少的内存来处理几百万条项目。
3、排行榜相关
另一个很普遍的需求是各种数据库的数据并非存储在内存中因此在按得分排序以及实时更新这些几乎每秒钟都需要更新的功能上数据库的性能不够理想。
典型的比如那些在线游戏的排行榜比如一个Facebook的游戏根据得分你通常想要
- 列出前100名高分选手
- 列出某用户当前的全球排名
这些操作对于Redis来说小菜一碟即使你有几百万个用户每分钟都会有几百万个新的得分。
模式是这样的每次获得新得分时我们用这样的代码 ZADD leaderboard score username你可能用userID来取代username这取决于你是怎么设计的。
得到前100名高分用户很简单ZREVRANGE leaderboard 0 99。
用户的全球排名也相似只需要ZRANK leaderboard 。
4、按照用户投票和时间排序
排行榜的一种常见变体模式就像Reddit或Hacker News用的那样新闻按照类似下面的公式根据得分来排序
score points / time^alpha
因此用户的投票会相应的把新闻挖出来但时间会按照一定的指数将新闻埋下去。下面是我们的模式当然算法由你决定。
模式是这样的开始时先观察那些可能是最新的项目例如首页上的1000条新闻都是候选者因此我们先忽视掉其他的这实现起来很简单。
每次新的新闻贴上来后我们将ID添加到列表中使用LPUSH LTRIM确保只取出最新的1000条项目。
有一项后台任务获取这个列表并且持续的计算这1000条新闻中每条新闻的最终得分。计算结果由ZADD命令按照新的顺序填充生成列表老新闻则被清除。这里的关键思路是排序工作是由后台任务来完成的。
5、处理过期项目
另一种常用的项目排序是按照时间排序。我们使用unix时间作为得分即可。
模式如下
- 每次有新项目添加到我们的非Redis数据库时我们把它加入到排序集合中。这时我们用的是时间属性current_time和time_to_live。
- 另一项后台任务使用ZRANGE…SCORES查询排序集合取出最新的10个项目。如果发现unix时间已经过期则在数据库中删除条目。
6、计数
Redis是一个很好的计数器这要感谢INCRBY和其他相似命令。
我相信你曾许多次想要给数据库加上新的计数器用来获取统计或显示新信息但是最后却由于写入敏感而不得不放弃它们。
好了现在使用Redis就不需要再担心了。有了原子递增atomic increment你可以放心的加上各种计数用GETSET重置或者是让它们过期。
例如这样操作
INCR user:id EXPIRE user:id 60 你可以计算出最近用户在页面间停顿不超过60秒的页面浏览量当计数达到比如20时就可以显示出某些条幅提示或是其它你想显示的东西。
7、特定时间内的特定项目
另一项对于其他数据库很难但Redis做起来却轻而易举的事就是统计在某段特点时间里有多少特定用户访问了某个特定资源。比如我想要知道某些特定的注册用户或IP地址他们到底有多少访问了某篇文章。
每次我获得一次新的页面浏览时我只需要这样做
SADD page:day1:page_id user_id
当然你可能想用unix时间替换day1比如time()-(time()%3600*24)等等。
想知道特定用户的数量吗只需要使用
SCARD page:day1:page_id
需要测试某个特定用户是否访问了这个页面
SISMEMBER page:day1:page_id
8、实时分析正在发生的情况用于数据统计与防止垃圾邮件等
我们只做了几个例子但如果你研究Redis的命令集并且组合一下就能获得大量的实时分析方法有效而且非常省力。使用Redis原语命令更容易实施垃圾邮件过滤系统或其他实时跟踪系统。
9、Pub/Sub
Redis的Pub/Sub非常非常简单运行稳定并且快速。支持模式匹配能够实时订阅与取消频道。
10、队列
你应该已经注意到像list push和list pop这样的Redis命令能够很方便的执行队列操作了但能做的可不止这些比如Redis还有list pop的变体命令能够在列表为空时阻塞队列。
现代的互联网应用大量地使用了消息队列Messaging。消息队列不仅被用于系统内部组件之间的通信同时也被用于系统跟其它服务之间的交互。消息队列的使用可以增加系统的可扩展性、灵活性和用户体验。非基于消息队列的系统其运行速度取决于系统中最慢的组件的速度注短板效应。而基于消息队列可以将系统中各组件解除耦合这样系统就不再受最慢组件的束缚各组件可以异步运行从而得以更快的速度完成各自的工作。
此外当服务器处在高并发操作的时候比如频繁地写入日志文件。可以利用消息队列实现异步处理。从而实现高性能的并发操作。
11、缓存
Redis的缓存部分值得写一篇新文章我这里只是简单的说一下。Redis能够替代memcached让你的缓存从只能存储数据变得能够更新数据因此你不再需要每次都重新生成数据了。