浅谈redis数据库的键值设计
丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。
下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。
用户登录系统
记录用户登录信息的一个系统, 我们简化业务后只留下一张表。
关系型数据库的设计
mysql> select * from login; +---------+----------------+-------------+---------------------+ | user_id | name | login_times | last_login_time | +---------+----------------+-------------+---------------------+ | 1 | ken thompson | 5 | 2011-01-01 00:00:00 | | 2 | dennis ritchie | 1 | 2011-02-01 00:00:00 | | 3 | Joe Armstrong | 2 | 2011-03-01 00:00:00 | +---------+----------------+-------------+---------------------+
user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。
redis的设计
关系型数据转化为KV数据库,我的方法如下:
key 表名:主键值:列名
value 列值
一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:
Set login:1:login_times 5 Set login:2:login_times 1 Set login:3:login_times 2Set login:1:last_login_time 2011-1-1 Set login:2:last_login_time 2011-2-1 Set login:3:last_login_time 2011-3-1set login:1:name ”ken thompson“ set login:2:name “dennis ritchie” set login:3:name ”Joe Armstrong“
这样在已知主键的情况下,通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。
一般用户是无法知道自己的id的,只知道自己的用户名,所以还必须有一个从name到id的映射关系,这里的设计与上面的有所不同。
set "login:ken thompson:id" 1 set "login:dennis ritchie:id" 2 set "login: Joe Armstrong:id" 3
这样每次用户登录的时候业务逻辑如下(python版),r是redis对象,name是已经获知的用户名。
#获得用户的id uid = r.get("login:%s:id" % name) #自增用户的登录次数 ret = r.incr("login:%s:login_times" % uid) #更新该用户的最后登录时间 ret = r.set("login:%s:last_login_time" % uid, datetime.datetime.now())
如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。
假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。
select * from login order by last_login_time desc limit N
DBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N次,效果很好。
过了两天,又来一个需求,需要知道登录次数最多的人是谁。同样的关系型如何处理?DEV说简单
select * from login order by login_times desc limit N
DBA一看,又要在login_time上建立一个索引。有没有觉得有点问题呢,表上每个字段上都有素引。
关系型数据库的数据存储的的不灵活是问题的源头,数据仅有一种储存方法,那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的,而访问路径的增加又意味着你必须使用统计信息来辅助,于是一大堆的问题就出现了。
没有索引,没有统计计划,没有执行计划,这就是kv数据库。
redis里如何满足以上的需求呢? 对于求最新的N条数据的需求,链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码,维护一个登录的链表,控制他的长度,使得里面永远保存的是最近的N个登录用户。
#把当前登录人添加到链表里 ret = r.lpush("login:last_login_times", uid) #保持链表只有N位 ret = redis.ltrim("login:last_login_times", 0, N-1)
这样需要获得最新登录人的id,如下的代码即可
last_login_list = r.lrange("login:last_login_times", 0, N-1)
另外,求登录次数最多的人,对于排序,积分榜这类需求,sorted set非常的适合,我们把用户和登录次数统一存储在一个sorted set里。
zadd login:login_times 5 1 zadd login:login_times 1 2 zadd login:login_times 2 3
这样假如某个用户登录,额外维护一个sorted set,代码如此
#对该用户的登录次数自增1 ret = r.zincrby("login:login_times", 1, uid)
那么如何获得登录次数最多的用户呢,逆序排列取的排名第N的用户即可
ret = r.zrevrange("login:login_times", 0, N-1)
可以看出,DEV需要添加2行代码,而DBA不需要考虑索引什么的。
TAG系统
tag在互联网应用里尤其多见,如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。
关系型数据库的设计
两张表,一张book的明细,一张tag表,表示每本的tag,一本书存在多个tag。
mysql> select * from book; +------+-------------------------------+----------------+ | id | name | author | +------+-------------------------------+----------------+ | 1 | The Ruby Programming Language | Mark Pilgrim | | 1 | Ruby on rail | David Flanagan | | 1 | Programming Erlang | Joe Armstrong | +------+-------------------------------+----------------+mysql> select * from tag; +---------+---------+ | tagname | book_id | +---------+---------+ | ruby | 1 | | ruby | 2 | | web | 2 | | erlang | 3 | +---------+---------+假如有如此需求,查找即是ruby又是web方面的书籍,如果以关系型数据库会怎么处理?
select b.name, b.author from tag t1, tag t2, book b where t1.tagname = 'web' and t2.tagname = 'ruby' and t1.book_id = t2.book_id and b.id = t1.book_id
tag表自关联2次再与book关联,这个sql还是比较复杂的,如果要求即ruby,但不是web方面的书籍呢?
关系型数据其实并不太适合这些集合操作。
redis的设计
首先book的数据肯定要存储的,和上面一样。
set book:1:name ”The Ruby Programming Language” Set book:2:name ”Ruby on rail” Set book:3:name ”Programming Erlang”set book:1:author ”Mark Pilgrim” Set book:2:author ”David Flanagan” Set book:3:author ”Joe Armstrong”
tag表我们使用集合来存储数据,因为集合擅长求交集、并集
sadd tag:ruby 1 sadd tag:ruby 2 sadd tag:web 2 sadd tag:erlang 3
那么,即属于ruby又属于web的书?
inter_list = redis.sinter("tag.web", "tag:ruby")
即属于ruby,但不属于web的书?
inter_list = redis.sdiff("tag.ruby", "tag:web")
属于ruby和属于web的书的合集?
inter_list = redis.sunion("tag.ruby", "tag:web")
简单到不行阿。
从以上2个例子可以看出在某些场景里,关系型数据库是不太适合的,你可能能够设计出满足需求的系统,但总是感觉的怪怪的,有种生搬硬套的感觉。
尤其登录系统这个例子,频繁的为业务建立索引。放在一个复杂的系统里,ddl(创建索引)有可能改变执行计划。导致其它的sql采用不同的执行计划,业务复杂的老系统,这个问题是很难预估的,sql千奇百怪。要求DBA对这个系统里所有的sql都了解,这点太难了。这个问题在oracle里尤其严重,每个DBA估计都碰到过。对于MySQL这类系统,ddl又不方便(虽然现在有online ddl的方法)。碰到大表,DBA凌晨爬起来在业务低峰期操作,这事我没少干过。而这种需求放到redis里就很好处理,DBA仅仅对容量进行预估即可。
未来的OLTP系统应该是kv和关系型的紧密结合。
浅谈redis数据库的键值设计相关推荐
- python 字典键值重复_浅谈python字典多键值及重复键值的使用
在python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多键值 字典的多键值形式如下: ...
- redis专题:redis键值设计、性能优化以及redis连接池配置
文章目录 1.redis键值设计 ①:key设计规范 ②:value设计规范 2. 命令使用优化 3. redis连接池配置参数设计 4. redis连接池预热 5. redis的key过期删除策略 ...
- Python 基于python+mysql浅谈redis缓存设计与数据库关联数据处理
基于python+mysql浅谈redis缓存设计与数据库关联数据处理 by:授客 QQ:1033553122 测试环境 redis-3.0.7 CentOS 6.5-x86_64 python 3 ...
- python文本框与数据库的关联_Python 基于python+mysql浅谈redis缓存设计与数据库关联数据处理...
基于python+mysql浅谈redis缓存设计与数据库关联数据处理 by:授客 QQ:1033553122 测试环境 redis-3.0.7 CentOS 6.5-x86_64 python 3. ...
- Redis设计与实现 -- 浅谈Redis持久化
在讲解Redis持久化相关的话题之前,我们需要了解的是Redis为什么这么快?也就是Redis的IO模型 – 多路复用. 我们一句话概括为什么Redis这么快: Redis是单线程的,使用多路复用的I ...
- Redis 键值设计使用总结
前言 对redis的使用,想必做过后端开发的同学都不陌生,redis为key/value非关系型数据库,使用起来简单高效,支持的数据类型也比较丰富,几乎在日常开发中没有不涉及的: 但如果对redis使 ...
- 阿里云Redis的规范:键值设计、命令使用、客户端使用、相关工具
更多内容关注微信公众号:fullstack888 本文主要介绍在使用阿里云Redis的开发规范,从下面几个方面进行说明. 键值设计 命令使用 客户端使用 相关工具 通过本文的介绍可以减少使用Redis ...
- Redis进阶-Redis键值设计及BigKey问题
文章目录 键值设计 key设计 value设计 big key 定义 反例 bigkey的产生 如何优化bigkey 删除bigKey的注意事项 bigkey的危害 键值设计 key设计 (1)[建议 ...
- 浅谈DM数据库优化常识
今天谈一谈SQL的优化分享知识,在DBA的角度来看,数据库的优化一直是DBA一项很重要的工作,作为任何一门技术来说都应该本着"要想打败他必须先要了解他"的原则,其实,任何数据库的S ...
最新文章
- 用三个线程实现生产者消费者模型,其中一个线程作为生产者,二个线程作为消费者,生产者随机生产一个时间戳或者字符串,消费者消费这个时间戳,并不能重复消费,并将其打印出来
- 汇编语言--转移指令的原理
- PyQt5 技术篇-QComboBox下拉框绑定监听事件实例演示
- 数字图像处理实验(5):PROJECT 04-01 [Multiple Uses],Two-Dimensional Fast Fourier Transform
- 产品必懂技术术语(后台类)
- JDK1.5 与 JDK1.6的新特性
- 设计模式之_工厂系列_02
- Angular Schematics 学习笔记
- centos 时间同步_ftp同步更新,ftp远程文件同步更新日志详情
- mysql gtid ha_MySQl新特性 GTID
- Centos 7 Linux系统修改网卡名称为ethx
- 服务器搭建2 VSFTP搭建FTP服务器
- hi模板文件报乱码问题
- mssql差异备份获得的webshell的个人体会
- C# Bitmap 频繁创建报错 软件闪退 内存溢出
- 为多个VLAN实现DCHP
- 游戏战斗力量模型量化
- minidump详细介绍
- 关于U盘免疫的一些自我认识
- mysql数据库定时清理数据
热门文章
- 【Flutter】StatefulWidget 组件 ( 创建 StatefulWidget 组件 | MaterialApp 组件 | Scaffold 组件 )
- 【iOS 开发】基本 UI 控件详解 (UIButton | UITextField | UITextView | UISwitch)
- top命令详析及排查问题使用演示
- express-14 发送邮件
- 解析 this.initialize.apply(this, arguments)
- NodeJS学习笔记(四) events,util模块
- Spring2.5.6学习笔记-实例化bean的几种方法
- ajaxfileupload带多个参数上传方法
- 关于Asp.net页面的刷新
- NSkyKit 项目实践-Dagger2