Redis学习笔记

  • 1、NoSQL数据库
    • 1.1解决的问题
      • 1.1.1解决CPU及内存压力
      • 1.1.2解决IO压力
    • 1.2NoSQL数据库概述
      • 1.2.1什么是NoSQL数据库
      • 1.2.2适用与不适用场景
      • 1.2.3常见的几种NoSQL数据库
  • 2、Redis概述
    • 2.1Redis介绍
    • 2.2应用场景
    • 2.3Redis安装
    • 2.4相关知识
  • 3、Redis五大数据类型
    • 3.1Redis 字符串(String)
      • 3.1.1概述
      • 3.1.2常用命令
      • 3.1.3数据结构
    • 3.2Redis 列表(List)
      • 3.2.1概述
      • 3.2.2常用命令
      • 3.2.3数据结构
    • 3.3Redis 集合(Set)
      • 3.3.1概述
      • 3.3.2常用命令
      • 3.3.3数据结构
    • 3.4Redis 哈希(Hash)
      • 3.4.1概述
      • 3.4.2常用命令
      • 3.4.3数据结构
    • 3.5Redis 有序集合Zset(sorted set)
      • 3.5.1概述
      • 3.5.2常用命令
      • 3.5.3数据结构
      • 3.5.4跳跃表
  • 4、Redis的发布和订阅
    • 4.1什么是发布和订阅
    • 4.2Redis的发布和订阅
    • 4.3发布订阅命令行实现
  • 5、Redis新数据类型
    • 5.1Bitmaps
      • 5.1.1概述
      • 5.1.2Bitmaps与set的对比
    • 5.2HyperLogLog
    • 5.3Geospatial
  • 6、Redis事务、锁机制和秒杀
    • 6.1Redis的事务定义
    • 6.2Multi、Exec、discard
    • 6.3事务的错误处理
    • 6.4为什么要做成事务
    • 6.5事务的冲突问题
      • 6.5.1悲观锁
      • 6.5.2乐观锁
    • 6.6Redis事务的三特性
  • 7、Redis_事务锁机制秒杀案例
    • 7.1解决计数器和人员记录的事务操作
    • 7.2Redis事务_秒杀并发模拟
    • 7.3超卖问题
    • 7.4继续增加并发进行测试
      • 7.4.1连接有限制
      • 7.4.2连接超时,可以通过连接池解决
      • 7.4.3已经秒光,可是还有库存
    • 7.5使用LUA脚本解决库存遗留问题
  • 8、Redis持久化_RDB
    • 8.1RDB官网介绍
    • 8.2RDB(Redis Database)
      • 8.2.1简介
      • 8.2.2备份是如何执行的
      • 8.2.3Fork
      • 8.2.4RDB持久化流程
      • 8.2.5dump.rdb文件
      • 8.2.6如何触发RDB快照;保持策略
      • 8.2.7优势
      • 8.2.8劣势
      • 8.2.9如何停止
      • 8.2.10小总结
  • 9、Redis持久化_AOF
    • 9.1 AOF(Append Only File)
      • 9.1.1简介
      • 9.1.2AOF持久化流程
      • 9.1.3AOF默认不开启
      • 9.1.4 AOF和RDB同时开启,redis听谁的?
      • 9.1.5AOF启动/修复/恢复
      • 9.1.6AOF同步频率设置
      • 9.1.7Rewrite压缩
      • 9.1.8优势
      • 9.1.9劣势
      • 9.1.10小总结
    • 9.2总结(which one)
      • 9.2.1用哪个好
      • 9.2.2官网建议
  • 10、Redis主从复制
    • 10.1搭建一主多从
    • 10.2主从复制原理
    • 10.3哨兵模式
  • 11、Redis集群(cluster模式)
    • 11.1问题
    • 11.2集群连接
    • 11.3redis cluster 如何分配这六个节点?
    • 11.4什么是slots
    • 11.5在集群中录入值
    • 11.6查询集群中的值
    • 11.7故障恢复
    • 11.8Redis集群的优点
    • 11.9Redis集群的不足
  • 12、Redis_应用问题(面试重点)
    • 12.1缓存穿透
      • 12.1.1问题描述
      • 12.1.2解决方案
    • 12.2缓存击穿
      • 12.2.1问题描述
      • 12.2.2解决方案
    • 12.3缓存雪崩
      • 12.3.1问题描述
      • 12.3.2解决方案
    • 12.4分布式锁
      • 12.4.1问题描述
      • 12.4.2解决方案
        • 使用redis实现分布式锁
        • 优化之同时设置锁和过期时间
        • 优化之 UUID 防止误删
        • 优化之 LUA 脚本保证删除的原子性
        • 总结
  • 13、Redis6新功能
    • 13.1ACL
    • 13.2IO多线程
    • 13.3工具支持Cluster

1、NoSQL数据库

1.1解决的问题

Web1.0的时代,数据访问量很有限,用一夫当关的高性能的单点服务器可以解决大部分问题(一个客户端使用一台服务器)。

随着Web2.0的时代的到来,用户访问量大幅度提升,同时产生了大量的用户数据。加上后来的智能移动设备的普及,所有的互联网平台都面临了巨大的性能挑战。

1.1.1解决CPU及内存压力


解决方案

方案1:存放在cookie中 1、存放在客户端中不安全 2、网络负担效率低

方案2:存放在文件服务器或者数据库里 1、大量的IO效率问题

方案3:session复制 1、session数据冗余,对象重复 2、节点越多浪费越大

方案4:缓存数据库 1、完全在内存中,速度快 2、数据结构简单

1.1.2解决IO压力

1.2NoSQL数据库概述

1.2.1什么是NoSQL数据库

NoSQL(NoSQL = Not Only SQL ),意即“不仅仅是SQL”,泛指非关系型的数据库。 NoSQL 不依赖业务逻辑方式存储,而以简单的key-value模式存储。因此大大的增加了数据库的扩展能力。

  • 不遵循SQL标准
  • 不指出ACID
  • 远超于SQL的性能

1.2.2适用与不适用场景

适用场景

  • 对数据高并发的读写
  • 海量数据的读写
  • 对数据高可扩展性的需求

不适用场景

  • 需要事务支持
  • 基于sql的结构化查询存储,处理复杂的关系,需要即席查询。(即席查询(Ad Hoc)是用户根据自己的需求,灵活的选择查询条件,系统能够根据用户的选择生成相应的统计报表。)
  • 用不着sql的和用了sql也不行的情况,请考虑用NoSql

1.2.3常见的几种NoSQL数据库

Memcache
很早出现的NoSql数据库;数据都在内存中,一般不持久化;支持简单的key-value模式,支持类型单一;一般是作为缓存数据库辅助持久化的数据库。

Redis
几乎覆盖了Memcached的绝大部分功能;数据都在内存中,支持持久化,主要用作备份恢复;除了支持简单的key-value模式,还支持多种数据结构的存储,比如 list、set、hash、zset等。一般是作为缓存数据库辅助持久化的数据库。

MongoDB
高性能、开源、模式自由(schema free)的文档型数据库 ;数据都在内存中, 如果内存不足,把不常用的数据保存到硬盘;虽然是key-value模式,但是对value(尤其是json)提供了丰富的查询功能;支持二进制数据及大型对象;可以根据数据的特点替代RDBMS ,成为独立的数据库。或者配合RDBMS,存储特定的数据。

还有 行、列式存储数据库 、图关系型数据库。

2、Redis概述

2.1Redis介绍

  • Redis是一个开源key-value存储系统。
  • 和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。
  • 这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。
  • 在此基础上,Redis支持各种不同方式的排序
  • 与memcached一样,为了保证效率,数据都是缓存在内存中。
  • 区别的是Redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件。
  • 并且在此基础上实现了**master-slave(主从)**同步。

2.2应用场景

配合关系型数据库做高速缓存

  • 高频次,热门访问的数据,降低数据库IO
  • 分布式架构,做session共享

多样的数据结构存储持久化数据

2.3Redis安装

redis官网:https://redis.io/

redis中文官网: http://redis.cn/

redis下载 6.2.1(学习用的)

安装步骤:

基于CentOS7 进行安装

测试 gcc版本

gcc --version


下载redis-6.2.1.tar.gz放/opt目录

解压命令:

tar -zxvf redis-6.2.1.tar.gz

解压完成后进入目录:

cd redis-6.2.1

在redis-6.2.1目录下再次执行make命令(只是编译好)

如果没有准备好C语言编译环境,make 会报错—Jemalloc/jemalloc.h:没有那个文件

解决方案:运行make distclean

在redis-6.2.1目录下再次执行make命令(只是编译好)

跳过make test 继续执行:

 make install


默认安装目录在:/usr/local/bin

查看默认安装目录:

redis-benchmark:性能测试工具,可以在自己本子运行,看看自己本子性能如何

redis-check-aof:修复有问题的AOF文件,rdb和aof后面讲

redis-check-dump:修复有问题的dump.rdb文件

redis-sentinel:Redis集群使用

redis-server:Redis服务器启动命令

redis-cli:客户端,操作入口

前台启动(不推荐):前台启动,命令行窗口不能关闭,否则服务器停止

后台启动(推荐):
备份redis.conf
拷贝一份redis.conf到其他目录

cp redis.conf /etc/redis.conf

后台启动设置daemonize no改成yes
修改redis.conf(128行)文件将里面的daemonize no 改成 yes,让服务在后台启动

redis服务启动命令:

redis-server /etc/redis.conf

查看redis进程命令:

ps -ef | grep redis


redis关闭:

redis-cli shutdown

2.4相关知识

端口6379从何而来 ,外国女演员 Alessia Merz 字母对应九键的位置

Redis默认有16个数据库,类似于数组下标从0开始,初始默认使用0号库

使用命令 select index 来切换数据库。如: select 8

统一密码管理,所有库同样密码。

Redis是单线程+多路IO复用技术

多路复用是指使用一个线程来检查多个文件描述符(Socket)的就绪状态,比如调用select和poll函数,传入多个文件描述符,如果有一个文件描述符就绪,则返回,否则阻塞直到超时。得到就绪状态后进行真正的操作可以在同一个线程里执行,也可以启动线程执行(比如使用线程池)

串行 vs 多线程+锁(memcached) vs 单线程+多路IO复用(Redis)

与Memcache三点不同: 支持多数据类型,支持持久化,单线程+多路IO复用

redis键(key)常用命令

keys *查看当前库所有key (匹配:keys *1)

exists key 判断某个key是否存在

type key 查看你的key是什么类型

del key 删除指定的key数据

unlink key 根据value选择非阻塞删除,仅将keys从keyspace元数据中删除,真正的删除会在后续异步操作。

expire key 10 10秒钟:为给定的key设置过期时间

ttl key 查看还有多少秒过期,-1表示永不过期,-2表示已过期

select 命令切换数据库

dbsize 查看当前数据库的key的数量

flushdb清空当前库

flushall通杀全部库

原子性
所谓原子操作是指不会被线程调度机制打断的操作;
这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch (切换到另一个线程)。
1、在单线程中, 能够在单条指令中完成的操作都可以认为是"原子操作",因为中断只能发生于指令之间。
2、在多线程中,不能被其它进程(线程)打断的操作就叫原子操作。
Redis单命令的原子性主要得益于Redis的单线程。

案例分析点击可看:

3、Redis五大数据类型

3.1Redis 字符串(String)

3.1.1概述

  1. String 是 Redis 最基本的类型,你可以理解成与 Memcached 一模一样的类型,一个 key 对应一个 value。
  2. String 类型是二进制安全的。意味着 Redis 的 string 可以包含任何数据。比如 jpg 图片或者序列化的对象。
  3. String 类型是 Redis 最基本的数据类型,一个 Redis 中字符串 value 最多可以是 512M。

3.1.2常用命令

set <key><value>添加键值对

exists <key>判断该键是否存在

expire <key><seconds> 设置过期时间

get <key>查询对应键值


append <key><value>将给定的<value>追加到原值的末尾

strlen <key>获得值的长度

setnx <key><value>只有在 key 不存在时 设置 key 的值


incr <key> 将 key 中储存的数字值增1 ,只能对数字值操作,如果为空,新增值为1

decr <key> 将 key 中储存的数字值减1,只能对数字值操作,如果为空,新增值为-1

incrby / decrby <key><步长> 将 key 中储存的数字值增减。自定义步长。


mset <key1><value1><key2><value2> ..... 同时设置一个或多个 key-value对

mget <key1><key2><key3> ..... 同时获取一个或多个 value

msetnx <key1><value1><key2><value2> .....同时设置一个或多个 key-value 对,当且仅当所有给定 key 都不存在。
原子性,有一个失败则都失败


getrange <key><起始位置><结束位置> 获得值的范围,类似java中的substring,前包,后包

setrange <key><起始位置><value>

<value>覆写<key>所储存的字符串值,从<起始位置>开始 (索引从0开始)


setex <key><过期时间><value> 设置键值的同时,设置过期时间,单位秒。

getset <key><value> 以新换旧,设置了新值同时获得旧值。

3.1.3数据结构

String的数据结构为简单动态字符串(Simple Dynamic String,缩写SDS)。是可以修改的字符串,内部结构实现上类似于Java的ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配.

如图中所示,内部为当前字符串实际分配的空间capacity一般要高于实际字符串长度len。当字符串长度小于1M时,扩容都是加倍现有的空间,如果超过1M,扩容时一次只会多扩1M的空间。需要注意的是字符串最大长度为512M。

3.2Redis 列表(List)

3.2.1概述

  • 单键多值
  • Redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)。
  • 它的底层实际是个双向链表,对两端的操作性能很高,通过索引下标的操作中间的节点性能会较差。

3.2.2常用命令

lpush/rpush <key><value1><value2><value3> ....从左边/右边插入一个或多个值。

lpop/rpop <key>从左边/右边吐出一个值。值在键在,值光键亡。


rpoplpush <key1><key2>从<key1>列表右边吐出一个值,插到<key2>列表左边。

lrange <key><start><stop> 按照索引下标获得元素(从左到右)

lrange mylist 0 -1 0左边第一个,-1右边第一个,(0-1表示获取所有)

lindex <key><index> 按照索引下标获得元素(从左到右)

llen <key> 获得列表长度


linsert <key> before <value><newvalue><value>的后面插入<newvalue>插入值

lrem <key><n><value>从左边删除n个value(从左到右)

lset<key><index><value>将列表key下标为index的值替换成value

3.2.3数据结构

List的数据结构为快速链表quickList

首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是ziplist,也就是压缩列表

它将所有的元素紧挨着一起存储,分配的是一块连续的内存。

当数据量比较多的时候才会改成quicklist。

因为普通的链表需要的附加指针空间太大,会比较浪费空间。比如这个列表里存的只是int类型的数据,结构上还需要两个额外的指针prev和next。

Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能,又不会出现太大的空间冗余。

3.3Redis 集合(Set)

3.3.1概述

Redis set对外提供的功能与list类似是一个列表的功能,特殊之处在于set是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,set是一个很好的选择,并且set提供了判断某个成员是否在一个set集合内的重要接口,这个也是list所不能提供的

Redis的Set是string类型的无序集合。它底层其实是一个value为null的hash表,所以添加,删除,查找的 复杂度都是O(1)

一个算法,随着数据的增加,执行时间的长短,如果是O(1),数据增加,查找数据的时间不变

3.3.2常用命令

sadd <key><value1><value2> .....
将一个或多个 member 元素加入到集合 key 中,已经存在的 member 元素将被忽略

smembers <key>取出该集合的所有值。

sismember <key><value>判断集合<key>是否为含有该<value>值,有1,没有0

scard<key>返回该集合的元素个数。

srem <key><value1><value2> ....删除集合中的某个元素。

spop <key> 随机从该集合中吐出一个值。

srandmember <key><n> 随机从该集合中取出n个值。不会从集合中删除 。

smove <source><destination> value 把集合中一个值从一个集合移动到另一个集合

sinter <key1><key2> 返回两个集合的交集元素。

sunion <key1><key2> 返回两个集合的并集元素。

sdiff <key1><key2> 返回两个集合的差集元素(key1中的,不包含key2中的)

3.3.3数据结构

Set数据结构是dict字典,字典是用哈希表实现的。

Java中HashSet的内部实现使用的是HashMap,只不过所有的value都指向同一个对象。Redis的set结构也是一样,它的内部也使用hash结构,所有的value都指向同一个内部值。

3.4Redis 哈希(Hash)

3.4.1概述

  • Redis hash 是一个键值对集合。
  • Redis hash是一个string类型的 fieldvalue 的映射表,hash特别适合用于存储对象。
    类似Java里面的Map<String,Object>
  • 用户ID为查找的key,存储的value用户对象包含姓名,年龄,生日等信息,如果用普通的key/value结构来存储

主要有以下2种存储方式:

3.4.2常用命令

hset <key><field><value><key>集合中的<field>键赋值<value>

hget <key1><field><key1>集合取出 value

hmset <key1><field1><value1><field2><value2>...批量设置hash的值

hexists<key1><field>查看哈希表 key 中,给定域 field 是否存在。

hkeys <key>列出该hash集合的所有field

hvals <key>列出该hash集合的所有value

hincrby <key><field><increment>为哈希表 key 中的域 field 的值加上增量 1 -1

hsetnx <key><field><value>将哈希表 key 中的域 field 的值设置为 value ,当且仅当域 field 不存在 .

3.4.3数据结构

​ Hash类型对应的数据结构是两种:ziplist(压缩列表),hashtable(哈希表)。当field-value长度较短且个数较少时,使用ziplist,否则使用hashtable。

3.5Redis 有序集合Zset(sorted set)

3.5.1概述

  • Redis有序集合zset与普通集合set非常相似,是一个没有重复元素的字符串集合。
  • 不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分可以是重复了
  • 因为元素是有序的, 所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。
  • 访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表。

3.5.2常用命令

zadd <key><score1><value1><score2><value2>…
将一个或多个 member 元素及其 score 值加入到有序集 key 当中。

zrange <key><start><stop> [WITHSCORES]
返回有序集 key 中,下标在 之间的元素
带WITHSCORES,可以让分数一起和值返回到结果集。

zrangebyscore key minmax [withscores] [limit offset count]
返回有序集 key 中,所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列。

zrevrangebyscore key maxmin [withscores] [limit offset count]
同上,改为从大到小排列。

zincrby <key><increment><value> 为元素的score加上增量

zrem <key><value>删除该集合下,指定值的元素

zcount <key><min><max>统计该集合,分数区间内的元素个数

zrank <key><value>返回该值在集合中的排名,从0开始。

案例:如何利用zset实现一个文章访问量的排行榜? 答:用 zrangebyscore key minmax [withscores] 命令实现

3.5.3数据结构

​SortedSet(zset)是Redis提供的一个非常特别的数据结构,一方面它等价于Java的数据结构Map<String, Double>,可以给每一个元素value赋予一个权重score,另一方面它又类似于TreeSet,内部的元素会按照权重score进行排序,可以得到每个元素的名次,还可以通过score的范围来获取元素的列表。

zset底层使用了两个数据结构
(1)hash,hash的作用就是关联元素value和权重score,保障元素value的唯一性,可以通过元素value找到相应的score值。
(2)跳跃表,跳跃表的目的在于给元素value排序,根据score的范围获取元素列表。

3.5.4跳跃表

1、简介
有序集合在生活中比较常见,例如根据成绩对学生排名,根据得分对玩家排名等。对于有序集合的底层实现,可以用数组、平衡树、链表等。数组不便元素的插入、删除;平衡树或红黑树虽然效率高但结构复杂;链表查询需要遍历所有效率低。Redis采用的是跳跃表。跳跃表效率堪比红黑树,实现远比红黑树简单。
2、实例
对比有序链表和跳跃表,从链表中查询出51
(1) 有序链表


要查找值为51的元素,需要从第一个元素开始依次查找、比较才能找到。共需要6次比较。
(2) 跳跃表

从第2层开始,1节点比51节点小,向后比较。

21节点比51节点小,继续向后比较,后面就是NULL了,所以从21节点向下到第1层

在第1层,41节点比51节点小,继续向后,61节点比51节点大,所以从41向下

在第0层,51节点为要查找的节点,节点被找到,共查找4次。

从此可以看出跳跃表比有序链表效率要高

4、Redis的发布和订阅

4.1什么是发布和订阅

  • Redis 发布订阅 (pub/sub) 是一种消息通信模式:发送者 (pub) 发送消息,订阅者 (sub) 接收消息。
  • Redis 客户端可以订阅任意数量的频道。

4.2Redis的发布和订阅

1、客户端可以订阅频道如下图

2、当给这个频道发布消息后,消息就会发送给订阅的客户端

4.3发布订阅命令行实现

1、 打开一个客户端订阅channel1

SUBSCRIBE channel1

2、打开另一个客户端,给channel1发布消息hello

publish channel1 hello

3、打开第一个客户端可以看到发送的消息

注:发布的消息没有持久化,如果在订阅的客户端收不到hello,只能收到订阅后发布的消息。

5、Redis新数据类型

5.1Bitmaps

5.1.1概述

Redis提供了Bitmaps这个“数据类型”可以实现对位的操作:

(1) Bitmaps本身不是一种数据类型, 实际上它就是字符串(key-value) , 但是它可以对字符串的位进行操作。

(2) Bitmaps单独提供了一套命令, 所以在Redis中使用Bitmaps和使用字符串的方法不太相同。 可以把Bitmaps想象成一个以位为单位的数组, 数组的每个单元只能存储0和1, 数组的下标在Bitmaps中叫做偏移量。

常用命令:

setbit<key><offset><value>设置Bitmaps中某个偏移量的值(0或1)

getbit<key><offset>获取Bitmaps中某个偏移量的值

bitcount<key>[start end] 统计字符串从start字节到end字节比特值为1的数量

bitop and(or/not/xor) <destkey> [key…]

5.1.2Bitmaps与set的对比

​假设网站有 1 亿用户, 每天独立访问的用户有 5 千万, 如果每天用集合类型和 Bitmaps 分别存储活跃用户可以得到表:

​很明显, 这种情况下使用Bitmaps能节省很多的内存空间, 尤其是随着时间推移节省的内存还是非常可观的

​但Bitmaps并不是万金油, 假如该网站每天的独立访问用户很少, 例如只有10万(大量的僵尸用户) 那么两者的对比如下表所示, 很显然, 这时候使用Bitmaps就不太合适了, 因为基本上大部分位都是0。

5.2HyperLogLog

​ 在工作当中,我们经常会遇到与统计相关的功能需求,比如统计网站PV(PageView页面访问量),可以使用Redis的incr、incrby轻松实现。

应用场景:

但像UV(UniqueVisitor,独立访客)、独立IP数搜索记录数等需要去重和计数的问题如何解决?这种求集合中不重复元素个数的问题称为基数问题。

解决基数问题有很多种方案:
(1)数据存储在MySQL表中,使用distinct count计算不重复个数

(2)使用Redis提供的hash、set、bitmaps等数据结构来处理

以上的方案结果精确,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的。

能否能够降低一定的精度来平衡存储空间?Redis推出了HyperLogLog

Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。

在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。

但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。

什么是基数?
比如数据集 {1, 3, 5, 7, 5, 7, 8}, 那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。 基数估计就是在误差可接受的范围内,快速计算基数。

常用命令:

pfadd <key>< element> [element ...] 添加指定元素到 HyperLogLog 中

pfcount<key> [key ...] 计算出某个键(和另一个键)的基数

pfmerge<destkey><sourcekey> [sourcekey ...] 将一个或多个HLL合并后的结果存储在另一个HLL中,比如每月活跃用户可以使用每天的活跃用户来合并计算可得

5.3Geospatial

Redis 3.2 中增加了对GEO类型的支持。GEO,Geographic,地理信息的缩写。该类型,就是元素的2维坐标,在地图上就是经纬度。redis基于该类型,提供了经纬度设置,查询,范围查询,距离查询,经纬度Hash等常见操作。

常用命令:

geoadd<key>< longitude><latitude><member> [longitude latitude member...] 添加地理位置(经度,纬度,名称)

geopos <key><member> [member...] 获得指定地区的坐标值

geodist<key><member1><member2> [m|km|ft|mi ] 获取两个位置之间的直线距离

georadius<key>< longitude><latitude>radius m|km|ft|mi 以给定的经纬度为中心,找出某一半径内的元素

6、Redis事务、锁机制和秒杀

6.1Redis的事务定义

Redis事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。

Redis事务的主要作用就是串联多个命令防止别的命令插队。

6.2Multi、Exec、discard

从输入Multi命令开始,输入的命令都会依次进入命令队列中,但不会执行,直到输入Exec后,Redis会将之前的命令队列中的命令依次执行。

组队的过程中可以通过discard来放弃组队。

案例说明:
1* 组队成功,提交成功:

2* 组队阶段报错,提交失败

3* 组队成功,提交有成功有失败情况

6.3事务的错误处理

组队中某个命令出现了报告错误,执行时整个的所有队列都会被取消。如:案例2*

如果执行阶段某个命令报出了错误,则只有报错的命令不会被执行,而其他的命令都会执行,不会回滚。如:案例3*

6.4为什么要做成事务

想想一个场景:有很多人有你的账户,同时去参加双十一抢购;

悲观锁:认为每次操作数据都不安全,都需要加锁。

6.5事务的冲突问题

例子:

一个请求想给金额减8000

一个请求想给金额减5000

一个请求想给金额减1000

6.5.1悲观锁

悲观锁(Pessimistic Lock), 顾名思义,就是很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制,比如行锁表锁等,读锁写锁等,都是在做操作之前先上锁。

6.5.2乐观锁

乐观锁(Optimistic Lock), 顾名思义,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制。乐观锁适用于多读的应用类型,这样可以提高吞吐量。Redis就是利用这种check-and-set机制实现事务的。

WATCH key [key …]:
在执行multi之前,先执行watch key1 [key2],可以监视一个(或多个) key ,如果在事务执行之前这个(或这些) key 被其他命令所改动,那么事务将被打断。

unwatch:
取消 WATCH 命令对所有 key 的监视。
如果在执行 WATCH 命令之后,EXEC 命令或DISCARD 命令先被执行了的话,那么就不需要再执行UNWATCH 了。
http://doc.redisfans.com/transaction/exec.html

6.6Redis事务的三特性

1、单独的隔离操作
事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。

2、没有隔离级别的概念
队列中的命令没有提交之前都不会实际被执行,因为事务提交前任何指令都不会被实际执行。

3、不保证原子性
事务中如果有一条命令执行失败,其后的命令仍然会被执行,没有回滚 。

7、Redis_事务锁机制秒杀案例

7.1解决计数器和人员记录的事务操作

7.2Redis事务_秒杀并发模拟

使用工具ab模拟测试

  • CentOS6 默认安装
  • CentOS7需要手动安装

联网安装: yum install httpd-tools

连接Redis注意事项:

禁用Linux的防火墙:Linux(CentOS7)里执行命令

systemctl stop/disable firewalld.service

redis.conf中注释掉bind 127.0.0.1 ,然后 protected-mode no

ab测试:

vim postfile 模拟表单提交参数,以&符号结尾;存放当前目录。

内容:prodid=0101&

执行:

ab -n 2000 -c 100 -p ~/postfile -T application/x-www-form-urlencoded  http://192.168.2.101:8001/Seckill/doseckill

访问的地址:http://192.168.2.101:8001/Seckill/doseckill

超卖

7.3超卖问题

利用乐观锁淘汰用户,解决超卖问题

核心代码:

/*** redis秒杀主要代码*/
public class SecKill_redis {public static void main(String[] args) {Jedis jedis =new Jedis("192.168.2.103",6379);System.out.println(jedis.ping());jedis.close();}//秒杀过程public static boolean doSecKill(String uid,String prodid) throws IOException {//1 uid和prodid非空判断if(uid == null || prodid == null) {return false;}//2 连接redis//Jedis jedis = new Jedis("192.168.2.103",6379);//通过连接池得到jedis对象JedisPool jedisPoolInstance = JedisPoolUtil.getJedisPoolInstance();Jedis jedis = jedisPoolInstance.getResource();//3 拼接key// 3.1 库存keyString kcKey = "sk:"+prodid+":qt";// 3.2 秒杀成功用户keyString userKey = "sk:"+prodid+":user";//监视库存jedis.watch(kcKey);//4 获取库存,如果库存null,秒杀还没有开始String kc = jedis.get(kcKey);if(kc == null) {System.out.println("秒杀还没有开始,请等待");jedis.close();return false;}// 5 判断用户是否重复秒杀操作if(jedis.sismember(userKey, uid)) {System.out.println("已经秒杀成功了,不能重复秒杀");jedis.close();return false;}//6 判断如果商品数量,库存数量小于1,秒杀结束if(Integer.parseInt(kc)<=0) {System.out.println("秒杀已经结束了");jedis.close();return false;}//7 秒杀过程//使用事务Transaction multi = jedis.multi();//组队操作multi.decr(kcKey);multi.sadd(userKey,uid);//执行List<Object> results = multi.exec();if(results == null || results.size()==0) {System.out.println("秒杀失败了....");jedis.close();return false;}//7.1 库存-1//jedis.decr(kcKey);//7.2 把秒杀成功用户添加清单里面//jedis.sadd(userKey,uid);System.out.println("秒杀成功了..");jedis.close();return true;}
}

成功解决:

7.4继续增加并发进行测试

7.4.1连接有限制

ab -n 2000 -c 100 -p ~/postfile -T application/x-www-form-urlencoded  http://192.168.2.101:8001/Seckill/doseckill

增加-r参数,-r Don’t exit on socket receive errors.

ab -n 2000 -c 100 -r -p ~/postfile -T application/x-www-form-urlencoded  http://192.168.2.101:8001/Seckill/doseckill

7.4.2连接超时,可以通过连接池解决

连接池:

节省每次连接redis服务带来的消耗,把连接好的实例反复利用。
通过参数管理连接的行为

  • 链接池参数

    • MaxTotal:控制一个pool可分配多少个jedis实例,通过pool.getResource()来获取;如果赋值为-1,则表示不限制;如果pool已经分配了MaxTotal个jedis实例,则此时pool的状态为exhausted。
    • maxIdle:控制一个pool最多有多少个状态为idle(空闲)的jedis实例;
    • MaxWaitMillis:表示当borrow一个jedis实例时,最大的等待毫秒数,如果超过等待时间,则直接抛JedisConnectionException;
    • testOnBorrow:获得一个jedis实例的时候是否检查连接可用性(ping());如果为true,则得到的jedis实例均是可用的;

7.4.3已经秒光,可是还有库存

ab -n 2000 -c 100 -p ~/postfile -T application/x-www-form-urlencoded  http://192.168.2.101:8001/Seckill/doseckill

已经秒光,可是还有库存。原因:就是乐观锁导致很多请求都失败。先点的没秒到,后点的可能秒到了。

解决方案:发现版本号不同的时候重新获取库存然后执行购买就行了

7.5使用LUA脚本解决库存遗留问题

优势:

  • 将复杂的或者多步的redis操作,写为一个脚本,一次提交给redis执行,减少反复连接redis的次数。提升性能。
  • LUA脚本是类似redis事务,有一定的原子性,不会被其他命令插队,可以完成一些redis事务性的操作。
  • 但是注意redis的lua脚本功能,只有在Redis 2.6以上的版本才可以使用。
    利用lua脚本淘汰用户,解决超卖问题。
  • redis 2.6版本以后,通过lua脚本解决争抢问题,实际上是redis 利用其单线程的特性,用任务队列的方式解决多任务并发问题

8、Redis持久化_RDB

8.1RDB官网介绍

官网介绍:http://www.redis.io

Redis 提供了2个不同形式的持久化方式。

  • RDB(Redis DataBase)
  • AOF(Append Of File)

8.2RDB(Redis Database)

8.2.1简介

​ 在指定的时间间隔内将内存中的数据集快照写入磁盘, 也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。

8.2.2备份是如何执行的

​ Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到 一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。 整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能 如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失

8.2.3Fork

  • Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等) 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程
  • 在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,Linux中引入了“写时复制技术”。
  • 一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。

8.2.4RDB持久化流程

8.2.5dump.rdb文件

在redis.conf中配置文件名称,默认为dump.rdb。

rdb文件的保存路径,也可以修改。默认为Redis启动时命令行所在的目录下 “dir ./”。

8.2.6如何触发RDB快照;保持策略

配置文件中默认的快照配置

命令save VS bgsave

  • save :save时只管保存,其它不管,全部阻塞。手动保存。不建议。
  • bgsave:Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。
  • 可以通过lastsave 命令获取最后一次成功执行快照的时间。

flushall命令

执行flushall命令,也会产生dump.rdb文件,但里面是空的,无意义。

另外的请看 :redis.conf配置文件中 ###SNAPSHOTTING快照###

RDB的备份

先通过config get dir 查询rdb文件的目录

将 *.rdb的文件拷贝到别的地方

rdb的恢复

  • 关闭Redis
  • 先把备份的文件拷贝到工作目录下 cp dump2.rdb dump.rdb
  • 启动Redis, 备份数据会直接加载

8.2.7优势

  • 适合大规模的数据恢复
  • 对数据完整性和一致性要求不高更适合使用
  • 节省磁盘空间
  • 恢复速度快

8.2.8劣势

  • Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑
  • 虽然Redis在fork时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
  • 在备份周期在一定间隔时间做一次备份,所以如果Redis意外down掉(宕机)的话,就会丢失最后一次快照后的所有修改。

8.2.9如何停止

动态停止RDB:redis-cli config set save "" #save后给空值,表示禁用保存策略

8.2.10小总结

9、Redis持久化_AOF

9.1 AOF(Append Only File)

9.1.1简介

日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录), 只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

9.1.2AOF持久化流程

(1)客户端的请求写命令会被append追加到AOF缓冲区内;

(2)AOF缓冲区根据AOF持久化策略[always,everysec,no]将操作sync同步到磁盘的AOF文件中;

(3)AOF文件大小超过重写策略或手动重写时,会对AOF文件rewrite重写,压缩AOF文件容量;

(4)Redis服务重启时,会重新load加载AOF文件中的写操作达到数据恢复的目的;

9.1.3AOF默认不开启

可以在redis.conf中配置文件名称,默认为 appendonly.aof

AOF文件的保存路径,同RDB的路径一致。

9.1.4 AOF和RDB同时开启,redis听谁的?

AOF和RDB同时开启,系统默认取AOF的数据(数据不会存在丢失)

9.1.5AOF启动/修复/恢复

  • AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis工作目录下,启动系统即加载。
  • 正常恢复
    • 修改默认的appendonly no,改为yes
    • 将有数据的aof文件复制一份保存到对应目录(查看目录:config get dir)
    • 恢复:重启redis然后重新加载
  • 异常恢复
    • 修改默认的appendonly no,改为yes
    • 如遇到AOF文件损坏,通过/usr/local/bin/redis-check-aof–fix appendonly.aof进行恢复
    • 备份被写坏的AOF文件
    • 恢复:重启redis,然后重新加载

9.1.6AOF同步频率设置

appendfsync always
始终同步,每次Redis的写入都会立刻记入日志;性能较差但数据完整性比较好

appendfsync everysec
每秒同步,每秒记入日志一次,如果宕机,本秒的数据可能丢失。

appendfsync no
redis不主动进行同步,把同步时机交给操作系统。

9.1.7Rewrite压缩

1、是什么:

​AOF采用文件追加方式,文件会越来越大为避免出现此种情况,新增了重写机制, 当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩, 只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof

2、重写原理,如何实现重写

​AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件最后再rename),redis4.0版本后的重写,实际上就是把rdb 的快照,以二进制的形式附在新的aof头部,作为已有的历史数据,替换掉原来的流水账操作。

no-appendfsync-on-rewrite:

  • 如果 no-appendfsync-on-rewrite=yes ,不写入aof文件只写入缓存,用户请求不会阻塞,但是在这段时间如果宕机会丢失这段时间的缓存数据。(降低数据安全性,提高性能)
  • 如果 no-appendfsync-on-rewrite=no, 还是会把数据往磁盘里刷,但是遇到重写操作,可能会发生阻塞。(数据安全,但是性能降低)

触发机制,何时重写

Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发

重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写。

  • auto-aof-rewrite-percentage:设置重写的基准值,文件达到100%时开始重写(文件是原来重写后文件的2倍时触发)
  • auto-aof-rewrite-min-size:设置重写的基准值,最小文件64MB。达到这个值开始重写。
  • 例如:文件达到70MB开始重写,降到50MB,下次什么时候开始重写?100MB
  • 系统载入时或者上次重写完毕时,Redis会记录此时AOF大小,设为base_size,
  • 如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)的情况下,Redis会对AOF进行重写。

3、重写流程

(1)bgrewriteaof触发重写,判断是否当前有bgsave或bgrewriteaof在运行,如果有,则等待该命令结束后再继续执行。

(2)主进程fork出子进程执行重写操作,保证主进程不会阻塞。

(3)子进程遍历redis内存中数据到临时文件,客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。

(4)子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息。 主进程把aof_rewrite_buf中的数据写入到新的AOF文件。

(5)使用新的AOF文件覆盖旧的AOF文件,完成AOF重写。

9.1.8优势

  • 备份机制更稳健,丢失数据概率更低。
  • 可读的日志文本,通过操作AOF稳健,可以处理误操作。

9.1.9劣势

  • 比起RDB占用更多的磁盘空间。
  • 恢复备份速度要慢。
  • 每次读写都同步的话,有一定的性能压力。
  • 存在个别Bug,造成恢复不能。

9.1.10小总结

9.2总结(which one)

9.2.1用哪个好

官方推荐两个都启用。

如果对数据不敏感,可以选单独用RDB。

不建议单独用 AOF,因为可能会出现Bug。

如果只是做纯内存缓存,可以都不用。

9.2.2官网建议

  • RDB 持久化方式能够在指定的时间间隔能对你的数据进行快照存储。
  • AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF 命令以 redis 协议追加保存每次写的操作到文件末尾。
  • Redis 还能对 AOF 文件进行后台重写,使得 AOF 文件的体积不至于过大。
  • 只做缓存:如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式。
  • 同时开启两种持久化方式:在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。
  • RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件。那要不要只使用 AOF 呢?
  • 建议不要,因为 RDB 更适合用于备份数据库 (AOF 在不断变化不好备份),快速重启,而且不会有 AOF 可能潜在的 bug,留着作为一个万一的手段。
  • 性能建议:
    • 因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要 15 分钟备份一次就够了,只保留 save 9001 这条规则。
    • 如果使用 AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单,只 load 自己的 AOF 文件就可以了。
    • aof 代价:一是带来了持续的 IO,二是 AOF rewrite 的最后,将 rewrite 过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。
    • 只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值 64M 太小了,可以设到 5G 以上。默认超过原大小 100% 大小时重写可以改到适当的数值。

10、Redis主从复制

主从复制是指:主机数据更新后根据配置和策略, 自动同步到备机的master/slaver机制Master以写为主,Slave以读为主

能干嘛

  • 读写分离,性能扩展
  • 容灾快速恢复

10.1搭建一主多从


常用三招: 一主二仆、薪火相传、反客为主

10.2主从复制原理

1、当从服务器(slave)连接上主服务器(master)之后,从服务器向主服务器发送进行数据同步消息(sync命令)。

2、主服务器接到从服务器发送过来的同步消息后,把主服务器数据进行持久化,到rdb文件中,然后把rdb文件发送到从服务器,从服务器拿到rdb文件后进行读取。

3、之后,每当主服务器进行写操作,都和从服务器进行数据同步。

全量复制:而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。

增量复制:Master继续将新的所有收集到的修改命令依次传给slave,完成同步,

但是只要是重新连接master,一次完全同步(全量复制)将被自动执行。

10.3哨兵模式

反客为主的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库

当主机挂掉后,从机选举中产生新的主机

  • 哪个从机会被选举为主机呢?根据优先级别:replica-priority
  • 原主机重启后会变为从机。

复制延时

由于所有的写操作都是先在Master上操作,然后同步更新到Slave上,所以从Master同步到Slave机器有一定的延迟,当系统很繁忙的时候,延迟问题会更加严重,Slave机器数量的增加也会使这个问题更加严重。

故障恢复

优先级在redis.conf中默认:replica-priority 100,值越小优先级越高

偏移量是指获得原主机数据最全的

每个redis实例启动后都会随机生成一个40位的runid

11、Redis集群(cluster模式)

Redis 集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N。

Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。

11.1问题

容量不够,redis如何进行扩容?

并发写操作, redis如何分摊?

另外,主从模式,薪火相传模式,主机宕机,导致ip地址发生变化,应用程序中配置需要修改对应的主机地址、端口等信息。

之前通过代理主机来解决,但是redis3.0中提供了解决方案。就是无中心化集群配置。

11.2集群连接

1、普通方式登录
可能直接进入读主机,存储数据时,会出现MOVED重定向操作。所以,应该以集群方式登录。

2、 集群登录
redis-cli -c -p 6379 采用集群策略连接,设置数据会自动切换到相应的写主机。

通过 cluster nodes 命令查看集群信息

11.3redis cluster 如何分配这六个节点?

一个集群至少要有三个主节点。
选项 --cluster-replicas 1 表示我们希望为集群中的每个主节点创建一个从节点。
分配原则尽量保证每个主数据库运行在不同的IP地址,每个从库和主库不在一个IP地址上。

11.4什么是slots

一个 Redis 集群包含 16384 个插槽(hash slot), 数据库中的每个键都属于这 16384 个插槽的其中一个,

集群使用公式 CRC16(key) % 16384 来计算键 key 属于哪个槽, 其中 CRC16(key) 语句用于计算键 key 的 CRC16 校验和 。
集群中的每个节点负责处理一部分插槽。 举个例子, 如果一个集群可以有主节点, 其中:

节点 A 负责处理 0 号至 5460 号插槽。
节点 B 负责处理 5461 号至 10922 号插槽。
节点 C 负责处理 10923 号至 16383 号插槽。

11.5在集群中录入值

在redis-cli每次录入、查询键值,redis都会计算出该key应该送往的插槽,如果不是该客户端对应服务器的插槽,redis会报错,并告知应前往的redis实例地址和端口。

redis-cli客户端提供了 –c 参数实现自动重定向

redis-cli -c –p 6379 登入后,再录入、查询键值对可以自动重定向。

不在一个slot下的键值,是不能使用mget,mset等多键操作。

但可以通过{}来定义组的概念,从而使key中{}内相同内容的键值对放到一个slot中去。

11.6查询集群中的值

11.7故障恢复

如果主节点下线?从节点能否自动升为主节点?注意:15秒超时

主节点恢复后,主从关系会如何?主节点回来变成从机。

如果所有某一段插槽的主从节点都宕掉,redis服务是否还能继续?

如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为yes ,那么 ,整个集群都挂掉

如果某一段插槽的主从都挂掉,而cluster-require-full-coverage 为no ,那么,该插槽数据全都不能使用,也无法存储。

注意:redis.conf中的参数 cluster-require-full-coverage

11.8Redis集群的优点

  • 实现扩容
  • 分摊压力
  • 无中心配置相对简单

11.9Redis集群的不足

  • 多键操作是不被支持的
  • 多键的Redis事务是不被支持的。lua脚本不被支持
  • 由于集群方案出现较晚,很多公司已经采用了其他的集群方案,而代理或者客户端分片的方案想要迁移至redis cluster,需要整体迁移而不是逐步过渡,复杂度较大。

12、Redis_应用问题(面试重点)

12.1缓存穿透

12.1.1问题描述

  • key对应的数据在数据源并不存在,每次针对此key的请求从缓存获取不到,请求都会压到数据源,从而可能压垮数据源。
  • 比如用一个不存在的用户id获取用户信息,不论缓存还是数据库都没有,若黑客利用此漏洞进行攻击可能压垮数据库。

缓存穿透发生的现象:

  • 应用服务器压力变大
  • redis命中率降低
  • 一直查询数据库,使得数据库压力太大而压垮

其实 redis 在这个过程中一直平稳运行,崩溃的是我们的数据库(如 MySQL)。

缓存穿透发生的原因:黑客或者其他非正常用户频繁进行很多非正常的 url 访问,使得 redis 查询不到数据。

12.1.2解决方案

​ 一个一定不存在缓存及查询不到的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。

解决方案:

  • 对空值缓存:如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,设置空结果的过期时间会很短,最长不超过五分钟
  • 设置可访问的名单(白名单):使用bitmaps类型定义一个可以访问的名单,名单id作为bitmaps的偏移量,每次访问和bitmap里面的id进行比较,如果访问id不在bitmaps里面,进行拦截,不允许访问。
  • 采用布隆过滤器:(布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数(哈希函数)。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。
    • 将所有可能存在的数据哈希到一个足够大的bitmaps中,一个一定不存在的数据会被 这个bitmaps拦截掉,从而避免了对底层存储系统的查询压力。
  • 进行实时监控:当发现Redis的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务

12.2缓存击穿

12.2.1问题描述

key对应的数据存在,但在redis中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端数据库压垮。

缓存击穿发生的现象:

  • 数据库访问压力瞬时增加,数据库崩溃
  • redis里面没有出现大量的key过期 ,若出现大量key过期 则是 缓存雪崩
  • redis正常运行

缓存击穿发生的原因:

  • redis某个key过期了,但又有 大量的请求访问这个key(热门key),在redis中找不到数据就会一直访问数据库(如MySQL)

12.2.2解决方案

key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:缓存被“击穿”的问题。

解决方案:

  • 预先设置热门数据:在redis高峰访问之前,把一些热门数据提前存入到redis里面,加大这些热门数据key的时长
  • 实时调整:现场监控哪些数据热门,实时调整key的过期时长
  • 使用锁
    • 就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db。
    • 先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX)去set一个mutex key
    • 当操作返回成功时,再进行load db的操作,并回设缓存,最后删除mutex key;
    • 当操作返回失败,证明有线程在load db,当前线程睡眠一段时间再重试整个get缓存的方法。

12.3缓存雪崩

12.3.1问题描述

​key对应的数据存在,但在redis中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。缓存雪崩与缓存击穿的区别在于这里针对很多key缓存,后者则是某一个key。

正常访问:

缓存失效瞬间:

是指要查询的大量key 在 redis中集中过期

12.3.2解决方案

缓存失效时的雪崩效应对底层系统的冲击非常可怕!

解决方案:

  • 构建多级缓存架构:nginx缓存 + redis缓存 +其他缓存(ehcache等)
  • 使用锁或队列:用加锁或者队列的方式保证来保证不会有大量的线程对数据库一次性进行读写,从而避免失效时大量的并发请求落到底层存储系统上。不适用高并发情况
  • 设置过期标志更新缓存:记录缓存数据是否过期(设置提前量),如果过期会触发通知另外的线程在后台去更新实际key的缓存。
  • 将缓存失效时间分散开:比如我们可以在原有的失效时间基础上增加一个随机值,比如1-5分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。

12.4分布式锁

12.4.1问题描述

随着业务发展的需要,原单体单机部署的系统被演化成分布式集群系统后,由于分布式系统多线程、多进程并且分布在不同机器上,这将使原单机部署情况下的并发控制锁策略失效,单纯的Java API并不能提供分布式锁的能力。为了解决这个问题就需要一种跨JVM的互斥机制来控制共享资源的访问,这就是分布式锁要解决的问题!

分布式锁主流的实现方案:

  • 基于数据库实现分布式锁
  • 基于缓存(Redis等)
  • 基于Zookeeper

根据实现方式,分布式锁还可以分为类 CAS 自旋式分布式锁以及 event 事件类型分布式锁:

  • 类 CAS 自旋式分布式锁:询问的方式,类似 java 并发编程中的线程获询问的方式尝试加锁,如 mysql、redis。
  • 另外一类是 event 事件通知进程后续锁的变化,轮询向外的过程,如 zookeeper、etcd。
    每一种分布式锁解决方案都有各自的优缺点:
  • 性能:redis最高
  • 可靠性:zookeeper最高

12.4.2解决方案

使用redis实现分布式锁

  • setnx:通过该命令尝试获得锁,没有获得锁的线程会不断等待尝试。
  • set key nx ex 3000: 设置过期时间,自动释放锁,解决当某一个业务异常而导致锁无法释放的问题。但是当业务运行超过过期时间时,开辟监控线程增加该业务的运行时间,直到运行结束,释放锁。
  • uuid:设置 uuid,释放前获取这个值,判断是否自己的锁,防止误删锁,造成没锁的情况。

设置锁

setnx key value #设置锁
del key         #删除锁 即把 key 删除了

给锁设置过期时间

setnx key value #设置锁
expire key time #设置过期时间
ttl key         #查看过期时间

优化之同时设置锁和过期时间

  • 上面的设置存在一个这样的问题:如果设置时间和上锁分开进行的话,可能存在上完锁之后,服务器宕机了,就无法设置过期时间了。
  • 我们可以设置上锁的时候同时设置过期时间,这样就可以保证操作的原子性了。
set key value nx ex 10  # nx 表示上锁  ex 表示设置过期时间

优化之 UUID 防止误删

上述除了修改的设置过期时间问题,还存在问题,如下图所示:

小总结:

  • abc是三个客户端,共同锁的是分布式锁。
  • 分布式锁就是分布式缓存,abc其实就是共用同一个缓存,就是同一把锁。
  • 分布式锁是给部署在多台服务器上的java程序同步使用的,不是给redis集群用的。

因为a已经比较过uuid了,所以a会直接释放b的锁

优化之 LUA 脚本保证删除的原子性

总结

为了确保分布式锁可用,我们至少要确保锁的实现同时满足以下四个条件

  • 互斥性。在任意时刻,只有一个客户端能持有锁。
  • 不会发生死锁。即使有一个客户端在持有锁的期间崩溃而没有主动解锁,也能保证后续其他客户端能加锁。
  • 解铃还须系铃人。加锁和解锁必须是同一个客户端,客户端自己不能把别人加的锁给解了。
  • 加锁和解锁必须具有原子性。

13、Redis6新功能

13.1ACL

Redis ACL是Access Control List(访问控制列表)的缩写,该功能允许根据可以执行的命令和可以访问的键来限制某些连接。

在Redis 5版本之前,Redis 安全规则只有密码控制 还有通过rename 来调整高危命令比如 flushdb , KEYS* , shutdown 等。Redis 6 则提供ACL的功能对用户进行更细粒度的权限控制 :

(1)接入权限:用户名和密码

(2)可以执行的命令

(3)可以操作的 KEY

参考官网:https://redis.io/topics/acl

13.2IO多线程

Redis6终于支撑多线程了,告别单线程了吗?

IO多线程其实指客户端交互部分网络IO交互处理模块多线程,而非执行命令多线程。Redis6执行命令依然是单线程。

13.3工具支持Cluster

之前老版Redis想要搭集群需要单独安装ruby环境,Redis 5 将 redis-trib.rb 的功能集成到 redis-cli 。另外官方 redis-benchmark 工具开始支持 cluster 模式了,通过多线程的方式对多个分片进行压测。

……

Redis(学习笔记)相关推荐

  1. Redis学习笔记 - 数据类型与API(1)Key

    Redis学习笔记 - 数据类型与API(1)Key Key相关命令 1. 常用命令 命令 含义 时间复杂度 keys 查找所有符合给定模式 pattern 的 key O(N), N 为数据库中 k ...

  2. Redis学习笔记~Redis在windows环境下的安装

    Redis是一个key-value的存储系统,它最大的特点就是可以将数据序列化到文件中. redis存储在服务器的内存或者文件中,它不是session,不是cookies,它只是个更安全,更稳定,更可 ...

  3. redis学习笔记-持久化

    redis学习笔记-持久化 前言 redis持久化有两种方式:RDB和AOF.分别对应着全量复制和增量复制.深刻理解各自的实现方式及适用场景对redis的使用和运维十分重要.下面就分别介绍. RDB持 ...

  4. StackExchange.Redis学习笔记(五) 发布和订阅

    StackExchange.Redis学习笔记(五) 发布和订阅 原文:StackExchange.Redis学习笔记(五) 发布和订阅 Redis命令中的Pub/Sub Redis在 2.0之后的版 ...

  5. Redis学习笔记~分布式的Pub/Sub模式

    redis的客户端有很多,这次用它的pub/sub发布与订阅我选择了StackExchange.Redis,发布与订阅大家应该很清楚了,首先一个订阅者,订阅一个服务,服务执行一些处理程序(可能是写个日 ...

  6. Redis学习笔记——SpringDataRedis的使用

    与Spring集成 我需要哪些jar包? <dependency><groupId>org.springframework.data</groupId><ar ...

  7. Redis学习笔记(五)——持久化及redis.conf配置文件叙述

    对于日常使用来说,学习完SpringBoot集成Redis就够我们工作中使用了,但是既然学习了,我们就学习一些Redis的配置及概念,使我们可以更深层次的理解Redis,以及增强我们的面试成功概率,接 ...

  8. Redis学习笔记1-理论篇

    目录 1,Redis 数据类型的底层结构 1.1,Redis 中的数据类型 1.2,全局哈希表 1.3,数据类型的底层结构 1.4,哈希冲突 1.5,rehash 操作 2,Redis 的 IO 模型 ...

  9. Redis学习笔记(实战篇)(自用)

    Redis学习笔记(实战篇)(自用) 本文根据黑马程序员的课程资料与百度搜索的资料共同整理所得,仅用于学习使用,如有侵权,请联系删除 文章目录 Redis学习笔记(实战篇)(自用) 1.基于Sessi ...

  10. Redis学习笔记(B站狂神说)(自己总结方便复习)

    Redis学习笔记B站狂神说 redis: 非关系型数据库 一.NoSQL概述 1.为什么要用Nosql 1.单机Mysql的年代 思考一下,这种情况下:整个网站的瓶颈是什么? 1.数据量如果太大,一 ...

最新文章

  1. Android Training - 使用IntentService运行任务(Lesson 2 - 发送任务给IntentService)
  2. python qthread 线程退出_线程:概念和实现
  3. 50 调度器事件监听
  4. Java PriorityQueue poll()方法与示例
  5. 数据预处理-数据变换-规范化
  6. 人工智能技术发展必须遵循的基本伦理原则
  7. mw150um 驱动程序win10_win10系统版水星mw150us无线网卡驱动
  8. [RK3288][Android6.0] 网络服务Netd初始化流程小结
  9. linux下通过V4L2驱动USB摄像头
  10. 项目实训(十三)安装pun,pun的基础使用和概念
  11. 云计算的概念与价值02技术与价值
  12. 5.计算圆周长和面积的c代码
  13. 数据页和数据行(第八周翻译)
  14. FileZilla搭建FTP服务器图解教程,并允许外网访问NAT内网
  15. 如何破坏双亲委派模型
  16. Unity 的协程的原理
  17. vue框架 行内样式 添加背景图片
  18. 设计文档的内容(概要设计,需求分析,详细设计)
  19. 微信游戏《全民炫舞》开发公司h3d2 engine和QQ炫舞2 布料系统技术介绍
  20. 实战web漏洞挖掘小技巧

热门文章

  1. TCGA数据库学习一:基本知识
  2. idea项目中有jar包,java文件却引不进来
  3. vc 运行不了pdb文件什么鬼_PDB是什么文件_PDB文件怎么打开_PDB文件能删吗
  4. 给祖国母亲庆生——软件工程总结
  5. Luogu P3054 [USACO12OPEN]跑圈Running Laps
  6. Python VLC+PyQt5 读取视频音频流
  7. 5.深入浅出:多级放大电路种类及动态分析——参考《模拟电子技术基础》清华大学华成英主讲
  8. 通知单的长文本和合作伙伴功能获得
  9. 大学生《Web课程谁》期末网页制作 HTML+CSS+JavaScript 网页设计实例 瑜伽网站企业网站制作
  10. QT中C++程序和QML的集成