作为一名技术从业人员,性能优化是每个人的必修课

就像大学时期给漂亮妹子修电脑的绝招就是“重启电脑一样”,性能优化也有自己的必杀技

你一定听过一句话:性能不够,缓存来凑!对,你没听错,就是缓存。

但是,哈哈,也不是拿来主义,张手就来。

这不,小王接到一个秒杀活动任务,设计技术方案,大量的数据扔到缓存里,想借助Redis的高吞吐量来抗住峰值压力。

这个思路也没错,这不一评估缓存内容占用的空间大小,需要30来个G。

你觉得有没有问题?

觉得没问题的同学,可以去打游戏了

我们知道Redis集群有主从模式或者哨兵模式

无论采用采用那种模式,从节点同步数据时,开始需要fork子进程,生成RDB文件,如果数据容量过大,那么占用的时间会很长。如果主节点再开启持久化机制,那性能就更没法保证。

为了解决这个问题,Redis 又提出了一个新的解决方案,将大数据碎片化

假如原来一个节点存了30G的数据,现在我们拆分6个实例,每个实例的数据就只有5个G,压力一下小了很多

特别说明:由于key的路由规则基于特殊的负载算法,实际上并不是均等分配。

接下来,我们重点讨论的是,这个拆分方案要如何设计?

民间方案

Redis 3.0 版本之前,官方还没有提供集群方案,但是单台实例受内存限制,无法实现垂直扩展,怎么办?

一些人提出了基于客户端的分区方案。

比如:基于客户端分区的 ShardedJedis,基于代理的 Codis、Twemproxy 等,后面挂载着若干个Redis实例,不同实例间完全隔离,互不通信。通过客户端代理组成了一个逻辑上的集群。从而解决庞大的数据容量问题。

官方方案

Redis 官方在 3.0 版本 提出一个集群方案,称为 Redis Cluster。

Redis Cluster 核心设计引入一个哈希槽(Hash Slot),将整个集群切成了 16384 个哈希槽,你可以理解成一个个小的数据分区。

当我们操作Redis 时,根据传入的 key ,按照 CRC16算法计算出一个16位的二进制值,然后再对16384取模,便得到一个哈希槽编号。

注意:如果手动分配哈希槽,一定要把16384全部分配完,否则 Redis 集群无法工作。

Redis Cluster 如何构建

分为手动搭建和自动搭建

我们先来看下纯手动如何搭建一个Redis Cluster集群。

首先,准备机器,为了方便测试,我们只用一台,通过不同端口模拟出 6个Redis 实例

1、构建三个目录:conf、data、log,分别存放 配置、数据 和 日志 相关文件。

修改conf配置文件如下

# redis后台运行
daemonize yes
# 数据存放目录
dir /usr/local/redis-cluster/data/redis-6379
# 日志文件
logfile /usr/local/redis-cluster/log/redis-6379.log
# 端口号
port 6379
# 开启集群模式
cluster-enabled yes
# 集群的配置,配置文件首次启动自动生成
# 这里只需指定文件名即可,集群启动成功后会自动在data目录下创建
cluster-config-file "nodes-6379.conf"
# 请求超时,设置10秒
cluster-node-timeout 10000

2、启动节点

sudo redis-server conf/redis-6379.conf

3、集群中各个节点握手通信,组成集群,握手命令 cluster meet {ip} {port}。握手成功后该状态通过Gossip协议在集群中传播,其它节点就会自动发现新节点并发起握手,最后所有节点都彼此感知并组成集群)

127.0.0.1:6379> cluster meet 127.0.0.1 6378
127.0.0.1:6379> cluster meet 127.0.0.1 6377
127.0.0.1:6379> cluster meet 127.0.0.1 6376
127.0.0.1:6379> cluster meet 127.0.0.1 6375
127.0.0.1:6379> cluster meet 127.0.0.1 6374

4、分配哈希槽,总共有16384个槽位,每个节点实例分配了一定数量的哈希槽

redis-cli -p 6379 cluster addslots {0..5461}
redis-cli -p 6378 cluster addslots {5462..10922}
redis-cli -p 6377 cluster addslots {10922..16383}

5、三个主节点分配完槽位后,每个主节点挂载相应的从节点,用于紧急情况下故障转移。从节点负责复制主节点槽信息和业务数据

# 进入从节点客户端
redis-cli -p 6376
127.0.0.1:6376> cluster replicate 7d480c106752e0ba4be3efaf6628bd7c8c124013(6379主节点的实例ID)述:

详细步骤:https://juejin.cn/post/6844904057044205582

6、执行命令 cluster slots,查看集群各个节点的槽位分布

客户端如何知晓一个key归属于哪个Redis切片实例

Redis Cluster集群采用分片,虽然每个实例只有部分的槽位数据,但是整个槽位分布会彼此间同步,有点类似病毒扩散。

最后,每个实例都有了全部的slot哈希槽与实例的映射关系。

应用启动后,客户端与Redis建立关联,会从一台Redis实例拉取全部的槽位映射关系,并缓存在本地。

当接到key操作命令时,先计算key的哈希槽,然后将命令发送给对应的Redis实例,从而完成了分布式路由逻辑。

当然,也有特殊情况发生,比如集群扩容、缩容,会打乱原有的哈希槽分布

如果slot与实例的映射关系发生了变化,客户端要如何处理?

没关系,Redis 官方也想到这个问题

解决方案,就是采用重定向机制。

当客户端执行一个key命令时,如果指向的实例位置已经变化,会响应 MOVED 结果,里面带有新目标实例的地址。

此时客户端会更新本地缓存,后续对于该槽位的请求直接打到新实例上。

但是如果此时槽位的key较多,部分key还没迁移完,怎么办?

GET Tom哥:key
(error) ASK 6504 127.0.0.1:6379

客户端请求key时,会收到一条 ASK 错误信息。此时,并不会更新客户端本地缓存的哈希槽映射关系。

客户端给新的目标实例发送 ASKING 命令,然后再发送原来的get命令,这一次的命令操作会在新实例上执行,但是仅限这一次。

同一个key下次再操作时,还是路由到老的实例,直到该槽位全部迁移完成。

Redis Cluster 主节点宕机,如何是好?

只要是系统,就有宕机的风险。哨兵模式,通过单独部署哨兵集群,对整个Redis集群进行监控,具体的操作流程之前文章有介绍过。

Redis Cluster 并没有单独部署哨兵节点,而是通过master节点之间的心跳来彼此监控。

简单来说,针对A节点,某一个节点认为A宕机了,那么此时是主观下线。而如果集群内超过半数的节点认为A挂了, 那么此时A就会被标记为客观下线。

一旦节点A被标记为了客观下线,集群就会开始执行故障转移。其余正常运行的master节点会进行投票选举,从A节点的slave节点中选举出一个,将其切换成新的master对外提供服务。当某个slave获得了超过半数的master节点投票,就成功当选。

来源:https://segmentfault.com/a/1190000038528812

当选成功之后,新的master会执行slaveof no one来让自己停止复制A节点,使自己成为master。然后将A节点所负责处理的slot,全部转移给自己,然后就会向集群发PONG消息来广播自己的最新状态。

注意:Redis Cluster中的读、写请求都是在master上完成,从节点只是用于数据的容灾备份。

【硬核】秒杀活动技术方案,Redis申请32个G,被技术总监挑战了...相关推荐

  1. 北京冬奥黑科技; 揭秘虎年春晚硬核科技;全球首款AR隐形眼镜问世;索尼3D显示技术路径曝光...

    点击文章内容即可跳转至相应原文阅读 >> 祝大家开工大吉,虎年顺利! 北京冬奥从开幕式就黑科技曝了! 这一次的北京冬奥会,从开幕式就直接火了!首先是从冰立方中破冰而出并随着音乐冉冉升起的奥 ...

  2. 饲料码垛机器人技术方案_机器人码垛系统的技术要求.doc

    PAGE \* MERGEFORMAT 2 PAGE \* MERGEFORMAT 1 机器人码垛系统的技术要求(参考) 在设备进行招投标过程中,由于没有统一的技术要求,往往导致评标中缺乏基准,造成招 ...

  3. 硬核!15张图解Redis为什么这么快

    作者|莱乌 作为一名服务端工程师,工作中你肯定和 Redis 打过交道.Redis 为什么快,这点想必你也知道,至少为了面试也做过准备.很多人知道 Redis 快仅仅因为它是基于内存实现的,对于其它原 ...

  4. 超硬核Java学习路线图+学习资源+实战项目汇总,看完以后不用再问我怎么学Java了!

    之前写过很多次关于Java学习指南.Java技术路线图的文章.但是总还是有小伙伴来问我,Java怎么学,项目怎么做,资源怎么找,真是让人头秃. 于是这次黄小斜决定来一波狠的,把所有这些内容都整理起来, ...

  5. 硬核实测 | 深信服超融合是Oracle数据库的最佳CP,实锤了

    作为各行业关键业务使用最频繁的数据库管理系统,Oracle的承载和运维往往是一家企业的IT系统中比较复杂的.特别是Oracle RAC(实时应用集群),对于承载设备的可靠性和性能要求都极为严苛.随着超 ...

  6. FPGA硬核和软核处理器的区别~

    软核处理器 SOPC技术,即软核处理器,最早是由Altera公司提出来的,它是基于FPGA的SOC片上系统设计技术.是使用FPGA的逻辑和资源搭建的一个软核CPU系统,由于是使用FPGA的通用逻辑搭建 ...

  7. 云架构指挥调度平台技术方案建议书

    1.1项目概况 本文提出的技术方案就是利用先进的软交换技术为客户提供搭建一个完整的基于通信云计算架构的指挥调度系统平台,并为其提供及时.可靠的技术保障. 1.2业务需求 基于我们对于云指挥调度系统平台 ...

  8. 关于技术方案与架构宣讲的思考

    关于技术方案评审和架构演进宣讲的时候,我有的时候其实是比较难区分哪些时候适合使用架构图,哪些时候适合使用流程图. 当然技术评审和架构宣讲本身的目的也是不同的,比如:技术评审可能更是靠近问题本身,我们针 ...

  9. 为什么谐振时电抗为0_220KV/110KVCVT互感器串联谐振试验装置技术方案

    湖北中试高测电气控股有限公司为您解答:220KV/110KVCVT互感器串联谐振试验装置技术方案 220KV/110KVCVT互感器串联谐振试验装置技术方案被试品对象及试验要求: 220kV等级互感器 ...

最新文章

  1. 多路IO复用模型 select epoll 等
  2. SAP QM中阶执行事务代码QDB1,报错- Inspection severity 001 AQL 0.650 not in sampling schema A01-
  3. STL库容器vector at函数
  4. YII2操作mongodb笔记(转)
  5. C语言的main函数,究竟有几种写法?
  6. 前端学习(1525):简化模板代码
  7. Neural Networks for Machine Learning by Geoffrey Hinton (1~2)
  8. hive建表设置如果为null_Hive表中的NULL值处理
  9. 2021高值人才职业发展洞察:连接、信任与赋能----“高能”、“高薪”、“高潜”...
  10. 腾讯回应 QQ 被工信部通报;由微软老兵领导,Facebook 开发新操作系统;Node.js 13.4.0 发布 | 极客头条...
  11. eclipse启动tomcat报错:org.apache.logging.log4j.web.Log4jServletContextListener
  12. Nokia Imaging SDK滤镜使用入门
  13. 印度:10美元电脑与全民免费上网
  14. 腾讯微博开放平台的工作效率真差
  15. Python 复数类型(详解)
  16. 全球 AI 人工智能报告 —— 来自乌镇互联网大会
  17. 表单元素盘点第二弹<form><textarea>元素详细介绍
  18. IDEA中的DBCP使用及问题解决
  19. javascript之模拟滚动条
  20. Matlab:Voronoi 图

热门文章

  1. java面向对象电子科大版答案_电子科大17秋《面向对象程序设计》在线作业1
  2. 如何更新 Linux 的符号链接
  3. JSP 异常处理如何处理?
  4. 交换变量和String类初始化:JAVA入门基础
  5. 看下Linux 如何查看端口占用情况
  6. PyCaret-低代码ML库使用指南
  7. HDU2680(SPFA算法)
  8. php如何批量导入题库,批量文本导入试题
  9. html点击按钮删除session,删除sessionstorage
  10. RStudio v1.2.1335 发布,R 语言的集成开发环境