进入本次Redis性能调优之前,首先要知道CPU结构也会影响Redis的性能。接下来,具体了解一下!

为什么CPU结构也会影响Redis的性能?

主流的 CPU 架构

一个 CPU 处理器中一般有多个物理核,每个物理核都可以运行应用程序。每个物理核都拥有私有的一级缓存(Level 1 cache,简称 L1 cache),包括一级指令缓存和一级数据缓存,以及私有的二级缓存(Level 2 cache,简称 L2 cache)。物理核的私有缓存指缓存空间只能被当前的物理核使用,其他物理核无法对这个核的缓存空间进行数据存取。

因为 L1 和 L2 缓存是每个物理核私有的,当数据或指令保存在 L1、L2 缓存时,物理核访问它们的延迟不超过 10 纳秒,速度非常快。但是,这些 L1 和 L2 缓存的大小一般只有 KB 级别,存不下太多的数据。如果 L1、L2 缓存中没有所需的数据,应用程序就需要访问内存来获取数据。而应用程序的访存延迟一般在百纳秒级别,是访问 L1、L2 缓存的延迟的近 10 倍,不可避免地会对性能造成影响。所以,不同的物理核还会共享一个共同的三级缓存(Level 3 cache,简称为 L3 cache)。L3 缓存能够使用的存储资源比较多,所以一般比较大,能达到几 MB 到几十 MB,这就能让应用程序缓存更多的数据。当 L1、L2 缓存中没有数据缓存时,可以访问 L3,尽可能避免访问内存。现在主流的 CPU 处理器中,每个物理核通常都会运行两个超线程,也叫作逻辑核。同一个物理核的逻辑核会共享使用 L1、L2 缓存。

在主流的服务器上,一个 CPU 处理器会有 10 到 20 多个物理核。同时,为了提升服务器的处理能力,服务器上通常还会有多个 CPU 处理器(也称为多 CPU Socket),每个处理器有自己的物理核(包括 L1、L2 缓存),L3 缓存,以及连接的内存,同时,不同处理器间通过总线连接。,

在多 CPU 架构上,应用程序可以在不同的处理器上运行。在刚才的图中,Redis 可以先在 Socket 1 上运行一段时间,然后再被调度到 Socket 2 上运行。但是注意:如果应用程序先在一个 Socket 上运行,并且把数据保存到了内存,然后被调度到另一个 Socket 上运行,此时,应用程序再进行内存访问时,就需要访问之前 Socket 上连接的内存,这种访问属于远端内存访问。和访问 Socket 直接连接的内存相比,远端内存访问会增加应用程序的延迟。在多 CPU 架构下,一个应用程序访问所在 Socket 的本地内存和访问远端内存的延迟并不一致,所以也把这个架构称为非统一内存访问架构(Non-Uniform Memory Access,NUMA 架构)。

总结下 CPU 架构对应用程序运行的影响:

L1、L2 缓存中的指令和数据的访问速度很快,所以,充分利用 L1、L2 缓存,可以有效缩短应用程序的执行时间;

在 NUMA 架构下,如果应用程序从一个 Socket 上调度到另一个 Socket 上,就可能会出现远端内存访问的情况,这会直接增加应用程序的执行时间。

CPU 多核对 Redis 性能的影响

在一个 CPU 核上运行时,应用程序需要记录自身使用的软硬件资源信息(例如栈指针、CPU 核的寄存器值等),把这些信息称为运行时信息。同时,应用程序访问最频繁的指令和数据还会被缓存到 L1、L2 缓存上,以便提升执行速度。但是,在多核 CPU 的场景下,一旦应用程序需要在一个新的 CPU 核上运行,那么,运行时信息就需要重新加载到新的 CPU 核上。而且,新的 CPU 核的 L1、L2 缓存也需要重新加载数据和指令,这会导致程序的运行时间增加。如果在 CPU 多核场景下,Redis 实例被频繁调度到不同 CPU 核上运行,对 Redis 实例的请求处理时间影响就更大了。每调度一次,一些请求就会受到运行时信息、指令和数据重新加载过程的影响,这就会导致某些请求的延迟明显高于其他请求。要避免 Redis 总是在不同 CPU 核上来回调度执行。就要把 Redis 实例和 CPU 核绑定,让一个 Redis 实例固定运行在一个 CPU 核上。

CPU 的 NUMA 架构对 Redis 性能的影响

实际应用 Redis 时,为了提升 Redis 的网络性能,把操作系统的网络中断处理程序和 CPU 核绑定。这个做法可以避免网络中断处理程序在不同核上来回调度执行,的确能有效提升 Redis 的网络处理性能。但是,网络中断程序是要和 Redis 实例进行网络数据交互的,一旦把网络中断程序绑核后,就需要注意 Redis 实例是绑在哪个核上了,这会关系到 Redis 访问网络数据的效率高低。

网络中断处理程序是指什么呢?

当网卡接收到数据后,会触发网卡中断,用来通知操作系统内核进行数据处理。因此,操作系统内核中用来处理网卡中断事件,把数据从内核的缓冲区拷贝到应用程序缓冲区的程序就是指网卡中断处理程序。Redis 实例和网络中断程序的数据交互:网络中断处理程序从网卡硬件中读取数据,并把数据写入到操作系统内核维护的一块内存缓冲区。内核会通过 epoll 机制触发事件,通知 Redis 实例,Redis 实例再把数据从内核的内存缓冲区拷贝到自己的内存空间,如下图所示:

在 CPU 的 NUMA 架构下,当网络中断处理程序、Redis 实例分别和 CPU 核绑定后,就会有一个潜在的风险:如果网络中断处理程序和 Redis 实例各自所绑的 CPU 核不在同一个 CPU Socket 上,那么,Redis 实例读取网络数据时,就需要跨 CPU Socket 访问内存,这个过程会花费较多时间。有人做过测试,和访问 CPU Socket 本地内存相比,跨 CPU Socket 的内存访问延迟增加了 18%,这自然会导致 Redis 处理请求的延迟增加。为了避免 Redis 跨 CPU Socket 访问网络数据,最好把网络中断程序和 Redis 实例绑在同一个 CPU Socket 上,这样一来,Redis 实例就可以直接从本地内存读取网络数据了,如下图所示:

注意:在 CPU 的 NUMA 架构下,对 CPU 核的编号规则,并不是先把一个 CPU Socket 中的所有逻辑核编完,再对下一个 CPU Socket 中的逻辑核编码,而是先给每个 CPU Socket 中每个物理核的第一个逻辑核依次编号,再给每个 CPU Socket 中的物理核的第二个逻辑核依次编号。假设有 2 个 CPU Socket,每个 Socket 上有 6 个物理核,每个物理核又有 2 个逻辑核,总共 24 个逻辑核。执行 lscpu 命令,查看到这些核的编号:

lscpu
Architecture: x86_64
...
NUMA node0 CPU(s): 0-5,12-17
NUMA node1 CPU(s): 6-11,18-23
...

NUMA node0 的 CPU 核编号是 0 到 5、12 到 17。其中,0 到 5 是 node0 上的 6 个物理核中的第一个逻辑核的编号,12 到 17 是相应物理核中的第二个逻辑核编号。NUMA node1 的 CPU 核编号规则和 node0 一样。所以,一定要注意 NUMA 架构下 CPU 核的编号方法,这样才不会绑错核。

绑核的风险和解决方案

当把 Redis 实例绑到一个 CPU 逻辑核上时,就会导致子进程、后台线程和 Redis 主线程竞争 CPU 资源,一旦子进程或后台线程占用 CPU 时,主线程就会被阻塞,导致 Redis 请求延迟增加。针对这种情况,解决方案是一个 Redis 实例对应绑一个物理核。在给 Redis 实例绑核时,不要把一个实例和一个逻辑核绑定,而要和一个物理核绑定,也就是说,把一个物理核的 2 个逻辑核都用上。eg:执行下面的命令,就把 Redis 实例绑定到了逻辑核 0 和 12 上,而这两个核正好都属于物理核 1。

taskset -c 0,12 ./redis-server

和只绑一个逻辑核相比,把 Redis 实例和物理核绑定,可以让主线程、子进程、后台线程共享使用 2 个逻辑核,可以在一定程度上缓解 CPU 资源竞争。

总结:在 CPU 多核的场景下,用 taskset 命令把 Redis 实例和一个核绑定,可以减少 Redis 实例在不同核上被来回调度执行的开销,避免较高的尾延迟;在多 CPU 的 NUMA 架构下,如果对网络中断程序做了绑核操作,建议同时把 Redis 实例和网络中断程序绑在同一个 CPU Socket 的不同逻辑核上,这样可以避免 Redis 跨 Socket 访问内存中的网络数据的时间开销。

秒杀项目绑核实战

之前已经安装过redis了,查看是否实例还在运行;linux查看redis是否安装的命令:

whereis redis-cli
whereis redis-server

通过 lscpu 命令,查看到这些核的编号:

NUMA node0 的 CPU 核编号是0,1;代表双核与自己的云服务器配置符合。

绑核:

绑核之前和之后通过vimstat发现系统调用的CPU上下文切换次数确实下降了。

vimstat命令 主要用来分析系统的内存使用情况,也常用来分析 CPU 上下文切换和中断的次数。---绑核优化中查看CPU切换次数

http://blog.chinaunix.net/uid-780780-id-2043554.html

https://zhuanlan.zhihu.com/p/578221440

后续知识补充

阿里云ECS主机提供的vCPU是指虚拟核,一般对应一个物理核心上的一个超线程,这是因为底层服务器一般会开启超线程。通常,一个物理核心会对应2个超线程,每个超线程对应一个vCPU。多个vCPU一般是在同一个NUMA节点上。如果希望减少CPU超线程对性能的影响,可以通过阿里云SDK的选项关闭超线程。

个人收获:其实这样的Redis优化方案用到的计算机底层体系知识已经很深了,用到的知识和零拷贝关联性很强,关于零拷贝可以看下下面的文章:

https://blog.csdn.net/weixin_39406430/article/details/123715072

Redis实例绑定CPU物理核优化Redis性能相关推荐

  1. 获取redis实例绑定cpu的情况

    redis是一个单线模型的nosql类型的数据库,而目前接触到的服务器大都是多核的,比如8c,16c,32c,64c等等.为了充分利用主机,在一台主机上必然会部署多个redis实例,默认情况cpu会随 ...

  2. 1000+Redis实例,100+集群,Redis 在海量数据和高并发下的优化实践

    墨墨导读:Redis 对于从事互联网技术工程师来说并不陌生,几乎所有的大中型企业都在使用 Redis 作为缓存数据库. 但是对于绝大多数企业来说只会用到它的最基础的 KV 缓存功能,还有很多 Redi ...

  3. Linux之CPU物理核与逻辑核

    前言: 以前经常在工作中听到所谓的服务器几核.几核,物理核数.逻辑核数,傻傻分不清楚.下面就了解一下相关概念及关系. 一.所谓的CPU 所谓的CPU,它的全称是Central Processing U ...

  4. oracle物理读优化,oracle 性能优化 06_sql优化

    一.SQL优化概述 1.查找需要优化的TOP SQL,可以通过AWR报告,v$sql,v$sqlarea视图获取,CPU开销,逻辑读,物理读,执行次数, 解析次数,执行时间等 2.优化可能的选择 合理 ...

  5. 使用Redis分区将数据分割到多个Redis实例

    分区是将所有的数据分割到多个Redis实例的过程,所以每个Redis实例存放的是所有键值的子集. Redis分区主要有两个目标: 1)允许使用多台计算机的内存来存放更大的数据.如果不做分区的话,单台计 ...

  6. CPU 的物理核与逻辑核

    基础概念 CPU( CentralProcessingUnit): 是计算机系统的运算和控制核心,是信息处理.程序运行的最终执行单元,相当于系统的"大脑". 物理核(physica ...

  7. CPU、物理核、逻辑核概念与关系

    CPU.物理核.逻辑核概念与关系 文章将解答如下问题 一个物理核可以分成两个逻辑核,是吗? 我们常说的电脑是8核的,服务器是64核的,指的是逻辑核,还是物理核? 怎么查看Linux服务器的物理核.逻辑 ...

  8. Centos7搭建多个Redis实例

    Centos7搭建多个Redis实例 一.准备 需要准备redis安装包,建议在 /usr/local 下创建一个 工作空间,用于存储开发需要的安装包.本人把redis安装在 /usr/local/w ...

  9. 揭秘倚天实例背后的硬核实力

    2022云栖大会,阿里巴巴宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU.11月15日,倚天710云实例上线并正式进入大规模应用阶段,现已应用于阿里巴巴集团核心业 ...

最新文章

  1. 如何使用Leangoo看板统计中的任务周期?
  2. 主要操作系统体系结构
  3. Java爬虫——B站弹幕爬取
  4. 基于词典的前缀扫描中文分词
  5. PowerDesigner 提示 Existence of index、key、reference错误
  6. 笔记-Microsoft SQL Server 2008技术内幕:T-SQL语言基础-02 单表查询
  7. mysql远程定时任务_Linux下定时任务实现mysql自动备份并上传远程ftp
  8. 闭包基础概念,闭包详解
  9. android中间件开发技术,基于Android的移动应用开发中间件技术研究与实现
  10. linux开发之deamon的写法
  11. 敏捷互联网项目测试质量报告的大纲
  12. 51单片机延时程序(以延时30ms为例)
  13. Telephone--短信发送/接收流程
  14. 小X与神牛(dfs)
  15. 无法识别的USB设备:跟这台计算机连接的一个USB设备运行不正常,WINDOWS无法识别...
  16. Unity 报错处理
  17. 计算机管理器磁盘清理,Win10提示windows磁盘空间清理管理器已停止工作
  18. mysql表字段详解
  19. 交易所要变天?去中心化交易所崛起,蚕食用户,抢夺流量
  20. automake,autoconf使用详解

热门文章

  1. 【OpenCV】基于ResNet和Caffe模型的图像分类
  2. F - Friends
  3. win10+linux双系统给linux系统分区内存扩容
  4. Winspy++ Baidu盘
  5. 高校BBS爆笑之无敌终结版
  6. MFC 如何将DWORD类型转换成CString放入ListBox中
  7. 本地网站无服务器,0基础,无需域名服务器,手把手教你搭建本地电脑的影视播放网站...
  8. 集成开发工具(IDEA)安装与使用
  9. geoserver安装及跨域问题解决方案
  10. idea调试需要的快捷键_Idea 进行断点调试的 快捷键