导航

  • 一、CPU缓存架构与一致性协议
    • 1.1 CPU缓存架构
    • 1.2 缓存行与伪共享问题
    • 1.3 MESI 缓存一致性协议
    • 1.4 伪共享的解决办法
  • 二、JMM Java 内存模型
    • 2.1 JMM 简介
    • 2.2 原子性、可见性、有序性
    • 2.3 八大内存交互操作
    • 2.4 happens-before 原则

一、CPU缓存架构与一致性协议

1.1 CPU缓存架构

现代 CPU 的发展非常快,内存的速度已经完全跟不上。如果将CPU完成一个基本操作所用的时间定义为时钟周期,那么 CPU 的指令处理速度要比内存的加载速度快100 倍左右。

为了解决这个性能上的鸿沟,现代 CPU 架构往往采用如下图所示的缓存架构:

在多核CPU和主存(Main Memory)之间引入三级高速缓存——L1、L2、L3

越靠近CPU的缓存,成本造价越高、性能越强、存储空间越小,其中 L3 缓存是多核共享,而L1、L2 是核内私有。

1.2 缓存行与伪共享问题

缓存行 Cache Line 是高速缓存一次读取内存数据的最小单位。目前最常见的 Intel cpu 的缓存行大小是 64 Bytes。
连续的数据很有可能由于数据跨度恰好在一个缓存行内,就很有可能会被CPU加载到 L1、L2、L3 高速缓存中。

由于高速缓存的存在,引出了缓存一致性协议,它可以保证 L1、L2、L3 中的数据在多核CPU和并发场景下不会出现线程不一致问题。早期的解决方案并不是各种缓存一致性方案,而是采用总线锁的方式。

总线锁,顾名思义就是将高速缓存与主内存之间的总线上锁,只允许一个线程去获取并操作上锁数据,处理完成后释放锁,并将数据从缓存中刷回主存。这种方式虽然安全,但也牺牲了很大的性能。于是,人们又引入了诸如 MESI 的缓存一致性协议。简单的说,就是给缓存数据做标记,如果CPU发现缓存的数据失效了,就必须从主存中重新加载最新的数据。

那什么又是伪共享呢?

伪共享是缓存行加载数据时必然会存在的性能损耗问题。当对象中包含线程局部变量,且尺寸大小小于 64 字节,就有可能发生伪共享问题。

再具体点,内存地址连续的不同变量被加载到了同一个缓存行中,而同一个缓存行中的多个变量,又不一定是CPU所需的,这种情况就是伪共享。

由于伪共享的存在,CPU核心中的高速缓存加载了本不需要数据,又在“缓存一致性协议”的要求下,不得不在这些无用数据失效后重新加载缓存,导致缓存失效,或造成性能损耗:

如上图所示,x、y 两个变量由 Main Memory 加载到 core 1 和 core 2两个核心的 L1、L2 缓存中。如果线程A、B 跑在两个核心上,且线程 A 修改 core 1 中的 x,由于缓存一致性协议, core 2 中的 x 变量将会失效,它必须从主内存中重新加载,这样频繁的加载、访问主内存, core 2 中的 L1、L2 缓存几乎等于失效。

1.3 MESI 缓存一致性协议

MESI是缓存锁的实现方式之一,注意这是 CPU 缓存一致性,并非通常说的应用缓存。有些无法被缓存的数据或跨多个缓存行的数据依然必须使用总线锁。

MESI 的核心思想是为每个 Cache Line 标记 4 种状态:

  1. 若缓存数据更改过,则将 Cache Line 标记为 M
  2. 如果缓存数据是独享,则标记为 E
  3. 如果数据是被多个CPU读取,则标记为 S
  4. 如果数据被其他CPU修改过,则标记为 I

1.4 伪共享的解决办法

Java 7 之前可以采用字节填充的方式,例如针对不同操作系统和对象头的大小,补齐多个 long 类型的空数据。
但这种方式在 Java 7 的某个版本中会出现 填充失效问题,原因是该版本的虚拟机优化了未使用 field 的排布。

在 Java 8 加入 @Contended 注解会帮助增加128 字节的 padding,并且需要开启 -XX:-RestrictContended 选项才能生效。

虽然解决了伪共享的问题,但是这种填充的方式也浪费了缓存资源,而且缓存又小又贵,时间和空间的取舍要酌情考虑。

二、JMM Java 内存模型

2.1 JMM 简介

JMM 全称是 “Java Memory Model”,Java 内存模型。
因为在不同的硬件生产商和操作系统下,内存的访问方式各有所差异,这样就会造成相同的代码出现不一样的问题,而 JMM 屏蔽掉了各种操作系统的内存访问差异,以实现“Write Once,Run Anywhere”的目标

JMM 中规定所有的变量都存储在主内存 (Main Mem)中,包括实例变量、静态变量,但是不包括局部变量和方法参数。每条线程都有自己的工作内存(Work Mem),线程私有。工作内存中保存的是线程的变量从主内存中的拷贝副本

这种结构的基本工作方式是:线程对变量的读和写都必须在工作内存中进行,而线程之间变量值的传递均需要通过主内存来完成。如下图所示,注意与Java 内存结构(堆栈等)等概念区分开。

2.2 原子性、可见性、有序性

整个 JMM 实际上是围绕着三个并发特征建立起来的——原子性、可见性、有序性

  1. 原子性:和事务的 ACID 的 原子性概念一致,即表示一个操作中间不可分割,不能中断,执行过程不允许被其他线程打扰。 JMM 只能保证基本操作的原子性,如果要保证一个代码块的原子性,Java 提供了 synchronized 关键字,它对应了 monitorentrer 和 monitorexit 字节码指令。
  2. 可见性:不同的线程对数据的修改结果可以被其他线程感知到,这就是可见性。synchronized 是保证可见性的最常用的操作,除此之外,还有 volatile 关键字,它是较弱的同步机制。
  3. 有序性:字节码指令的执行顺序不可重排。可以使用 synchronized 或 volatile 保证多线程之间操作的有序性。volatile是使用内存屏障达到禁止指令重排,保证有序性。而 synchronized 则以互斥锁的形式要求上锁的资源必须按序执行。

2.3 八大内存交互操作


说是 8 种内存交互操作:

  • lock 和 unlock:锁定与解锁。作用于主内存的变量,将其设置为线程独占或解除。
  • Read 和 Write:发生在主内存和工作内存之间,将变量传输到工作内存,将从工作内存得到的值放入主内存中。
  • Load 和 Store:作用于工作内存的变量,将工作内存中的变量放入副本中,将工作内存中的变量传输到主内存中。
  • Use 和 Assign:将工作内存中的变量传输到执行引擎,将一个从执行引擎中接收到的值赋值给工作内存的副本。

使用规则:

  • 不允许 read、load、store、write 操作之一单独出现,即 read 操作后必须 load,store后必须 write。
  • 不允许线程丢弃它最近的 assign 操作,即工作内存中的变量修改之后,必须告知主存。
  • 不允许线程将没有 assign 的数据从工作内存同步到主存。
  • lock 和 unlock 必须成对出现。
  • 新的变量必须由主存中诞生。
  • 如果对一个变量进行 lock,会清空所有工作内存中此变量的值。在执行引擎使用这个变量前,必须重新 load 或 assign 。
  • unlock 之前,必须将此变量同步回主内存。

2.4 happens-before 原则

happens-before是JMM提供的有序性保证。在理解它的概念之前,需要了解一下弱内存模型强内存模型

弱内存模型——weak memory model
弱内存模型中,loadload、loadstore、storestore、storeload 四种内存重排序都有可能发生。只要不改变单线程行为,弱内存模型可随意对代码进行重排序,这是一种近乎不存在任何保证的模型。

强内存模型
Java的内存模型属于一种叫做 “顺序一致性” 的强内存模型。在顺序一致性模型中,不再存在重排序,Java的JMM就属于这种强内存模型。

虽然 JMM 属于最高级别的强内存模型——顺序一致性内存模型,但并不是说Java 不允许重排序,而是在某些情况下,可以支持严格限制重排序的目的,如volatile。而弱内存模型是无法满足这种保证的。

happens-before 是 JMM 提供的一系列关于重排序问题的规则。可以概括为:

If one action happens-before another, then the first is visible to and ordered before the second.
如果一个动作 happens-before 另一个动作,那么前者的执行会排在后者的前面,并且(其结果)对后者可见。
《java language specification 8》

可以分为以下两种策略:

  1. 对于会改变程序执行结果的重排序,JMM要求编译器和处理器必须禁止这种重排序。
  2. 对于不会改变程序执行结果的重排序,JMM对编译器和处理器不做要求(JMM允许这种重排序)。

这两个策略概括起来,可以这样理解——只要不改变程序的执行结果,编译器和处理器想怎么优化就怎么优化

例如,如果编译器经过细致的分析,认定一个锁只能被一个线程访问到,那么这个锁可以被消除。
又例如,编译器认定一个 volatile 变量只会被单个线程访问到,那么它可以把这个 volatile 变量当做一个普通变量对待。

happens-before 的具体规则如下:

  1. 程序顺序执行,如果x和y是同一个线程的动作,并且在程序顺序中x出现在y之前,则 x happens-before y。
  2. 如果动作 x 的结果需要同步给后面的动作 y ,那么 x happens-before y。也就是说,synchronized 修饰的情况,先获得锁的线程就是 x ,后获得锁的就是 y,前者的执行结果需要同步给 y,那么同样会有 x happens-before y。
  3. 传递性,x happens-before y,y happens-before z,那么 x happens-before z。

根据这些规则,以下这些场景都是 happens-before 的情况:

  1. 对象锁的解锁,发生在对象锁后续的上锁之前
  2. 对 volatile 变量的写操作,一定发生在后续对该 volatile 变量的读操作之前。
  3. 对线程的 start() 方法的调用,一定发生在线程内其他操作之前。
  4. 线程中的所有操作,一定发生在该线程 join() 方法结束之前。
  5. 任何对象的默认初始化一定发生在程序中其他操作之前。

总之,happens-before 定义了两个动作发生资源竞争时的时间顺序,是JMM 描述特定动作前后执行顺序的一种抽象关系。它原则上不允许重排序,但在一些不影响程序执行结果的情况下,乱序执行也是可以的。

JVM——CPU缓存架构与Java 内存模型相关推荐

  1. 【JVM】第四章 Java内存模型

    第四章 Java内存模型 文章目录 第四章 Java内存模型 一.物理机的并发问题 1.硬件的效率问题 2.缓存一致性问题 3.代码乱序执行优化问题 二.Java 内存模型 1.概念 2.Java 内 ...

  2. JVM成神之路-Java内存模型(JMM)

    Java 内存模型基础 什么是 Java 内存模型(JMM-共享内存模型) 内存模型描述了程序中各个变量(实例域.静态域和数组元素)之间的关系,以及在实际计算机系统中将变量存储到内存和从内存中取出变量 ...

  3. JVM系列(三)— Java内存模型

    我们已经了解了Java虚拟机的运行时数据区,垃圾收集相关知识,接下来学习虚拟机非常重要的部分 这就是Java内存模型与线程(第12章),这一篇,将主要讲讲内存模型 了解Java内存模型之前,先了解下计 ...

  4. Java虚拟机(JVM)与Java内存模型(JMM)学习笔记

    Java虚拟机[JVM]与Java内存模型[JMM]学习笔记 Java虚拟机(JVM) 三种JVM JVM 位置 JVM的主要组成部分及其作用 类加载器 双亲委派机制 沙箱安全机制 Java本地接口( ...

  5. JAVA内存模型与线程安全

    什么是线程安全?在<<深入理解Java虚拟机>>中看到的定义.原文如下:当多个线程访问同一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替运行,也不需要进行额外的同步, ...

  6. java判断多个线程是否跑批完成_终于有人把Java内存模型说清楚了

    内部原理 JVM 中试图定义一种 JMM 来屏蔽各种硬件和操作系统的内存访问差异,以实现让 Java 程序在各种平台下都能达到一致的内存访问效果. JMM 的主要目标是定义程序中各个变量的访问规则,即 ...

  7. 一文读懂Java内存模型(JMM)及volatile关键字

    点赞再看,养成习惯,公众号搜一搜[一角钱技术]关注更多原创技术文章. 本文 GitHub org_hejianhui/JavaStudy 已收录,有我的系列文章. 前言 并发编程从操作系统底层工作的整 ...

  8. Java内存区域与Java内存模型

    Java内存区域 Java虚拟机在运行程序时会把其自动管理的内存划分为以上几个区域,每个区域都有其用途以及创建销毁的时机,其中蓝色部分代表的是所有线程共享的数据区域,而绿色部分代表的是每个线程的私有数 ...

  9. 理解Java内存模型(JMM)

    本篇的写作思路是先阐明Java内存区域划分.硬件内存架构.Java多线程的实现原理与Java内存模型的具体关系,在弄明白它们间的关系后,进一步分析Java内存模型作用以及一些实现手段 理解Java内存 ...

最新文章

  1. VSS的每日自动备份
  2. CV04-UNet笔记
  3. Metasploit编码模块技巧
  4. Spark集群基于Zookeeper的HA搭建部署笔记(转)
  5. 阿里云系列——7.阿里云IIS系列详解(过程+通用+最新)
  6. c语言删增,C语言中初始、增加和删除进程信号的操作方法简介
  7. windows 下redis在后台运行(亲测)
  8. PyTorch教程(三):索引与切片
  9. 挂牌一年,关于 5G 的 9 个变化
  10. Android Studio 自定义Gradle Plugin
  11. 判断是否为IE浏览器(方法一)
  12. Linux Shell高级技巧(四)
  13. mysql 中文的数据类型_MySQL 数据类型
  14. 张一鸣向盖茨基金会捐赠1000万美元 此前国内捐款1亿元用于抗疫
  15. Java8新特性_接口中的默认方法
  16. Git-如何回滚代码 revert和reset
  17. 窗口设置的一般操作方法
  18. pr2020lut导入_PS PR AE怎么批量导入LUTS调色预设
  19. linux下如何关闭端口占用,Linux端口被占用? -- Linux查看端口使用状态、关闭端口方法...
  20. linux中文输入配置sougou输入法

热门文章

  1. 如何设计不宕机的 Redis 高可用服务?
  2. Redis 持久化——混合持久化
  3. 第 4-1 课:BIO、NIO、AIO 详解 + 面试题
  4. 最详细的 IDEA调试教程
  5. Java核心(二)深入理解线程池ThreadPool
  6. js提取正则中的字符串
  7. zoj 1091 Knight Moves
  8. CentOS7.0下Hadoop2.7.3的集群搭建
  9. 匈牙利算法——最大匹配问题详解
  10. yearning 2. 部署_对于企业来说,在选择协同办公系统的时候,选择私有化部署的数据安全一些,还是使用云服务器比较安全?...