2019独角兽企业重金招聘Python工程师标准>>>

Java代码在编译后会变成Java字节码,字节码被类加载器加载到JVM里,JVM执行字节码,最终需要转化为汇编指令在CPU上执行,Java中所使用的并发机制依赖于JVM的实现和CPU的指令。建议先对Java并发的内存模型进行了解。

对于并发编程的底层实现,必须要保证实现三大特性:

  1. 可见性:即多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值。
  2. 原子性:一个操作或者多个操作要么全部执行并且执行的过程不会被任何因素打断,或者一旦中断就都不执行。
  3. 有序性:程序执行的顺序按照代码的先后顺序执行。

1.volatile

在多线程并发编程中synchronized和volatile都扮演着重要的角色,volatile是轻量级的synchronized,它在多处理器开发中保证了共享变量的“可见性”。可见性的意思是当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。如果volatile变量修饰符使用恰当的话,它比synchronized的使用和执行成本更低,因为它不会引起线程上下文的切换和调度。

推荐博客:

http://www.importnew.com/24082.html

http://www.cnblogs.com/dolphin0520/p/3920373.html

1.1实现原理

实现可见性的底层原理,可通过观察Java代码与汇编代码查看。

Java代码:

instance = new Singleton(); // instance是volatile变量

汇编代码:

0x01a3de1d: movb $0×0,0×1104800(%esi);
0x01a3de24: lock addl $0×0,(%esp);

有volatile变量修饰的共享变量进行写操作的时候会多出第二行汇编代码,Lock前缀的指令在多核处理器下会引发了两件事情:

(1)将当前处理器缓存行的数据写回到系统内存。

(2)这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。

原本为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内存的数据读到内部缓存后再进行操作,但操作完不知道何时会写到内存。

但是,如果对声明了volatile的变量进行写操作,JVM就会向处理器发送一条Lock前缀的指令,将这个变量所在缓存行的数据写回到系统内存。同时还有一个问题,就算写回到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。

我个人理解就是:在多核处理器中,每个处理器处理计算一个线程的(任务)代码,比如说一个四核处理器,有一个核正在处理一个包含对共享变量进行更改赋值的操作的线程,另外三个处理器处理一个包含读取同一个共享变量操作的线程。

如果该共享变量不是volatile,首先,CPU会从系统内存中获取数据到CPU缓存中进行相应的处理(关于内存、高速缓存和CPU寄存器,可以参考计算机中内存、cache和寄存器之间的关系及区别),当处理对共享变量进行更改赋值的操作完成后,并不一定会立即将处理后的数据写回系统内存,这就可能会导致当某个赋值操作完成(即更改操作的那行代码执行)后,另一个读取共享变量的线程会读到错误数据,或者说未改变的数据。(如下列代码测试中两个线程的i值应该至少一个为2,但是两个都为1就说明发生了这种情况)

如果该共享变量是volatile的,那么CPU会从系统内存中获取数据到CPU缓存中进行相应的处理,当处理对共享变量进行更改赋值的操作(即更改操作的那行代码执行)完成后,会立即将处理后的数据写回系统内存,并且其他三个处理器通过缓存一致性协议检查自己缓存的数据是否过期,是则会重新从系统内存读取。

简单来说,volatile的两条实现原则是:

(1)Lock前缀的汇编指令会引起处理器缓存回写到内存

(2)一个处理器的缓存回写到内存会导致其他处理器的缓存无效。

//volatile 关键字修饰的变量与无该关键字修饰的变量在多线程读改写时的区别
public class KeyWord_volatile{int i=0;volatile int x=0;class Runner implements Runnable{public void run() {i++;System.out.println(Thread.currentThread().getName()+"计算的i为:"+i);x++;System.out.println(Thread.currentThread().getName()+"计算的x为:"+x);}}Runnable getRun(){return new Runner();}public static void main(String[] args) {KeyWord_volatile v=new KeyWord_volatile();Runner r1=(Runner) v.getRun();Runner r2=(Runner) v.getRun();Thread t1=new Thread(r1);Thread t2=new Thread(r1);t1.start();t2.start();}
}
//测试结果(随机,可能会发生)
Thread-1计算的i为:1
Thread-0计算的i为:1
Thread-1计算的x为:1
Thread-0计算的x为:2

2.synchronized

2.1 实现原理

(1)synchronized实现同步的基础:Java中的每一个对象都可以作为锁。具体表现为以下3种形式。

  1. 对于普通同步方法,锁是当前实例对象。
  2. 对于静态同步方法,锁是当前类的Class对象。
  3. 对于同步方法块,锁是Synchonized括号里配置的对象。当一个线程试图访问同步代码块时,它首先必须得到锁,退出或抛出异常时必须释放锁。

当一个线程试图访问synchronized同步代码块时,它首先必须得到锁,退出或抛出异常时必须释放锁。那么这个锁是什么? 存储在那里?

(2) Synchonized在JVM里的实现原理:JVM基于进入和退出Monitor对象来实现方法同步和代码块同步,但两者的实现细节不一样。代码块同步是使用monitorenter 和monitorexit指令实现的,而方法同步是使用另外一种方式实现的,细节在JVM规范里并没有详细说明。但是,方法的同步同样可以使用这两个指令来实现。 monitorenter指令是在编译后插入到同步代码块的开始位置,而monitorexit是插入到方法结束处和异常处,JVM要保证每个monitorenter必须有对应的monitorexit与之配对。任何对象都有一个monitor与之关联,当且一个monitor被持有后,它将处于锁定状态。线程执行到monitorenter指令时,将会尝试获取对象所对应的monitor的所有权,即尝试获得对象的锁。synchronized用的锁是存在Java对象头里的。

(3)对象头

https://blog.csdn.net/yinbucheng/article/details/70037521

2.2 锁的升级与对比

为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”。锁一共有4种状态,级别从低到高依次是:无锁状态、偏向锁状态、轻量级锁状态和重量级锁状态,这几个状态会随着竞争情况逐渐升级。锁可以升级但不能降级,意味着偏向锁升级成轻量级锁后不能降级成偏向锁。这种锁升级却不能降级的策略,目的是为了提高获得锁和释放锁的效率。

1.偏向锁

大多数情况下,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁。当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁,只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁。如果测试成功,表示线程已经获得了锁。如果测试失败,则需要再测试一下Mark Word中偏向锁的标识是否设置成1(表示当前是偏向锁):如果没有设置,则 使用CAS竞争锁;如果设置了,则尝试使用CAS将对象头的偏向锁指向当前线程。

(1)偏向锁的撤销

偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程尝试竞争偏向锁时, 持有偏向锁的线程才会释放锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有正在执行的字节码)。它会首先暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着, 如果线程不处于活动状态,则将对象头设置成无锁状态;如果线程仍然活着,拥有偏向锁的栈会被执行,遍历偏向对象的锁记录,栈中的锁记录和对象头的Mark Word要么重新偏向于其他线程,要么恢复到无锁或者标记对象不适合作为偏向锁,最后唤醒暂停的线程。

(2)关闭偏向锁:偏向锁在Java 6和Java 7里是默认启用的,但是它在应用程序启动几秒钟之后才激活,如 有必要可以使用JVM参数来关闭延迟:-XX:BiasedLockingStartupDelay=0。如果你确定应用程 序里所有的锁通常情况下处于竞争状态,可以通过JVM参数关闭偏向锁:-XX:- UseBiasedLocking=false,那么程序默认会进入轻量级锁状态。

2.轻量级锁

(1)轻量级锁加锁:线程在执行同步块之前,JVM会先在当前线程的栈桢中创建用于存储锁记录的空间,并将对象头中的Mark Word复制到锁记录中,官方称为Displaced Mark Word。然后线程尝试使用 CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。

(2)轻量级锁解锁:轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁。

因为自旋会消耗CPU,为了避免无用的自旋(比如获得锁的线程被阻塞住了),一旦锁升级成重量级锁,就不会再恢复到轻量级锁状态。当锁处于这个状态下,其他线程试图获取锁时, 都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程就会进行新一轮的夺锁之争。

3.各级别锁的优缺点对比

还可以参考学习这篇文章https://blog.csdn.net/zqz_zqz/article/details/70233767

3.原子操作的实现

3.1 处理器实现原子操作

1.相关CPU术语

  1. 缓存行:缓存的最小存储单位。
  2. CAS(比较并交换,即compare and swap):需要输入两个数值,一个旧值(操作前期望的值),一个新值,在操作期间,先比较旧值是否是期望的旧值,如果是则表示没有发生变化,则进行交换返回true,否则不进行交换并返回false。
  3. CPU流水线:类似于工业生产时的装配流水线,在CPU中有多个不同功能的电路单元组成一条指令处理流水线,然后将一条处理器指令分成多个部分,与处理单元一一对应,分别执行提高运算速度。
  4. 内存顺序冲突:由假共享引起,假共享是指多个cpu同时修改同一个缓存行的不同部分而引起的其中一个CPU的操作无效,当出现内存顺序冲突时,CPU必须清空流水线。

2.实现方式

处理器提供总线锁定和缓存锁定两个机制来保证复杂内存操作的原子性。

(1)使用总线锁定:如果多个处理器同时对共享变量进行读改写操作 (i++就是经典的读改写操作),那么共享变量就会被多个处理器同时进行操作,这样读改写操作就不是原子的,操作完之后共享变量的值会和期望的不一致。举个例子,如果i=1,我们进行两次i++操作,我们期望的结果是3,但是有可能结果是2。原因可能是多个处理器同时从各自的缓存中读取变量i,分别进行加1操作,然后分别写入系统内存中。那么,想要保证读改写共享变量的操作是原子的,就必须保证CPU1读改写共享变量的时候,CPU2不能操作缓存了该共享变量内存地址的缓存。

处理器使用总线锁就是来解决这个问题的。所谓总线锁就是使用处理器提供的一个 LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存。

//volatile 关键字使用的时缓存锁来实现
public class KeyWord_volatile{int i=0;volatile int x=0;class Runner implements Runnable{public void run() {i++;System.out.println(Thread.currentThread().getName()+"计算的i为:"+i);x++;System.out.println(Thread.currentThread().getName()+"计算的x为:"+x);}}Runnable getRun(){return new Runner();}public static void main(String[] args) {KeyWord_volatile v=new KeyWord_volatile();Runner r1=(Runner) v.getRun();Runner r2=(Runner) v.getRun();Thread t1=new Thread(r1);Thread t2=new Thread(r1);t1.start();t2.start();}
}
//测试结果(随机,可能会发生)
Thread-1计算的i为:1
Thread-0计算的i为:1
Thread-1计算的x为:1
Thread-0计算的x为:2

(2)使用缓存锁保证原子性:在同一时刻,我们只需保证对某个内存地址的操作是原子性即可,但总线锁定把CPU和内存之间的通信锁住了,这使得锁定期间,其他处理器不能操作其他内存地址的数据,所以总线锁定的开销比较大,目前处理器在某些场合下使用缓存锁定代替总线锁定来进行优化。

处理器可以使用“缓存锁定”的方式来实现复杂的原子性。所谓“缓存锁定”是指内存区域如果被缓存在处理器的缓存行中,并且在Lock操作期间被锁定,那么当它执行锁操作回写到内存时,处理器不在总线上发出LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的缓存行的数据时,会使缓存行无效。

有两种情况处理器不能使用缓存锁定:

(1)第一种情况是:当操作的数据不能被缓存在处理器内部,或操作的数据跨多个缓存行 时,则处理器会调用总线锁定。

(2)第二种情况是:有些处理器不支持缓存锁定。对于Intel 486和Pentium处理器,就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

3.2 Java中实现原子操作

在Java中可以通过锁和循环CAS的方式来实现原子操作。

1.使用循环CAS实现原子操作

自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止,以下代码实现了一个基于CAS线程安全的计数器方法safeCount和一个非线程安全的计数器count。

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;public class Counter {private AtomicInteger atomicI = new AtomicInteger(0);private int i = 0;public static void main(String[] args) {final Counter cas = new Counter();List<Thread> ts = new ArrayList<Thread>(600);long start = System.currentTimeMillis();for (int j = 0; j < 100; j++) {Thread t = new Thread(new Runnable() {@Overridepublic void run() {for (int i = 0; i < 10000; i++) {cas.count();cas.safeCount();}}});ts.add(t);}for (Thread t : ts) {t.start();}// 等待所有线程执行完成for (Thread t : ts) {try {t.join();} catch (InterruptedException e) {e.printStackTrace();}}System.out.println(cas.i);System.out.println(cas.atomicI.get());System.out.println(System.currentTimeMillis() - start);}/** * 使用CAS实现线程安全计数器 */private void safeCount() {for (;;) {int i = atomicI.get();boolean suc = atomicI.compareAndSet(i, ++i);if (suc) {break;}}}/*** 非线程安全计数器*/private void count() {i++;}}

循环CAS的三大问题:ABA问题,循环时间长开销大,以及只能保证一个共享变量的原子操作。

  1. ABA问题:因为CAS需要在操作值的时候,检查值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。ABA问题的解决思路就是使用版本号,在变量前面追加上版本号,每次变量更新的时候把版本号加1,那么A→B→A就会变成1A→2B→3A。从 Java 1.5开始,JDK的Atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
  2. 循环时间长开销大:自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。如 果JVM能支持处理器提供的pause指令,那么效率会有一定的提升。pause指令有两个作用:第 一,它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零;第二,它可以避免在退出循环的时候因内存顺序冲突(Memory Order Violation)而引起CPU流水线被清空(CPU Pipeline Flush),从而 提高CPU的执行效率。
  3. 只能保证一个共享变量的原子操作:当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁。还有一个取巧的办法,就是把多个共享变量合并成一个共享变量来操作。比如,有两个共享变量i=2,j=a,合并一下ij=2a,然后用CAS来操作ij。从Java 1.5开始, JDK提供了AtomicReference类来保证引用对象之间的原子性,就可以把多个变量放在一个对象里来进行CAS操作。

2 使用锁机制来实现原子性操作

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。JVM内部实现了很多种锁 机制,有偏向锁、轻量级锁和互斥锁。有意思的是除了偏向锁,JVM实现锁的方式都用了循环 CAS,即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时 候使用循环CAS释放锁。

转载于:https://my.oschina.net/ProgramerLife/blog/1824063

深入学习Java多线程——并发机制底层实现原理相关推荐

  1. java火箭应用_从火箭发场景来学习Java多线程并发闭锁对象

    原标题:从火箭发场景来学习Java多线程并发闭锁对象 从火箭发场景来学习Java多线程并发闭锁对象 倒计时器场景 在我们开发过程中,有时候会使用到倒计时计数器.最简单的是:int size = 5; ...

  2. java 闭锁_从火箭发场景来学习Java多线程并发闭锁对象

    从火箭发场景来学习Java多线程并发闭锁对象 倒计时器场景 在我们开发过程中,有时候会使用到倒计时计数器.最简单的是:int size = 5; 执行后,size-这种方式来实现.但是在多线程并发的情 ...

  3. Java并发机制底层实现原理-volatile

    章节目录 volatile的实现原理与应用 1.volatile的实现原理与应用 Java source code->Java class->JVM->汇编指令->cpu执行 ...

  4. Java学习笔记---多线程并发

    Java学习笔记---多线程并发 (一)认识线程和进程 (二)java中实现多线程的三种手段 [1]在java中实现多线程操作有三种手段: [2]为什么更推荐使用Runnable接口? [3][补充知 ...

  5. 2021全新Java多线程并发入门到精通,一篇就能学会

    目录 一, JAVA 多线程并发 1,JAVA 并发知识库 2,JAVA 线程实现/创建方式 (1) 继承 Thread 类 (2)实现 Runnable 接口. (3)ExecutorService ...

  6. Java 多线程 并发编程

    转载自  Java 多线程 并发编程 一.多线程 1.操作系统有两个容易混淆的概念,进程和线程. 进程:一个计算机程序的运行实例,包含了需要执行的指令:有自己的独立地址空间,包含程序内容和数据:不同进 ...

  7. 学习java多线程,这必须搞懂的这几个概念

    转载自 学习java多线程,这必须搞懂的这几个概念,很重要. 同步和异步 同步,Synchronous,即调用方法开始,一旦调用就必须等待方法执行完返回才能继续下面的操作. 举个例子,你去银行ATM取 ...

  8. Java多线程同步机制

    一段synchronized的代码被一个线程执行之前,他要先拿到执行这段代码的权限,在 java里边就是拿到某个同步对象的锁(一个对象只有一把锁): 如果这个时候同步对象的锁被其他线程拿走了,他(这个 ...

  9. Java多线程并发编程

    一.线程池 1.1.什么是线程池 线程池是一种多线程的处理方式,利用已有线程对象继续服务新的任务(按照一定的执行策略),而不是频繁地创建销毁线程对象,由此提高服务的吞吐能力,减少CPU的闲置时间.具体 ...

最新文章

  1. java常见异常总结---自己工作中经常遇到的一些异常
  2. 2015年第六届蓝桥杯C/C++ A组国赛 —— 第五题:切开字符串
  3. vim 实际行跟屏幕行移动命令
  4. 【Python基础入门系列】第03天:Python 变量与数据类型
  5. 面试:Java分派机制
  6. 3123称重显示控制器说明书_失重秤在自动化配料系统中的应用 - 工业自动化称重仪表...
  7. Windows环境下安装redis以及出现的一些未解决的问题
  8. linux shell删除所有文件夹下指定扩展名(关键字)的所有文件
  9. connection url mysql,JDBC 连接MySQL实例详解
  10. JS中创建对象的方法
  11. CSS3 animation动画,循环间的延时执行时间
  12. oracle日志不应用,dg报ORA-600日志不能应用
  13. 注意力机制Attention Model(mechanism) 的 套路
  14. STM32开关总中断
  15. ubuntu 截屏_零基础学习树莓派_更新+截屏+休眠
  16. activiti 源码笔记之startProcess
  17. C/C++编程学习 - 第2周 ③ 反向输出一个三位数
  18. 琼斯是计算体心立方弹性模量_本科阶段固体物理期末重点计算题.doc
  19. box-sizing: border-box的作用
  20. jy-12-SPRINGMYBATIS02——云笔记10-刘苍松

热门文章

  1. java selenium (二) 环境搭建方法一
  2. Vue入门 ---- vuex
  3. MySQL之算术表达式、聚合函数及GROUP BY 与 HANVING 等函数的应用
  4. 怎么在oracle中使用for循环
  5. 升级Python2.7后 no module name yum
  6. 西北农林科技大学计算机老师 癌症,西北农林科大攻克苹果树“癌症”
  7. php 微信分享链接怎么弄,PHP实现 微信--分享朋友链接
  8. 计算机基础理论知识的论文,计算机基础毕业论文
  9. 详解TCP协议三次握手四次挥手
  10. Redis基础-下载安装配置