volatile与JMM

Posted on 2022-06-10 Edited on 2025-02-22 In 后端 , Java多线程 Views: Word count in article: 5.5k Reading time ≈ 5 mins.

6、volatile与JMM

6.1 有序（禁重排）

重排序：重排序是指编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段，有时候会改变程序语句的先后顺序不存在数据依赖关系，可以重排序；存在数据依赖关系，禁止重排序。但重排后的指令绝对不能改变原有的串行语义！这点在并发设计中必须要重点考虑！

6.2 内存屏障是什么

内存屏障（也称内存栅栏，屏障指令等，是一类同步屏障指令，是CPU或编译器在对内存随机访问的操作中的一个同步点，使得此点之前的所有读写操作都执行后才可以开始执行此点之后的操作），避免代码重排序。内存屏障其实就是一种JVM指令，Java内存模型的重排规则会要求Java编峰器在生成JVM指令时插入特定的内存屏障指令，通过这些内存屏障指令，volatile实现了Java内存模型中的可见性和有序性（禁重排），但volatile无法保证原子性。
内存屏障之前的所有写操作都要回写到主内存，内存屏障之后的所有读操作都能获得内存屏障之前的所有写操作的最新结果（实现了可见性）。
写屏障（Store Memory Barrier）：告诉处理器在写屏障之前将所有存储在缓存（store bufferes）中的数据同步到主内存。也就是说当看到Store屏障指令，就必须把该指令之前所有写入指令执行完毕才能继续往下执行。
读屏障（Load Memory Barrier）：处理器在读屏障之后的读操作，都在读屏障之后执行。也就是说在Load屏障指令之后就能够保证后面的读取数据指令一定能够读取到最新的数据。
因此重排序时，不允许把内存屏障之后的指令重排序到内存屏障之前。一句话：对一个volatile变量的写，先行发生于任意后续对这个volatile变量的读，也叫写后读。

6.3 Unsafe.cpp

6.4 OrderAccess.hpp

6.5 orderAccess_linux_×86.inline.hpp

6.6 四大屏障分别是什么意思

6.7 通过内存屏障禁重排

重排序有可能影响程序的执行和实现，因此，我们有时候希望告诉JVM你别“自作聪明”给我重排序，我这里不需要排序，听主人的。
对于编译器的重排序，JMM会根据重排序的规则，禁止特定类型的编译器重排序。
对于处理器的重排序，Java编译器在生成指令序列的适当位置，插入内存屏障指令，来禁止特定类型的处理器排序。

6.8 happens-before之volatile变量规则

6.9 volatile读插入内存屏障后生成的指令序列示意图

6.10 volatile写插入内存屏障后生成的指令序列示意图

6.11 保证可见性的code

public class VolatileSeeDemo {
    //static boolean flag = true;
    static volatile boolean flag = true;
 
    public static void main(String[] args) {
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t -----come in");
            while (flag) {
 
            }
            System.out.println(Thread.currentThread().getName() + "\t -----flag被设置为false，程序停止");
        }, "t1").start();
 
        //暂停几秒钟线程
        try {
            TimeUnit.SECONDS.sleep(2);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
 
        flag = false;
 
        System.out.println(Thread.currentThread().getName() + "\t 修改完成flag: " + flag);
    }
}

6.12 上述代码原理解释

线程t1中为何看不到被主线程main修改为false的flag的值？
问题可能：
- 主线程修改了flag之后没有将其刷新到主内存，所以t1线程看不到。
- 主线程将flag刷新到了主内存，但是t1一直读取的是自己工作内存中flag的值，没有去主内存中更新获取flag最新的值。
我们的诉求：
- 线程中修改了自己工作内存中的副本之后，立即将其刷新到主内存；
- 工作内存中每次读取共享变量时，都去主内存中重新读取，然后拷贝到工作内存。
解决：使用volatile修饰共享变量，就可以达到上面的效果，被volatile修改的变量有以下特点：
- 线程中读取的时候，每次读取都会去主内存中读取共享变量最新的值，然后将其复制到工作内存。
- 线程中修改了工作内存中变量的副本，修改之后会立即刷新到主内存。

6.13 volatile变量的读写过程

Java内存模型中定义的8种每个线程自己的工作内存与主物理内存之间的原子操作。
- read：作用于主内存，将变量的值从主内存传输到工作内存，主内存到工作内存。
- load：作用于工作内存，将read从主内存传输的变量值放入工作内存变量副本中，即数据加载。
- use：作用于工作内存，将工作内存变量副本的值传递给执行引擎，每当JVM遇到需要该变量的字节码指令时会执行该操作。
- assign：作用于工作内存，将从执行引擎接收到的值赋值给工作内存变量，每当JVM遇到一个给变量赋值字节码指令时会执行该操作。
- store：作用于工作内存，将赋值完毕的工作变量的值写回给主内存。
- write：作用于主内存，将store传输过来的变量值赋值给主内存中的变量。
- 由于上述6条只能保证单条指令的原子性，针对多条指令的组合性原子保证，没有大面积加锁，所以，JVM提供了另外两个原子指令：
  - lock：作用于主内存，将一个变量标记为一个线程独占的状态，只是写时候加锁，就只是锁了写变量的过程。
  - unlock：作用于主内存，把一个处于锁定状态的变量释放，然后才能被其他线程占用。

6.14 没有原子性的code

class MyNumber {
    volatile int number;
 
    public void addPlusPlus() {
        number++;
    }
}
 
/**
 * @auther zzyy
 * @create 2022-02-23 16:54
 */
public class VolatileNoAtomicDemo {
    public static void main(String[] args) {
        MyNumber myNumber = new MyNumber();
 
        for (int i = 1; i <= 10; i++) {
            new Thread(() -> {
                for (int j = 1; j <= 1000; j++) {
                    myNumber.addPlusPlus();
                }
            }, String.valueOf(i)).start();
        }
 
        //暂停几秒钟线程
        try {
            TimeUnit.SECONDS.sleep(2);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
 
        System.out.println(myNumber.number);
    }
}

6.15 读取赋值一个普通变量的情况

当线程1对主内存对象发起read操作到write操作第一套流程的时间里，线程2随时都有可能对这个主内存对象发起第二套操作。

6.16 不保证原子性

对于volatile变量具备可见性，JVM只是保证从主内存加载到线程工作内存的值是最新的，也仅是数据加载时是最新的。但是多线程环境下，“数据计算“和”数据赋值”操作可能多次出现，若数据在加载之后，若主内存volatile修饰变量发生修改之后，线程工作内存中的操作将会作废去读主内存最新值，操作出现写丢失问题。即各线程私有内存和主内存公共内存中变量不同步，进而导致数据不一致。由此可见volatile解决的是变量读时的可见性问题，但无法保证原子性，对于多线程修改主内存共享变量的场景必须使用加锁同步。

6.17 从i++的字节码角度说明

原子性指的是一个操作是不可中断的，即使是在多线程环境下，一个操作一旦开始就不会被其他线程影响。
如果第二个线程在第一个线程读取旧值和写回新值期间读取i的域值，那么第二个线程就会与第一个线程一起看到同一个值，并执行相同值的加1操作，这也就造成了线程安全失败，因此对于add方法必须使用synchronized修饰以便保证线程安全。

6.18 volatile变量不适合参与到依赖当前值的运算

6.19 JVM的字节码，i++分成三步，间隙期不同步非原子操作（i++）

对于volatile变量，JVM只是保证从主内存加载到线程工作内存的值是最新的，也只是数据加载时是最新的。如果第二个线程在第一个线程读取旧值和写回新值期间读取i的域值，也就造成了线程安全问题。

6.20 指令禁重排的说明与案例

重排序
- 重排序是指编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段，有时候会改变程序语句的先后顺序不存在数据依赖关系，可以重排序；存在数据依赖关系，禁止重排序。
- 但重排后的指令绝对不能改变原有的串行语义！这点在并发设计中必须要重点考虑！
重排序的分类和执行流程
- 编译器优化的重排序：编译器在不改变单线程串行语义的前提下，可以重新调整指令的执行顺序。
- 指令级并行的重排序：处理器使用指令级并行技术来讲多条指令重叠执行，若不存在数据依赖性，处理器可以改变语句对应机器指令的执行顺序。
- 内存系统的重排序：由于处理器使用缓存和读/写缓冲区，这使得加载和存储操作看上去可能是乱序执行。
数据依赖性：若两个操作访问同一变量，且这两个操作中有一个为写操作，此时两操作间就存在数据依赖性。
案例：
- 不存在数据依赖关系，可以重排序===>重排序OK。
- 若存在数据依赖关系，禁止重排序===>重排序发生，会导致程序运行结果不同。
- 编译器和处理器在重排序时，会遵守数据依赖性，不会改变存在依赖关系的两个操作的执行，但不同处理器和不同线程之间的数据性不会被编译器和处理器考虑，其只会作用于单处理器和单线程环境，下面三种情况，只要重排序两个操作的执行顺序，程序的执行结果就会被改变。

6.21 volatile有关的禁止指令重排的行为

6.22 指令禁重排的Code说明

6.23 状态标志，判断业务是否结束

public class VolatileSeeDemo {
    static volatile boolean flag = true;
 
    public static void main(String[] args) {
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t -----come in");
            while (flag) {
 
            }
            System.out.println(Thread.currentThread().getName() + "\t -----flag被设置为false，程序停止");
        }, "t1").start();
 
        //暂停几秒钟线程
        try {
            TimeUnit.SECONDS.sleep(2);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
 
        flag = false;
 
        System.out.println(Thread.currentThread().getName() + "\t 修改完成flag: " + flag);
    }
}

6.24 开销较低的读，写锁策略

6.25 DCL双端锁的发布问题

6.26 单线程看问题代码

单线程环境下（或者说正常情况下），在”问题代码处”，会执行如下操作，保证能获取到已完成初始化的实例。

6.27 多线程看问题代码

隐患：多线程环境下，在”问题代码处”，会执行如下操作，由于重排序导致2，3乱序，后果就是其他线程得到的是null而不是完成初始化的对象。
这种场景在著名的双重检查锁定（double-checked-locking）中会出现：
- 其中第3步中实例化Singleton分多步执行（分配内存空间、初始化对象、将对象指向分配的内存空间），某些编译器为了性能原因，会将第二步和第三步进行重排序（分配内存空间、将对象指向分配的内存空间、初始化对象）。这样，某个线程可能会获得一个未完全初始化的实例。