Java volatile关键字指南

编者注：本文为历史博文归档；涉及 JDK、框架与工具链版本请以当前官方文档为准。引用外链图片可能失效，阅读时请注意时效性。

1. 概述

在缺乏必要同步的情况下，编译器、运行时或处理器可能会应用各种优化措施。尽管这些优化在大多数情况下是有益的，但有时它们也可能引发一些细微的问题。

缓存（Caching）和指令重排序（Reordering）是在并发上下文中可能使我们感到惊讶的优化措施之一。Java 和 JVM 提供了多种方法来控制内存顺序，而 volatile 关键字就是其中一种。

在本文中，我们将重点介绍 Java 语言中这个基本但经常被误解的概念——volatile 关键字。首先，我们将从底层计算机体系结构的工作背景入手，然后再熟悉 Java 中的内存顺序。

2. 共享多处理器架构

处理器负责执行程序指令。因此，它们需要从 RAM 中检索程序指令和所需的数据。

由于 CPU 每秒能够执行大量指令，因此直接从 RAM 中获取数据并不是理想的选择。为了改善这种情况，处理器使用了一些技巧，例如乱序执行、分支预测、推测执行，当然还有缓存。

以下是内存层次结构的作用示意图：

当不同的内核执行更多的指令并处理更多的数据时，它们会用更多相关的数据和指令填充其缓存。这将以提高缓存一致性挑战为代价，换取整体性能的提升。

简而言之，我们需要慎重考虑当一个线程更新缓存的值时会发生什么。

3. 何时使用 volatile

为了进一步扩展缓存一致性的概念，让我们从《Java 并发实践》（Java Concurrency in Practice）一书中借用一个示例：

public class TaskRunner {
 
    private static int number;
    private static boolean ready;
 
    private static class Reader extends Thread {
 
        @Override
        public void run() {
            while (!ready) {
                Thread.yield();
            }
 
            System.out.println(number);
        }
    }
 
    public static void main(String[] args) {
        new Reader().start();
        number = 42;
        ready = true;
    }
}

该 TaskRunner 类维护两个简单的变量。在它的 main 方法中，它创建另一个线程，只要 ready 变量为 false，就会在该变量上自旋（spin）。当变量变为 true 时，线程将打印 number 变量。

许多人可能希望此程序在短暂的延迟后仅打印 42。但是，实际上，延迟可能会更长。它甚至可能永远挂起，甚至打印为零！

这些异常的原因是缺乏适当的内存可见性和重排序。让我们对其进行更详细的评估。

3.1 内存可见性 (Memory Visibility)

在这个简单的示例中，我们有两个应用程序线程：主线程和阅读器线程。让我们想象一个场景，其中 OS 在两个不同的 CPU 内核上调度这些线程，其中：

主线程在其核心高速缓存中具有 ready 和 number 变量的副本。
阅读器线程也以其副本结尾。
主线程更新缓存的值。

在大多数现代处理器上，写请求在发出后不会立即应用。实际上，处理器倾向于将这些写操作在特殊的写缓冲区中排队。一段时间后，它们会将这些写入一次全部应用到主存储器。

综上所述，当主线程更新 number 和 ready 变量时，无法保证阅读器线程会看到什么。换句话说，读取器线程可能会立即看到更新的值，或者有些延迟，或者根本看不到！

这种内存可见性问题可能会在依赖可见性的程序中引起活跃性问题（Liveness Problem）。

3.2 指令重排序 (Reordering)

更糟的是，读取器线程可能会以实际程序顺序以外的任何顺序查看这些写入。例如，由于我们首先更新了 number 变量：

public static void main(String[] args) { 
    new Reader().start();
    number = 42; 
    ready = true; 
}

我们可能希望读取器线程打印 42。但是，实际上有可能看到零作为打印值！

重排序是一种用于提高性能的优化技术。有趣的是，不同的组件可能会应用此优化：

处理器可以按程序顺序以外的任何顺序刷新其写缓冲区。
处理器可能会应用乱序执行技术。
JIT 编译器可以通过重排序进行优化。

3.3 volatile 内存顺序

为了确保变量的更新可预测地传播到其他线程，我们应该对这些变量应用 volatile 修饰符：

public class TaskRunner {
 
    private volatile static int number;
    private volatile static boolean ready;
 
    // same as before
}

这样，我们与运行时和处理器进行通信，以不对任何涉及 volatile 变量的指令重新排序。而且，处理器知道应该立即刷新这些变量的所有更新。

4. volatile 与线程同步

对于多线程应用程序，我们需要确保一些规则以实现一致的行为：

互斥（Mutual Exclusion）：一次只有一个线程执行关键部分。
可见性（Visibility）：一个线程对共享数据所做的更改对其他线程可见，以保持数据一致性。

同步的方法和块以应用程序性能为代价提供上述两个属性。

volatile 是一个非常有用的关键字，因为它可以帮助确保数据更改的可见性，而无需提供互斥。因此，它在可以并行执行多个代码块的多个线程可以使用的地方很有用，但我们需要确保可见性属性。

5. Happens-Before 顺序

volatile 变量的内存可见性影响超出了 volatile 变量本身。

更具体地说，假设线程 A 写入一个 volatile 变量，然后线程 B 读取相同的 volatile 变量。在这种情况下，写入 volatile 变量之前 A 可见的值，将在读取 volatile 变量之后对 B 可见：

从技术上讲，对 volatile 字段的任何写入都发生在随后每次对该字段的读取之前。这是 Java 内存模型（JMM）的 volatile 变量规则。

5.1 依赖传递 (Piggybacking)

由于 Happens-Before 关系的强度（在进行内存排序之前），有时我们可以依赖另一个 volatile 变量的可见性属性。例如，在我们的特定示例中，我们只需要将 ready 变量标记为 volatile：

public class TaskRunner {
 
    private static int number; // not volatile
    private volatile static boolean ready;
 
    // same as before
}

写入 ready 变量之前，任何真正的准备可变读取之后是什么可见的准备变量。因此，number 变量搭载在 ready 变量强制执行的内存可见性上。简而言之，即使它不是一个 volatile 变量，它也表现出一个 volatile 行为。

通过使用这些语义，我们只能将类中的几个变量定义为 volatile 并优化可见性保证。

6. 结论

在本教程中，我们探索了关于 volatile 关键字及其功能的更多信息，以及从 Java 5 开始对其进行的改进。

与往常一样，可以在 Github 上找到代码示例。

说明：本文基于 Java 5 及以上版本的内存模型特性编写，具体行为请以当前 JDK 官方文档为准。

本文地址：https://1diff.fun/archives/java-volatile-guan-jian-zi-zhi-nan.html

如果对本文有什么问题或疑问都可以在评论区留言，我看到后会尽量解答。