线程池EventLoopGroup源码分析

Reactor 模型

Reactor 模型是一种经典的线程模型，广泛应用于高性能网络服务器开发。一般分为以下三种类型：

Reactor 单线程模型
Reactor 多线程模型
Reactor 主从多线程模型

Reactor 单线程模型

Reactor 单线程模型是指所有的 I/O 操作，包括 Acceptor 操作（接受连接）和 Handler 操作（业务处理），都由一个线程完成。

Netty 中 Reactor 单线程的实现：

ServerBootstrap b = new ServerBootstrap();
// 创建只有一个线程的线程池
EventLoopGroup group = new NioEventLoopGroup(1);    
// Acceptor 操作和 Handler 操作共用 group 线程池中的一个线程
b.group(group);

适用场景与局限性：
单线程模型适用于小容量、低并发的应用场景，对于高负载、高并发的场景并不适用，主要原因如下：

性能瓶颈： 如果 Handler 操作是计算密集型操作，在高并发情况下，即便 CPU 负荷达到 100% 也可能无法完成海量数据的处理，造成消息堆积和处理延迟。
阻塞风险： 如果 Handler 操作中出现阻塞，可能会导致 Acceptor 操作无法进行，进而导致客户端连接超时，服务端无法接收新的客户端连接。
可靠性问题： 一旦单线程程序跑飞或者进入死循环，就会导致整个模块不可用，无法接收和处理外部消息，造成系统不可靠。

Reactor 多线程模型

Reactor 多线程模型是指专门有一个线程处理 Acceptor 操作（服务端的监听和客户端连接请求的处理），而具体的 Handler 操作（数据具体处理）则交由线程池处理。

在 Reactor 多线程模型中，服务端可以同时处理多条链路数据，但是一条链路（即一个 Channel）只对应一个线程，通道数据的整个处理流程全部由这个线程完成。

Netty 中 Reactor 多线程模型的实现：

ServerBootstrap b = new ServerBootstrap();
// 创建只有一个线程的线程池，用于处理连接请求
EventLoopGroup bossGroup = new NioEventLoopGroup(1);    
// 创建多线程线程池，用于处理 I/O 操作
EventLoopGroup workGroup = new NioEventLoopGroup();    
b.group(bossGroup, workGroup);

模型特点：

一个线程用于监听服务端，处理客户端的连接请求。
具体的 I/O 操作由线程池负责，线程池中的一个任务队列和 N 个可用线程用于负责消息的读取发送、编码解码等数据处理操作。
一条链路（Channel）的处理由线程池中的一个线程服务，防止发生并发操作问题。

适用场景：
Reactor 多线程模型适用于大多数情景。但是在个别情境下，一个线程负责服务端的监听和多个客户端的连接请求可能出现性能问题。例如，在处理客户端连接请求时要对客户端的握手进行安全认证，若安全认证过程非常消耗性能，就可能造成单线程处理性能上的不足。

Reactor 主从多线程模型

Reactor 主从多线程模式是指不再由一个线程独立处理客户端的连接请求，而是由一个线程池（Acceptor 线程池）仅仅用于客户端的登录、握手和验证等。一旦链路建立成功，就将链路的处理交由 SubReactor 线程池，由线程池中的线程进行后续的 I/O 操作。

Netty 中 Reactor 主从多线程模型的实现：

ServerBootstrap b = new ServerBootstrap();
// 创建多线程线程池，用于处理连接请求
EventLoopGroup bossGroup = new NioEventLoopGroup();    
// 创建多线程线程池，用于处理 I/O 操作
EventLoopGroup workGroup = new NioEventLoopGroup();    
b.group(bossGroup, workGroup);

模型对比：
服务端 Acceptor 操作主要包括服务端监听和客户端连接请求处理两部分。

在 Reactor 多线程模型 下，服务端监听和处理客户端连接请求这两部分都由一个线程解决。
在 Reactor 主从多线程模型 下，如果存在客户端的验证，则处理客户连接请求部分会交由线程池处理，从而提升连接建立阶段的并发能力。

EventLoopGroup 线程池的初始化

在 Bootstrap 启动辅助类中实例化 EventLoopGroup：

ServerBootstrap b = new ServerBootstrap();
EventLoopGroup bossGroup = new NioEventLoopGroup(); 
EventLoopGroup workGroup = new NioEventLoopGroup();
b.group(bossGroup, workGroup);

NioEventLoopGroup 最终都是调用父类 MultithreadEventLoopGroup 的构造器：

protected MultithreadEventLoopGroup(int nThreads, ThreadFactory threadFactory, Object... args) {
    super(nThreads == 0 ? DEFAULT_EVENT_LOOP_THREADS : nThreads, threadFactory, args);
}

如果传入的线程数量是 0，则设置为默认线程数目 DEFAULT_EVENT_LOOP_THREADS。默认线程数目是：处理器核心数 * 2。

static {
    DEFAULT_EVENT_LOOP_THREADS = Math.max(1, SystemPropertyUtil.getInt(
            "io.netty.eventLoopThreads", Runtime.getRuntime().availableProcessors() * 2));
}

通过父类 MultithreadEventExecutorGroup 构造器创建 NioEventLoopGroup 实例，内部维护了一个 SingleThreadEventExecutor 类型的数组，通过 newChild() 方法进行实例化：

protected MultithreadEventExecutorGroup(int nThreads, ThreadFactory threadFactory, Object... args) {
    // 去掉了参数检查，异常处理等代码
    children = new SingleThreadEventExecutor[nThreads];
    if (isPowerOfTwo(children.length)) {
        chooser = new PowerOfTwoEventExecutorChooser();
    } else {
        chooser = new GenericEventExecutorChooser();
    }

    for (int i = 0; i < nThreads; i++) {
        children[i] = newChild(threadFactory, args);
    }
}

newChild() 方法实例化的是 NioEventLoop 类型的 EventLoop 对象：

protected EventExecutor newChild(
        ThreadFactory threadFactory, Object... args) throws Exception {
    return new NioEventLoop(this, threadFactory, (SelectorProvider) args[0]);
}

NioEventLoopGroup 内部维护着一个 NioEventLoop 类型实例数组，NioEventLoop 类的继承链如下：

NioEventLoop -> SingleThreadEventLoop -> SingleThreadEventExecutor -> AbstractScheduledEventExecutor

NioEventLoop 类继承了 SingleThreadEventExecutor 类，该类中有一个 thread 属性用来绑定本地线程：

在 SingleThreadEventExecutor 的构造器中，会通过 threadFactory.newThread 创建一个新的 Java 线程与当前 NioEventLoop 绑定。
在这个线程中所做的事情主要就是调用 SingleThreadEventExecutor.this.run() 方法。
因为 NioEventLoop 实现了这个方法，因此根据多态性，其实调用的是 NioEventLoop.run() 方法。

protected SingleThreadEventExecutor(
        EventExecutorGroup parent, ThreadFactory threadFactory, boolean addTaskWakesUp) {
    this.parent = parent;
    this.addTaskWakesUp = addTaskWakesUp;

    thread = threadFactory.newThread(new Runnable() {
        @Override
        public void run() {
            boolean success = false;
            updateLastExecutionTime();
            try {
                SingleThreadEventExecutor.this.run();
                success = true;
            } catch (Throwable t) {
                logger.warn("Unexpected exception from an event executor: ", t);
            } finally {
                // 省略清理代码
                ...
            }
        }
    });
    threadProperties = new DefaultThreadProperties(thread);
    taskQueue = newTaskQueue();
}

NioEventLoop.run() 方法是任务执行的关键，循环执行 I/O 任务和任务队列中的任务：

轮询并处理 I/O 事件
处理任务队列中事件

protected void run() {
    for (;;) {
        try {
            switch (selectStrategy.calculateStrategy(selectNowSupplier, hasTasks())) {
                case SelectStrategy.CONTINUE:
                    continue;
                case SelectStrategy.SELECT:
                    select(wakenUp.getAndSet(false));    // 轮询 I/O 事件
                    if (wakenUp.get()) {
                        selector.wakeup();
                    }
                default:
                    // fallthrough
            }
            processSelectedKeys();    // 处理 I/O 事件
            runAllTasks(...);    // 处理任务队列中事件
        } catch (Throwable t) {
            handleLoopException(t);
        }
        ...
    }
}

NioEventLoop 类继承了 AbstractScheduledEventExecutor 类，实现了 NioEventLoop 的 schedule 定时执行功能。NioEventLoop 肩负着两种任务：

作为 IO 线程，执行与 Channel 相关的 I/O 操作，包括调用 select 等待就绪的 I/O 事件、读写数据与数据的处理等。
作为 任务队列，执行 taskQueue 中的任务。例如用户调用 eventLoop.schedule 提交的定时任务也是这个线程执行的，主要用于定时心跳检测。

EventLoop 与 Channel 的关联

客户端在通过 Bootstrap 启动时会创建一个 Channel 实例并进行初始化，在初始化过程中会绑定一个 EventLoop。

调用链路如下：

bootstrap.connect() 
-> bootstrap.doConnect() 
-> AbstractBootstrap.initAndRegister() 
-> channelFactory.newChannel()  
-> group().register(channel) 
-> MultiThreadEventLoopGroup.register()

NioEventLoopGroup 调用父类的 register() 方法将获取一个 EventLoop 与通道绑定：

public ChannelFuture register(Channel channel) {
    return this.next().register(channel);
}

调用 next() 方法通过轮询的方式将通道平均地绑定到初始化的 EventLoop 数组上：

public EventExecutor next() {
    return this.executors[this.idx.getAndIncrement() & this.executors.length - 1];
}

获取得到 EventLoop 后调用 SingleThreadEventLoop 类的 register() 方法：

public ChannelFuture register(Channel channel) {
    return this.register((ChannelPromise) (new DefaultChannelPromise(channel, this)));
}

public ChannelFuture register(ChannelPromise promise) {
    ObjectUtil.checkNotNull(promise, "promise");
    promise.channel().unsafe().register(this, promise);
    return promise;
}

最终调用了 AbstractChannel#AbstractUnsafe.register 后完成了 Channel 和 EventLoop 的关联，将获取的 EventLoop 值赋值给 AbstractChannel 内的一个 eventLoop 属性：

public final void register(EventLoop eventLoop, final ChannelPromise promise) {
    // 删除条件检查
    ...
    AbstractChannel.this.eventLoop = eventLoop;

    if (eventLoop.inEventLoop()) {
        register0(promise);
    } else {
        try {
            eventLoop.execute(new OneTimeTask() {
                @Override
                public void run() {
                    register0(promise);
                }
            });
        } catch (Throwable t) {
            ...
        }
    }
}

调用 AbstractChannel 的 register0() 方法最终完成通道的注册：

private void register0(ChannelPromise promise) {
    boolean firstRegistration = neverRegistered;
    doRegister();
    neverRegistered = false;
    registered = true;
    safeSetSuccess(promise);
    pipeline.fireChannelRegistered();
    // Only fire a channelActive if the channel has never been registered. 
    // This prevents firing multiple channel actives if the channel is deregistered and re-registered.
    if (firstRegistration && isActive()) {
        pipeline.fireChannelActive();
    }
}

调用 AbstractNioChannel.doRegister() 方法将通道与 EventLoop 线程的 selector 绑定：

protected void doRegister() throws Exception {
    // 省略错误处理
    selectionKey = javaChannel().register(eventLoop().selector, 0, this);
}

EventLoop 线程启动

在通过调用 AbstractChannel#AbstractUnsafe.register 完成通道 Channel 和 EventLoop 线程绑定后，会执行 eventLoop.execute() 方法启动线程：

public final void register(EventLoop eventLoop, final ChannelPromise promise) {
    // 删除条件检查
    ...
    AbstractChannel.this.eventLoop = eventLoop;

    if (eventLoop.inEventLoop()) {
        register0(promise);
    } else {
        try {
            eventLoop.execute(new OneTimeTask() {
                @Override
                public void run() {
                    register0(promise);
                }
            });
        } catch (Throwable t) {
            ...
        }
    }
}

执行 eventLoop.execute() 方法时会判断 eventLoop 线程是否执行，如果没有执行则调用 startThread() 方法启动线程：

通过调用 inEventLoop() 方法判断 eventLoop 线程是否执行，是通过判断当前线程是 main 主线程还是 eventLoop 线程。

public void execute(Runnable task) {
    if (task == null) {
        throw new NullPointerException("task");
    }

    boolean inEventLoop = inEventLoop();
    if (inEventLoop) {
        addTask(task);
    } else {
        startThread(); // 调用 startThread 方法，启动 EventLoop 线程
        addTask(task);
        if (isShutdown() && removeTask(task)) {
            reject();
        }
    }

    if (!addTaskWakesUp && wakesUpForTask(task)) {
        wakeup(inEventLoop);
    }
}

调用 startThread() 方法启动 EventLoop 内部绑定的线程：

private void startThread() {
    if (STATE_UPDATER.get(this) == ST_NOT_STARTED) {
        if (STATE_UPDATER.compareAndSet(this, ST_NOT_STARTED, ST_STARTED)) {
            thread.start();
        }
    }
}

EventLoop 线程的运行

在 connect() 方法中通道初始化和注册时会调用 eventLoop.execute() 方法，在方法中会调用 startThread() 方法启动与 EventLoop 绑定的 Thread 线程，线程启动后受内核调度执行 run() 方法。

run() 方法中主要处理两种事件：监控 I/O 事件和处理任务队列中的 Task 任务。

protected void run() {
    for (;;) {
        boolean oldWakenUp = wakenUp.getAndSet(false);
        try {
            if (hasTasks()) {
                selectNow();
            } else {
                select(oldWakenUp);
                if (wakenUp.get()) {
                    selector.wakeup();
                }
            }

            cancelledKeys = 0;
            needsToSelectAgain = false;
            final int ioRatio = this.ioRatio;
            if (ioRatio == 100) {
                processSelectedKeys();
                runAllTasks();
            } else {
                final long ioStartTime = System.nanoTime();

                processSelectedKeys();

                final long ioTime = System.nanoTime() - ioStartTime;
                runAllTasks(ioTime * (100 - ioRatio) / ioRatio);
            }
        } catch (Throwable t) {
            ...
        }
    }
}

通过 hasTasks() 方法判断任务队列中是否有未执行的任务：

protected boolean hasTasks() {
    assert inEventLoop();
    return !taskQueue.isEmpty();
}

如果有任务则执行 selectNow() 方法立即返回。

void selectNow() throws IOException {
    try {
        selector.selectNow();
    } finally {
        // restore wakup state if needed
        if (wakenUp.get()) {
            selector.wakeup();
        }
    }
}

如果没有任务则执行 select(oldWakenUp) 方法阻塞当前线程 timeout 时间，这样可以避免长时间的线程空转。

private void select(boolean oldWakenUp) throws IOException {
    Selector selector = this.selector;
    try {
        ...
        int selectedKeys = selector.select(timeoutMillis);
        ...
    } catch (CancelledKeyException e) {
        ...
    }
}

ioRatio 参数设定用来表示 I/O 事件处理和任务队列任务处理时间的占比：

如果 ioRatio 为 100，则表示 Netty 就不考虑 I/O 耗时的占比，而是分别调用 processSelectedKeys()、runAllTasks()。
如果 ioRatio 不为 100，则表示需要根据 ioTime 以及 ioRatio 比例计算出 taskTime，计算公式为：

taskTime = ioTime * (100 - ioRatio) / ioRatio

计算出执行 task 所占用的时间，然后以此为参数调用 runAllTasks(timeout)，如果时间超出 taskTime 时间则跳出循环执行 I/O 事件：

protected boolean runAllTasks(long timeoutNanos) {
    this.fetchFromScheduledTaskQueue();
    Runnable task = this.pollTask();
    if (task == null) {
        this.afterRunningAllTasks();
        return false;
    } else {
        long deadline = ScheduledFutureTask.nanoTime() + timeoutNanos;
        long runTasks = 0L;

        long lastExecutionTime;
        while (true) {
            safeExecute(task);
            ++runTasks;
            if ((runTasks & 63L) == 0L) {
                lastExecutionTime = ScheduledFutureTask.nanoTime();
                if (lastExecutionTime >= deadline) {
                    break;
                }
            }

            task = this.pollTask();
            if (task == null) {
                lastExecutionTime = ScheduledFutureTask.nanoTime();
                break;
            }
        }

        this.afterRunningAllTasks();
        this.lastExecutionTime = lastExecutionTime;
        return true;
    }
}

IO 事件的处理

在 run() 方法中通过 processSelectedKeys() 方法处理 I/O 事件：

private void processSelectedKeys() {
    if (selectedKeys != null) {
        processSelectedKeysOptimized(selectedKeys.flip());
    } else {
        processSelectedKeysPlain(selector.selectedKeys());
    }
}

迭代 selectedKeys 获取就绪的 I/O 事件，然后为每个事件都调用 processSelectedKey 来处理它：

private void processSelectedKeysOptimized(SelectionKey[] selectedKeys) {
    for (int i = 0;; i++) {
        final SelectionKey k = selectedKeys[i];
        if (k == null) {
            break;
        }
        selectedKeys[i] = null;

        final Object a = k.attachment();

        if (a instanceof AbstractNioChannel) {
            processSelectedKey(k, (AbstractNioChannel) a);
        } else {
            @SuppressWarnings("unchecked")
            NioTask<SelectableChannel> task = (NioTask<SelectableChannel>) a;
            processSelectedKey(k, task);
        }
        ...
    }
}

在 processSelectedKey() 方法中将 I/O 事件分为三种分别进行处理：

OP_READ：可读事件，即 Channel 中收到了新数据可供上层读取。
OP_WRITE：可写事件，即上层可以向 Channel 写入数据。
OP_CONNECT：连接建立事件，即 TCP 连接已经建立，Channel 处于 active 状态。

private static void processSelectedKey(SelectionKey k, AbstractNioChannel ch) {
    final NioUnsafe unsafe = ch.unsafe();
    ...
    try {
        int readyOps = k.readyOps();

        // 可读事件
        if ((readyOps & (SelectionKey.OP_READ | SelectionKey.OP_ACCEPT)) != 0 || readyOps == 0) {
            unsafe.read();
            if (!ch.isOpen()) {
                // Connection already closed - no need to handle write.
                return;
            }
        }

        // 可写事件
        if ((readyOps & SelectionKey.OP_WRITE) != 0) {
            // Call forceFlush which will also take care of clear the OP_WRITE once there is nothing left to write
            ch.unsafe().forceFlush();
        }

        // 连接建立事件
        if ((readyOps & SelectionKey.OP_CONNECT) != 0) {
            // remove OP_CONNECT as otherwise Selector.select(..) will always return without blocking
            // See https://github.com/netty/netty/issues/924
            int ops = k.interestOps();
            ops &= ~SelectionKey.OP_CONNECT;
            k.interestOps(ops);

            unsafe.finishConnect();
        }
    } catch (CancelledKeyException ignored) {
        unsafe.close(unsafe.voidPromise());
    }
}

总结

NioEventLoopGroup 实例化过程：
- EventLoopGroup（其实是 MultithreadEventExecutorGroup）内部维护一个类型为 EventExecutor 的 children 数组，其大小是 nThreads，这样就构成了一个线程池。
- MultithreadEventExecutorGroup 中会调用 newChild 抽象方法来初始化 children 数组，抽象方法 newChild 是在 NioEventLoopGroup 中实现的，它返回一个 NioEventLoop 实例。
- 每个 Channel 通道注册时都会轮流注册到 children 数组上的一个 EventLoop 对象上。
NioEventLoop 属性：
- SelectorProvider provider 属性：NioEventLoopGroup 构造器中通过 SelectorProvider.provider() 获取一个 SelectorProvider 对象。
- Selector selector 属性：NioEventLoop 构造器中通过调用 selector = provider.openSelector() 获取一个 selector 对象。每个 EventLoop 绑定一个 selector 对象，每个 EventLoop 对应一个或者多个 Channel 通道。

说明： 本文基于 Netty 4.x 版本架构进行分析，核心原理在后续版本中保持兼容，但具体源码实现细节可能随版本迭代有所调整。

本文地址：https://1diff.fun/archives/xian-cheng-chi-eventloopgroup-yuan-ma-fen-xi.html

如果对本文有什么问题或疑问都可以在评论区留言，我看到后会尽量解答。