【从源码安装mysql】【xmemcache源码分析】【node源码阅读】netty源码-皮皮网

【从源码安装mysql】【xmemcache源码分析】【node源码阅读】netty源码

2025-01-20 10:45:42 来源：{typename type="name"/} 分类：{typename type="name"/}

1.Nettyåç-ä»NIOå¼å§
2.一次 Netty 代码不健壮导致的大量 CLOSE_WAIT 连接原因分析
3.Netty源码解析 -- FastThreadLocal与HashedWheelTimer

netty源码

Nettyåç-ä»NIOå¼å§

BIOï¼BLOCKING I/Oï¼ï¼

è¥æ¤è¯·æ±å¥é½ä¸æ³å¹²æ¤æ¶çº¿ç¨ä¼æä¹æ ·ï¼

ç±æ¤å°±åºç°äºNIO

NIOï¼new/NONBLOCKING I/Oï¼:

ä»æ¤ç¾ä¸è¿æ¥é«å¹¶åä¸æ¯é®é¢

åå°è¿ æä»¬æ¯ä¸æ¯æ³èµ·äºNettyçå¯å¨è¿ç¨

1ãå£°æä¸¤ä¸ªEventLoopGroupä¸ä¸ªä¸ºbossï¼mainReactorï¼ä¸ä¸ªä¸ºworkerï¼subReactorï¼

EventLoopGroupï¼çº¿ç¨æ± ï¼åå§åçæ¶åä¼çæï¼æå è½½ï¼æå®æ°éçEventLoopï¼çº¿ç¨ï¼è¥æ æå® åä¼çæCPUæ°X2ççº¿ç¨

2ãå£°æä¸ä¸ªå¯å¨è¾å©ç±»Bootstrapå¹¶å°EventLoopGroupæ³¨åå°å¯å¨è¾å©ç±»BootStrapä¸(bootStrap.group)

æ¥çåç»bootstrapæå®channelæ¨¡åçå±æ§ï¼åæ·»å ä¸ä¸å¡æµæ°´çº¿ï¼channelpipelineï¼å¹¶ä¸å¨pipelineä¸æ·»å ä¸ä¸å¡æä½handlerï¼ï¼éè¿channelpipelineå¯ä»¥å¯¹ä¼ å¥æ°æ®ä¸ºææ¬²ä¸ºï¼

3ãç»å®ç«¯å£

Nettyå¯å¨å®æ

è¿ä¸ªæ¶åæä»¬è¦è¿ä¹ç

æ¤æ¬¡å¤ä¸ºèªå·±è¯»æºç ä¹åççè§£ å¦æè¯¯è¯·ææ£

ææ©

åææ¿ä¸ç¬¬ä¸ä¸ªèµ

一次 Netty 代码不健壮导致的大量 CLOSE_WAIT 连接原因分析

我们线上存在一个 Dubbo 服务，遇到大量 CLOSE_WAIT 状态的连接，始终无法消失，因此进行了原因分析。

CLOSE_WAIT 状态出现在被动关闭方，收到对端 FIN 包后回复 ACK，从源码安装mysql但未发送 FIN 包之前。问题在于服务没有回复 FIN，原因可能是收到了 FIN 包却未发送响应，通过抓包验证了这一情况。

问题核心在于为什么没有回复 FIN。Dubbo 服务底层使用 Netty，作为普通的 TCP 服务端，关键在于 FIN 包的回复。

分析显示，如果服务没有发送 FIN 包，xmemcache源码分析可能原因有：

1. 半连接队列或全连接队列积压，通过 ss 命令查看全连接队列大小和等待 accept 的连接个数。

2. LISTEN 状态的 socket，Recv-Q 表示等待用户进程 accept 的连接个数，Send-Q 表示全连接队列最大容纳的连接数。

非 LISTEN 状态的 socket，Recv-Q 表示 receive queue 字节大小，Send-Q 表示 send queue 字节大小。

通过 ss 命令确认 Recv-Q 为 0，全连接队列无积压。

嫌疑指向 Netty 没有注册事件，导致收到 FIN 包后无动于衷。

进一步发现，凌晨 1 点业务实例加载大量数据导致堆内存占满，持续进行 fullgc。node源码阅读Netty 线程出现 OOM 异常。在 org.jboss.netty.channel.socket.nio.NioServerBoss#process 方法中，Netty 调用 accept 取走连接，第行尝试注册事件时抛出 java.lang.OutOfMemoryError 异常。

因此，Netty 处理不健壮，try-catch 包裹了 accept 连接和注册事件逻辑，在 OOM 异常处理时，未能成功注册事件或关闭连接，导致连接存在但不被监听处理。

推荐相关视频学习：

LinuxC++零拷贝的实现用户态协议栈 ntytcp

支撑互联网的基石 TCP/IP，5个方面全面解析

TCP/IP协议栈深度解析丨实现单机百万连接丨优化三次握手、四次挥手

LinuxC++后台服务器开发架构师免费学习地址

为模拟问题复现，可使用字节码注入或直接重构 Netty 源码。本地拥有 Netty 源码，appinventor源码下载采用重构方法更快。重新构建项目后，使用 nc 模拟健康检查握手并断开连接，CLOSE_WAIT 状态连接持续存在直至 Netty 进程退出。再次 nc 断开连接，新增 CLOSE_WAIT 状态。由于服务持续进行健康检查，导致 OOM 期间 CLOSE_WAIT 状态不断增加。

问题核心：Netty 代码不够健壮，尝试捕获异常时，未能正确处理连接注册事件或关闭连接，导致连接存在且未被监听。

修改方式：在 catch 处理 throwable 时关闭连接即可，最新版本的 Netty 代码这部分逻辑已优化，将 accept 和注册事件拆分。CMS评论源码有兴趣的读者可以尝试。

学习 TCP、网络编程是解决类似问题的关键。

Netty源码解析 -- FastThreadLocal与HashedWheelTimer

Netty源码分析系列文章接近尾声，本文深入解析FastThreadLocal与HashedWheelTimer。基于Netty 4.1.版本。

FastThreadLocal简介：

FastThreadLocal与FastThreadLocalThread协同工作。FastThreadLocalThread继承自Thread类，内部封装一个InternalThreadLocalMap，该map只能用于当前线程，存放了所有FastThreadLocal对应的值。每个FastThreadLocal拥有一个index，用于定位InternalThreadLocalMap中的值。获取值时，首先检查当前线程是否为FastThreadLocalThread，如果不是，则从UnpaddedInternalThreadLocalMap.slowThreadLocalMap获取InternalThreadLocalMap，这实际上回退到使用ThreadLocal。

FastThreadLocal获取值步骤：

#1 获取当前线程的InternalThreadLocalMap，如果是FastThreadLocalThread则直接获取，否则通过UnpaddedInternalThreadLocalMap.slowThreadLocalMap获取。

#2 通过每个FastThreadLocal的index，获取InternalThreadLocalMap中的值。

#3 若找不到值，则调用initialize方法构建新对象。

FastThreadLocal特点：

FastThreadLocal无需使用hash算法，通过下标直接获取值，复杂度为log(1)，性能非常高效。

HashedWheelTimer介绍：

HashedWheelTimer是Netty提供的时间轮调度器，用于高效管理各种延时任务。时间轮是一种批量化任务调度模型，能够充分利用线程资源。简单说，就是将任务按照时间间隔存放在环形队列中，执行线程定时执行队列中的任务。

例如，环形队列有个格子，执行线程每秒移动一个格子，则每轮可存放1分钟内的任务。任务执行逻辑如下：给定两个任务task1（秒后执行）、task2（2分秒后执行），当前执行线程位于第6格子。那么，task1将放到+6=格，轮数为0；task2放到+6=格，轮数为2。执行线程将执行当前格子轮数为0的任务，并将其他任务轮数减1。

HashedWheelTimer的缺点：

时间轮调度器的时间精度受限于执行线程的移动速度。例如，每秒移动一个格子，则调度精度小于一秒的任务无法准时调用。

HashedWheelTimer关键字段：

添加延迟任务时，使用HashedWheelTimer#newTimeout方法，如果HashedWheelTimer未启动，则启动HashedWheelTimer。启动后，构建HashedWheelTimeout并添加到timeouts集合。

HashedWheelTimer运行流程：

启动后阻塞HashedWheelTimer线程，直到Worker线程启动完成。计算下一格子开始执行的时间，然后睡眠到下次格子开始执行时间。获取tick对应的格子索引，处理已到期任务，移动到下一个格子。当HashedWheelTimer停止时，取消任务并停止时间轮。

HashedWheelTimer性能比较：

HashedWheelTimer新增任务复杂度为O(1)，优于使用堆维护任务的ScheduledExecutorService，适合处理大量任务。然而，当任务较少或无任务时，HashedWheelTimer的执行线程需要不断移动，造成性能消耗。另外，使用同一个线程调用和执行任务，某些任务执行时间过久会影响后续任务执行。为避免这种情况，可在任务中使用额外线程执行逻辑。如果任务过多，可能导致任务长期滞留在timeouts中而不能及时执行。

本文深入剖析FastThreadLocal与HashedWheelTimer的实现细节，旨在提供全面的技术洞察与实战经验。希望对您理解Netty源码与时间轮调度器有帮助。关注微信公众号，获取更多Netty源码解析与技术分享。

【从源码安装mysql】【xmemcache源码分析】【node源码阅读】netty源码

相关文章