1.Nginx源码分析 - HTTP模块篇 - HTTP模块的源码初始化
2.Tomcat处理http请求之源码分析 | 京东云技术团队
3.OkHttp3源码详解之 okhttp连接池复用机制(一)
4.Nginx源码分析—HTTP模块之TCP连接建立过程详解
5.HTTP连接池及源码分析(二)
6.Nginx源码分析 - HTTP模块篇 - TCP连接建立过程
Nginx源码分析 - HTTP模块篇 - HTTP模块的初始化
本章开始深入分析Nginx的HTTP模块,重点关注初始化过程。模板
HTTP模块初始化主要在src/http/nginx_http.c文件中的源码ngx_http_block函数完成。
理解HTTP模块初始化前,模板先审视nginx.conf中HTTP大模块配置。源码配置包括四层结构,模板源码和高清的区别最外层的源码http模块是核心模块,类型NGX_CORE_MODULE,模板属于Nginx的源码基本组件。
核心模块启动时,模板会调用http模块配置解析指令函数:ngx_http_block。源码通过该函数解析配置文件,模板实现初始化。源码
在阅读本章前,模板建议回顾Nginx源码分析 - 主流程篇 - 解析配置文件,源码以便更好地理解配置文件解析过程。
接下来,将详细解析ngx_http_block函数,重点关注其在初始化过程中的作用。下一章将深入探讨:ngx_http_optimize_servers。
对于希望深入学习Linux C/C++开发、后端、音视频、游戏、嵌入式、高性能网络、存储、基础架构、安全等领域的读者,推荐免费学习资源:Linux C/C++开发(后端/音视频/游戏/嵌入式/高性能网络/存储/基础架构/安全)。关注群获取学习资料(资料涵盖C/C++、Linux、golang技术、Nginx、ZeroMQ、sift拼接源码MySQL、Redis、fastdfs、MongoDB、ZK、流媒体、CDN、P2P、K8S、Docker、TCP/IP、协程、DPDK、ffmpeg等),免费分享。
Tomcat处理http请求之源码分析 | 京东云技术团队
本文将从请求获取与包装处理、请求传递给 Container、Container 处理请求流程,这 3 部分来讲述一次 http 穿梭之旅。
在 tomcat 组件 Connector 启动时,会监听端口。以 JIoEndpoint 为例,在 Acceptor 类中,socket = serverSocketFactory.acceptSocket (serverSocket); 与客户端建立连接,将连接的 socket 交给 processSocket (socket) 来处理。在 processSocket 中,对 socket 进行包装,交给线程池处理。
线程池中的 SocketProcessor 任务,将 socket 交给 handler 处理,此 handler 为 HttpConnectionHandler 的实例。在 HttpConnectionHandler 的父类 process 方法中,根据请求的状态,创建 HttpProcessor 进行相应的参赛网站源码处理,然后切到 HttpProcessor 的父类 AbstractHttpProccessor 中。
在 SocketProcessor 中,从 socket 获取请求数据,进行 keep-alive 处理,数据包装等操作,最终将处理后的请求信息交给了 CoyoteAdapter 的 service 方法。
CoyoteAdapter 的 service 方法中有两个主要任务:一是将 org.apache.coyote.Request 和 org.apache.coyote.Response 转换为继承自 HttpServletRequest 的 org.apache.catalina.connector.Request 和 org.apache.catalina.connector.Response,同时定位到 Context 和 Wrapper。二是将请求交给 StandardEngineValve 处理。
在 postParseRequest 方法中,request 通过 URI 的信息找到属于自己的 Context 和 Wrapper。Mapper 保存了所有的容器信息,初始化时将所有容器添加到了 mapper 中。容器信息的变化由 MapperListener 监听,一旦容器发生变化,MapperListener 将其作为监听者进行处理。
找到请求对应的 Context 和 Wrapper 后,CoyoteAdapter 将包装好的请求交给 Container 处理。从下面的代码片段,我们很容易追踪整个 Container 的调用链,形成时间线图。
最终,StandardWrapperValve 将请求交给 Servlet 处理完成,至此一次 http 请求处理完毕。
OkHttp3源码详解之 okhttp连接池复用机制(一)
提高网络性能优化,关键在于降低延迟和提升响应速度。
在浏览器中发起请求时,header部分通常如下所示:
keep-alive是指浏览器与服务端之间保持长连接,这种连接可以复用。在HTTP1.1中,它默认是开启的。
连接复用为何能提高性能?通常,在发起http请求时,我们需要完成TCP的奇迹源码打包三次握手、传输数据,最后释放连接。三次握手的过程可以参考这里:TCP三次握手详解及释放连接过程。
一次响应的过程:
在高并发的请求连接情况下或同一客户端多次频繁的请求操作中,无限制地创建连接会导致性能低下。
如果使用keep-alive,在timeout空闲时间内,连接不会关闭,相同的重复请求将复用原有的connection,减少握手的次数,大幅提高效率。
并非keep-alive的timeout设置时间越长,性能就越好。长时间不关闭会导致过多的僵尸连接和泄露连接出现。
那么,OkHttp3在客户端是如何实现类似keep-alive的机制的?
连接池的类位于okhttp3.ConnectionPool。我们的目标是了解如何在timeout时间内复用connection,并有效地对其进行回收清理操作。
其成员变量代码片段:
excutor:线程池,用于检测闲置socket并进行清理。
connections:connection缓存池。Deque是一个双端列表,支持在头尾插入元素,这里用作LIFO(后进先出)堆栈,多用于缓存数据。
routeDatabase:用于记录连接失败的router。
2.1 缓存操作:
ConnectionPool提供对Deque进行操作的方法,包括put、get、connectionBecameIdle、evictAll等操作,分别对应放入连接、获取连接、移除连接、mars库源码移除所有连接操作。
2.2 连接池的清理和回收:
在观察ConnectionPool的成员变量时,我们了解到一个Executor线程池用于清理闲置的连接。注释中这样解释:
Background threads are used to cleanup expired connections
我们在put新连接到队列时,会先执行清理闲置连接的线程。调用的正是executor.execute(cleanupRunnable);方法。观察cleanupRunnable:
线程中不停调用Cleanup清理的动作并立即返回下次清理的间隔时间。继而进入wait等待之后释放锁,继续执行下一次的清理。所以可能理解成它是个监测时间并释放连接的后台线程。
了解cleanup动作的过程。这里就是如何清理所谓闲置连接的流程。怎么找到闲置的连接是主要解决的问题。
在遍历缓存列表的过程中,使用连接数目inUseConnectionCount和闲置连接数目idleConnectionCount的计数累加值都是通过pruneAndGetAllocationCount()是否大于0来控制的。那么很显然,pruneAndGetAllocationCount()方法就是用来识别对应连接是否闲置的。>0则不闲置,否则就是闲置的连接。
进入观察:
好了,原先存放在RealConnection中的allocations派上用场了。遍历StreamAllocation弱引用链表,移除为空的引用,遍历结束后返回链表中弱引用的数量。所以可以看出List>就是一个记录connection活跃情况的List。>0表示活跃,=0表示空闲。StreamAllocation在列表中的数量就是物理socket被引用的次数。
解释:StreamAllocation被高层反复执行aquire与release。这两个函数在执行过程中其实是在一直在改变Connection中的List大小。
搞定了查找闲置的connection操作,我们回到cleanup的操作。计算了inUseConnectionCount和idleConnectionCount之后,程序又根据闲置时间对connection进行了一个选择排序,选择排序的核心是:
通过对比最大闲置时间选择排序可以方便地查找出闲置时间最长的一个connection。如此一来,我们就可以移除这个没用的connection了!
总结:清理闲置连接的核心主要是引用计数器List>和选择排序算法以及excutor的清理线程池。
Nginx源码分析—HTTP模块之TCP连接建立过程详解
Nginx源码中HTTP模块的TCP连接建立过程详细解析如下:
首先,监听套接字的初始化由ngx_http_optimize_servers函数负责,这个函数在HTTP模块的初始化过程中起关键作用,通过ngx_http_init_listening和ngx_http_add_listening函数创建并设置监听套接字,根据服务器配置的每个IP地址和端口进行。
在main函数的ngx_init_cycle()中,通过ngx_open_listening_sockets调用了一系列设置,包括非阻塞模式、缓冲区大小、绑定和监听等。HTTP模块的优先级高于Event模块,HTTP模块初始化后,会调用ngx_http_init_connection,为每个客户端连接设置初始化处理函数。
Event模块的初始化则通过ngx_event_process_init函数,每个worker进程都会调用它,设置接收连接的回调函数为ngx_event_accept。当客户端连接时,Nginx会进入事件循环,检测到读事件会调用ngx_event_accept,进一步处理连接请求。
调用ngx_event_accept后,会创建ngx_connection_t结构,并将最初的读取事件回调改为ngx_http_wait_request_handler,后续的客户端读取事件都将通过这个函数处理。这意味着ngx_http_wait_request_handler成为了HTTP模块数据处理的入口点。
整个连接过程可以用以下流程图概括:
1. 初始化监听套接字
2. 设置套接字选项和回调函数
3. 客户端连接时,调用ngx_event_accept
4. ngx_http_init_connection处理连接并修改回调
5. 客户端读取事件通过ngx_http_wait_request_handler处理
以上是Nginx连接建立过程的核心步骤。
HTTP连接池及源码分析(二)
本文将深入分析HTTP连接池的执行原理和源码实现,通过解决关键问题来理解其设计思路和优化策略。
首先,我们关注的是连接池中角色的抽象和交互:它如何通过建造者模式构建HttpClient,特别是HttpClientBuilder的使用,使配置灵活且隐藏内部复杂性。建造者模式允许我们按需配置属性,提高代码可读性。
接下来,HTTP Request的执行流程中,HttpClient如何通过责任链模式处理高并发下的同步问题。执行链包括多个执行器,如MainClientExec、ProtocolExec等,它们遵循责任链模式,形成一个执行链条,确保请求按顺序传递和处理。
连接池的核心结构包括PoolEntry,它以HttpRoute为单位,包含连接状态信息。时间参数如timeToLive和expiry影响连接可用性。连接池的管理涉及连接的分配和回收,如优先使用已使用连接,通过Future对象管理线程阻塞和唤醒机制。
理解了连接池的结构后,我们探讨了连接的分配和回收策略,包括异步操作和线程等待队列的使用。如何保持连接、设置keep-alive时间和检测连接状态是关键环节,以确保连接的有效性和性能。
实践中,遇到的问题如连接池中的底层连接关闭问题,可能源于连接池配置不当或未考虑服务器端的keep-alive策略。设置合理的超时参数、最大连接数和使用原子类来保证并发安全是优化重点。
最后,我们提出个人疑问,为何在某些场景下使用了原子类,以及等待线程唤醒的顺序问题。这些问题有助于深入理解连接池的内部机制和优化空间。
Nginx源码分析 - HTTP模块篇 - TCP连接建立过程
Nginx源码分析 - HTTP模块篇 - TCP连接建立过程
在上一章节中,我们已经了解了HTTP模块的初始化过程。本章节将深入剖析监听套接字的初始化函数以及Nginx连接的全程流程。 首先, ngx_http_optimize_servers 是关键函数,它负责Nginx服务监听套接字的优化配置。这个函数在Nginx启动时,会初始化并优化服务器的侦听策略。 紧接着, ngx_http_init_listening 和 ngx_http_add_listening 函数共同作用,创建和设置监听套接字(listening),为后续的网络连接做好准备。 理解了Event模块的进程初始化后,结合 ngx_http_optimize_servers 的工作,我们可以构建出Nginx连接的完整流程图。这个流程涉及服务器的监听,客户端的请求,以及两者之间的TCP连接建立。 让我们通过下面的流程概述来直观地理解:服务器通过 ngx_http_optimize_servers 函数设置监听套接字,等待客户端连接请求。
当客户端发起连接时,Nginx通过 ngx_http_add_listening 创建新的TCP连接。
通过Event模块的事件驱动,Nginx接收并处理客户端的HTTP请求,开始HTTP会话。
Nginx源码分析 - HTTP模块篇 - HTTP Request解析过程
深入解析Nginx HTTP模块的HTTP Request解析过程,从ngx_http_wait_request_handler函数开始,直至解析完成。解析流程如下:
首先,Nginx通过ngx_http_wait_request_handler等待HTTP请求数据,设计亮点在于其能连续等待TCP管道中的数据,直至触发read事件,且在未读取数据时自动清理buf内存,有效防止内存暴涨。
接下来,ngx_http_process_request_line与ngx_http_read_request_header共同解析请求行与头部信息。其中,ngx_http_read_request_header使用系统的recv函数循环接收数据,通过回调函数os/ngx_recv完成。
随后,ngx_http_process_request_headers负责解析HTTP头部数据,如Host与Accept-Language等。
ngx_http_process_request设定了read和write的回调函数ngx_http_request_handler,通过状态机判断事件类型,调用HTTP模块的filter链,包括header和body链两部分。filter链中,ngx_http_request_handler根据事件状态调用相应的回调函数。
解析过程中,ngx_http_run_posted_requests用于处理子请求,将请求链内容合并到主请求上,尽管此过程可能会稍降性能,因为需要重新走一遍write的回调函数ngx_http_core_run_phases。
最后,解析过程的核心在于ngx_http_handler函数,该函数主要用于设置write事件回调函数,即ngx_http_core_run_phases。
至此,完整的HTTP Request解析流程在Nginx的HTTP模块中得以清晰展现。
HTTP服务器的本质:tinyhttpd源码分析及拓展
经过一段时间的准备,我将分享对小巧轻便的HTTP服务器tinyhttpd的源码分析心得。这个只有约行C代码的项目,为我们揭示了HTTP服务器工作原理的核心。首先,让我们了解一下HTTP请求的基本结构。
HTTP请求由起始行、消息头和请求正文三部分构成。起始行包括请求方法(如GET或POST)、请求的URI和HTTP版本,例如:"GET /index.html HTTP/1.1"。GET用于获取网页内容,POST用于提交表单数据。下面,我们逐步深入tinyhttpd的源码结构。
在源码分析中,推荐的阅读顺序为:main -> startup -> accept_request -> execute_cgi。通过这个路径,我们可以跟随浏览器和tinyhttpd之间的交互过程。我已经将详细的注释版源码上传至GitHub,包含了一些针对Linux环境的修改说明,可以在我的GitHub仓库中获取。
在TinyHTTPD的示例中,你可以尝试在编译后的程序上运行,如在浏览器中访问。此外,我还演示了如何使用Python编写CGI脚本,以扩展服务器功能。通过创建一个简单的register.html表单和对应的register.cgi脚本,你可以亲手体验CGI程序的运作过程。