Linux系统I/O模型详解
前言
本文从基本的原理上了解用户空间、内核空间、进程上下文、及系统的五种常用I/O模型,加深对Linux系统的理解。 1. 概念说明1.1 用户空间与内核空间? 现在操作系统都是采用虚拟存储器,那么对32位操作系统而言,它的寻址空间(虚拟存储空间)为4G(2的32次方)。操心系统的核心是内核,独立于普通的应用程序,可以访问受保护的内存空间,也有访问底层硬件设备的所有权限。为了保证用户进程不能直接操作内核,保证内核的安全,操心系统将虚拟空间划分为两部分,一部分为内核空间,一部分为用户空间。针对linux操作系统而言,将最高的1G字节(从虚拟地址0xC0000000到0xFFFFFFFF),供内核使用,称为内核空间,而将较低的3G字节(从虚拟地址0x00000000到0xBFFFFFFF),供各个进程使用,称为用户空间。每个进程可以通过系统调用进入内核,因此,Linux内核由系统内的所有进程共享。于是,从具体进程的角度来看,每个进程可以拥有4G字节的虚拟空间。空间分配如下图所示: 有了用户空间和内核空间,整个linux内部结构可以分为三部分,从最底层到最上层依次是:硬件-->内核空间-->用户空间。如下图所示: 需要注意的细节问题: (1) 内核空间中存放的是内核代码和数据,而进程的用户空间中存放的是用户程序的代码和数据。不管是内核空间还是用户空间,它们都处于虚拟空间中。 (2) Linux使用两级保护机制:0级供内核使用,3级供用户程序使用。 内核态与用户态: (1)当一个任务(进程)执行系统调用而陷入内核代码中执行时,称进程处于内核运行态(内核态)。此时处理器处于特权级最高的(0级)内核代码中执行。当进程处于内核态时,执行的内核代码会使用当前进程的内核栈。每个进程都有自己的内核栈。 (2)当进程在执行用户自己的代码时,则称其处于用户运行态(用户态)。此时处理器在特权级最低的(3级)用户代码中运行。当正在执行用户程序而突然被中断程序中断时,此时用户程序也可以象征性地称为处于进程的内核态。因为中断处理程序将使用当前进程的内核栈。 参考资料:http://www.cnblogs.com/Anker/p/3269106.html 1.2 进程切换为了控制进程的执行,内核必须有能力挂起正在CPU上运行的进程,并恢复以前挂起的某个进程的执行。这种行为被称为进程切换。因此可以说,任何进程都是在操作系统内核的支持下运行的,是与内核紧密相关的。 从一个进程的运行转到另一个进程上运行,这个过程中经过下面这些变化:
1.3 阻塞与非阻塞关注的是调用者等待被调用者返回调用结果时的状态。
1.4 同步与异步关注的是消息通知机制、状态;
1.5 文件描述符文件描述符(File descriptor)是计算机科学中的一个术语,是一个用于表述指向文件的引用的抽象化概念。 文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符。在程序设计中,一些涉及底层的程序编写往往会围绕着文件描述符展开。但是文件描述符这一概念往往只适用于UNIX、Linux这样的操作系统。 1.6 缓存I/O缓存 I/O 又被称作标准 I/O,大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中,操作系统会将 I/O 的数据缓存在文件系统的页缓存( page cache )中,也就是说,数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。 缓存 I/O 的缺点: 2. 常用模型介绍
从磁盘上的一次read操作;用户发起IO调用 用户空间进程无法直接访问硬件; 进程无法直接访问内核缓冲区; 1)用户空间的进程向linux内核发起IO调用(读取文件)请求; 2)内核从磁盘中读取数据;(等待数据完成阶段。) 3)内核将数据加载至内核缓冲区;(等待数据完成阶段。) 4)内核在将内核缓冲区中的数据复制到用户空间中的进程内存中(真正执行IO过程的阶段) 2.1 阻塞式I/O:blocking I/O
阻塞式I/O整个过程图如下: 第一阶段(阻塞):
第二阶段(阻塞):
特点:I/O执行的两个阶段进程都是阻塞的。 优点: ? 1)能够及时的返回数据,无延迟; ? 2)程序简单,进程挂起基本不会消耗CPU时间; 缺点: ? 1)I/O等待对性能影响较大; ? 2)每个连接需要独立的一个进程/线程处理,当并发请求量较大时为了维护程序,内存、线程和CPU上下文切换开销较大,因此较少在开发环境中使用。 2.2 非阻塞式I/O:non-blocking I/O
非阻塞式I/O模型的整个过程图如下: 第二阶段(非阻塞):
第二阶段(阻塞):
特点:non-blocking I/O模式需要不断的主动询问kernel数据是否已准备好。 优点:进程在等待当前任务完成时,可以同时执行其他任务;进程不会被阻塞在内核等待数据过程,每次发起的I/O请求会立即返回,具有较好的实时性; 缺点:不断的轮询将占用大量的CPU时间,系统资源利用率大打折扣,影响性能,整体数据的吞吐量下降;该模型不适用web服务器;
2.3 I/O 复用:I/O multiplexing
I/O复用模型的整个过程图如下: 第一阶段(阻塞在select/poll之上):
第二阶段(阻塞):
特点:通过一种机制能同时等待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个变为可读就绪状态,select()/poll()函数就会返回。 优点:可以基于一个阻塞对象,同时在多个描述符上可读就绪,而不是使用多个线程(每个描述符一个线程),即能处理更多的连接;这样可以节省更多的系统资源。 缺点:如果处理的连接数不是很多的话,使用select/poll的web server不一定比使用multi-threading + blocking I/O的web server性能更好;反而可能延迟还更大;原因在于,处理一个连接数需要发起两次system call; 2.4 信号驱动式I/O:signal driven I/O
信号驱动式I/O的整个过程图如下: 第一阶段(非阻塞):
第二阶段(阻塞):
特点:借助socket进行信号驱动I/O并建立SIGIO信号处理函数 优点:线程并没有在第一阶段(数据等待)时被阻塞,提高了资源利用率; 缺点: ? 1)在程序的实现上比较困难; ? 2)信号 I/O 在大量 IO 操作时可能会因为信号队列溢出导致没法通知。信号驱动 I/O 尽管对于处理 UDP 套接字来说有用,即这种信号通知意味着到达一个数据报,或者返回一个异步错误。但是,对于 TCP 而言,信号驱动的 I/O 方式近乎无用,因为导致这种通知的条件为数众多,每一个来进行判别会消耗很大资源,与前几种方式相比优势尽失。 信号通知机制:
2.5 异步I/O:asynchronous I/O
异步I/O模型的整个过程图如下: 第一阶段(非阻塞):
第二阶段(非阻塞):
特点:第一阶段和第二阶段都是有内核完成 优点:能充分利用DMA的特性,将I/O操作与计算重叠,提高性能、资源利用率与并发能力 缺点: ? 1)在程序的实现上比较困难; ? 2)要实现真正的异步 I/O,操作系统需要做大量的工作。目前 Windows 下通过 IOCP 实现了真正的异步 I/O。而在 Linux 系统下,Linux 2.6才引入,目前 AIO 并不完善,因此在 Linux 下实现高并发网络编程时都是以 复用式I/O模型为主。 3. 五种I/O模型总结阻塞式I/O与非阻塞式I/O的区别: 阻塞式I/O会一直阻塞对应的进程,直至操作完成; 非阻塞式I/O在内核还在准备数据的情况下,会立即返回“error”给对应的进程; 同步I/O和异步I/O的区别: 根据POSIX中的定义:
两者的区别就在于,同步I/O在“I/O operation” 会将进程阻塞。按照这个定义,并根据图-7和图-8所示,阻塞式I/O、非阻塞式 I/O、I/O 复用、信号驱动式I/O都属于同步I/O; 这里需要注意的是,非阻塞式I/O并没有在第一阶段并没有阻塞,但是POSIX中定义的“I/O operation” 只指的整个I/O操作,即recvfrom这个system call的时候。如果数据报没准备好,不会阻塞进程,一旦数据准备好,recvfrom将内核缓冲区中将数据报拷贝到用户进程时,这个时候进程是被阻塞的;因此,阻塞式I/O属于同步I/O 异步I/O则不一样,当进程发起I/O调用请求后,内核立即返回,进程也不会管这个I/O操作了。直到内核发送通知信号给进程,通知进程数据报已复制到用户进程,进程直接进进程缓冲区处理数据;因此,进程整个过程一直没有被阻塞。 如图-7、图-8所示 <center>图-7</center> 图-8 这五种 I/O 模型中,前四种属于同步 I/O,因为其中真正的 I/O 操作(recvfrom)将阻塞进程/线程,只有异步 I/O 模型才与 POSIX 定义的异步 I/O 相匹配。 4. select/poll/epoll对比select/poll/epoll对比,如下图所示 其中,遍历相当于查看所有的位置,回调相当于查看对应的位置 Select POSIX所规定,目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,本质上是通过设置或者检查存放fd标志位的数据结构来进行下一步处理 缺点:
cat /proc/sys/fs/file-max
poll 本质上和select没有区别,它将用户传入的数组拷贝到内核空间,然后查询每个fd对应的设备状态
epoll 在Linux2.6内核中提出的select和poll的增强版本
优点:
5. httpd和nginx使用的模型?5.1 httpd使用的模型:prefork模型是复用性I/O模型,以多进程的方式处理请求; worker模型是复用性I/O模型,只能不过是以多进程多线程的方式处理请求。 event模型是使用的信号驱动式I/O模型,httpd2.4也实现异步I/O模型。 5.2 nginx使用的模型:nginx一开始设计就是基于信号驱动式I/O模型,使用边缘触发来实现,所以并发能力强、性能好,并且支持异步I/O 能完成基于mmap内存映射机制完成数据的发放。 完! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |