Java I/O模型笔记

这篇博客详细梳理了I/O过程,区分了同步异步和阻塞非阻塞的概念,并介绍了Java的四种I/O模型:BIO、伪异步IO、NIO和AIO。重点讨论了各模型的优缺点,如BIO的并发限制,NIO的同步非阻塞特性,以及AIO的异步I/O操作。

学习笔记,整理I/O过程,区分同步异步,阻塞非阻塞常见概念,整理I/O模型,Java I/O模型

1. I/O 过程

我们编写的程序是运行在用户空间中,而用户空间无法直接操作内核空间,这就意味着,我们编写的程序,是无法直接访问由内核管理的I/O。因此,通常用户进程中的一次完成I/O交互应分为两个阶段:

在这里插入图片描述

  • I/O调用阶段:应用程序向内核发起系统调用
  • I/O执行阶段:
    • 等待数据阶段:内核等待I/O设备(磁盘/网络)准备数据
    • 拷贝数据阶段:将数据从内核缓存区拷贝到用户空间缓冲区

从上面这个流程我们可以发现,其实应用程序(用户进程/线程)实际上只发出了I/O操作的调用而已,后续的行为,均是由操作系统的内核完成的。而对于用户进程/线程调用I/O请求后的行为,以及当内核完成操作后,用户进程/线程如何感知,划分了不同的I/O模型。

2. 同步异步 & 阻塞非阻塞

为了更好的理解I/O模型,首先区分一下几个容易混淆的概念

同步&异步

  • 同步异步主要是看对消息结果的获取是主动发起的,还是被动调用的
  • 同步:请求是主动发起的,且主动获取请求的结果(等待IO操作完成)
  • 异步:请求是主动发起的,但是请求的结果,由服务方进行告知(不等待,由IO操作完成后通知)

具体流程图:

在这里插入图片描述

阻塞&非阻塞

阻塞与非阻塞是在描述访问某个资源时,当数据没有准备就绪时:

  • 阻塞:线程等待资源中的数据准备完成,当前线程挂起,什么都不能干,等着获取结果
  • 非阻塞:线程直接返回结果,不会持续等待,该进程仍处于运行的状态,仍可以处理其他事务。等待资源准备结束后,才响应结果

具体流程图:

在这里插入图片描述

组合整合

关于同步异步阻塞非阻塞,常见的四个组合:同步阻塞同步非阻塞异步阻塞异步非阻塞,这里直接通过举例进行理解:

假设我们去照相馆拍照,拍完照,老板说需要一些时间才能拿到照片,此时:

  • 同步阻塞:我们就在照相馆里等着,其他什么事情都不做(同步:主动询问照片是否完成,阻塞:照片完成前,无法做其他事)
  • 同步非阻塞:我们离开去做其他事情,但是时不时来询问老板照片是否已经处理完,直接拿到照片(同步:主动询问照片是否完成,非阻塞:照片完成前,可以做其他事情)
  • 异步阻塞:我们离开去了其他地方,但是没有做任何事情,一直在那里等老板的电话,直到老板打电话通知我们照片洗好了,匆匆来到照相馆拿照片(异步:由老板告知照片完成,阻塞:照片完成前,无法做其他事)
  • 异步非阻塞:我们离开去做其他事情,直到老板洗完照片,打电话通知我们照片洗好了,才再次来到照相馆拿照片(异步:由老板告知照片完成,异步:照片完成前,可以做其他事情)

3. I/O 模型

对常见I/O通信模型进行整理

3.1 阻塞I/O模型

结合第一部分I/O调用流程,即应用程序调用I/O请求之后,在内核完成两个阶段(等待数据,拷贝数据)期间,都处于被阻塞的状态,具体示意图:

在这里插入图片描述

该模型的优势,实现难度低,开发应用比较容易,对于并发量小的应用比较适合。但缺点也比较明显,如果内核数据处理时间较久,则用户线程被挂起的时间较久,浪费了性能,不适合并发量较大的应用,因为每一个I/O请求都会阻塞,将会导致大量的进程/线程处于被挂起的状态。

3.2 非阻塞I/O模型

非阻塞I/O模型,在阻塞I/O模型的基础上,将阻塞变为非阻塞,那就是用户进程在发起系统调用时指定为非阻塞,内核接收到请求后,就会立即返回,但对于操作的结果,需要由用户进程通过轮询拉取的形式来获取,具体示意图:

在这里插入图片描述

该模型相对于阻塞I/O模型,在一定程度上性能有所提升,但也存在很明显问题,用户进程需要不断地主动询问内核,造成严重的性能浪费。

3.3 多路复用I/O模型

多路复用I/O模型,多个进程的I/O可以注册到一个复用器(Selector)上,Selector会监听注册进来的所有I/O。

  • 当Selector监听的所有I/O在内核缓冲区都没有可读数据时,select调用进程会被阻塞
  • 当Selector监听的任一I/O在内核缓冲区中有刻度数据时,select调用就会返回,而后select调用的进程可以自己或通知另外的进程再次发起读取I/O,读取内核中准备好的数据

具体示意图:

在这里插入图片描述

多路复用I/O模型的优势在于它可以同时处理多个连接,相当与非阻塞I/O模型需要不断的轮询,该模型减少无效的系统调用次数,减少了对CPU资源的损耗。同时注意,数据从内核空间到用户空间,还是阻塞的。

3.4 异步I/O模型

在上面提到的几个模型中,在内核空间拷贝数据到用户空间的部分,均是阻塞的,而对于异步I/O模型,该阶段可以实现为非阻塞,具体示意图:

在这里插入图片描述

从内核的角度看,当它收到一个aio_read请求之后,它首先会立刻返回,所以对用户进程不会产生任何阻塞,内核会等到数据传输完成,并拷贝到用户空间之后,再向用户进程发送一个信息,告知aio_read操作操作。

小结

从上面的示意图,可以看出:

  • 从阻塞程度上讲:阻塞I/O模型 > 非阻塞I/O模型 > 多路复用I/O模型 > 异步I/O模型
  • 从同步/异步的角度上讲,只有异步I/O模型属于异步模型,其他的均为同步模型,即使是多路复用I/O模型

4. Java I/O模型

4.1 BIO(Blocking I/O)

  • 传统BIO是一种同步的阻塞IO,IO在进行读写时,该线程将被阻塞,线程无法进行其它操作(阻塞I/O模型)
  • 该模型下,服务端接收到客户端的请求后,为每个客户端新创建一个线程
  • 阻塞I/O模型的工作流程:在用户线程发出I/O请求之后,内核会检查数据是否就绪,此时用户线程一直阻塞等待内存数据就绪,在内存数据就绪后,内核将数据复制到用户线程中,并返回I/O执行结果到用户线程,此时用户线程将解除阻塞状态并开始处理数据

BIO的缺陷

  • 性能问题:一连接一线程的模型,导致服务端的并发接入数和系统吞吐量受到影响,在高性能服务器应用领域,往往需要面对成千上万个客户端的并发链接,这种模型显然无法满足高性能、高并发的场景
  • 可靠性问题:由于采用同步阻塞模式,当网络波动时处理缓慢回导致线程被阻塞,阻塞时间无法预测
  • 可维护性问题:IO线程数无法有效控制、资源无法有效共享(多线程并发问题),系统可维护性差

4.2 伪异步IO

以传统BIO模型为基础,通过线程池的方式维护所有的IO线程,实现相对高效的线程开销以及管理。

  • 当有新的客户端连接时,将客户端的Socket封装成一个Task,投递到一个线程池中进行处理。
  • 读取数据仍为同步阻塞等待数据,但通过线程池,实现伪异步模型(只解决线程管理的问题)

4.3 NIO(Non-Blocking I/O)

  • NIO(JDK1.4)模型是一种同步非阻塞IO,基于多路复用I/O模型实现
  • 主要有三大核心部分:Channel(通道),Buffer(缓冲区),Selector(多路复用器)
  • 传统IO基于字节流和字符流进行操作,而NIO基于Channel和Buffer进行操作,数据总是从Channel读到Buffer,或者从Buffer写入Channel中。Selector用于监听多个通道的事件。因此单个线程可以监听多个数据通道。
  • NIO一个重要的特点是:socket主要的读、写、注册和接收函数,在等待就绪阶段都是非阻塞的,真正的I/O操作是同步阻塞的

NIO的优势

  • 客户端发起的连接操作是异步的
  • SocketChannel的读写操作也是异步的
  • 线程模型的优化

4.4 AIO(Asynchronous I/O)

  • JDK 1.7(NIO2)实现
  • 内核将数据读取完毕,并放在了用户线程指定的缓冲区后,内核通知用户线程直接使用即可(异步I/O模型)

参考

  • 《Netty4核心原理与手写RPC框架实战》
  • 常见的IO模型有哪些:https://www.cnblogs.com/javaguide/p/io.html
  • IO模型知多少 | 理论篇:https://www.cnblogs.com/sheng-jie/p/how-much-you-know-about-io-models.html
  • Java NIO浅析:https://zhuanlan.zhihu.com/p/23488863
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值