IO的本质

在之前的内容中已经结束了对于网络和操作系统的学习,那么回过来再继续看IO,什么是IO呢?

对于网络的学习当中,实际上也是一种IO,数据从计算机进入到网卡,或者是从网卡中再加载回计算机,这本质上都是一种硬件级别的IO过程,当把套接字建立完毕之后,如果不进行任何输入,那么此时IO没有数据,那么就会在这里阻塞,这就是一个典型的IO中数据没有就绪的情况

以读写为例,当调用read函数的时候,如果底层的缓冲区没有数据,那么默认情况下就会在这里阻塞等待,如果想发送数据,但是缓冲区已经满了,那么此时也不能把数据进行写入,所以对于读和写的本质,其实就是从网络当中读数据,把数据写入到操作系统当中,至于怎么写,写多少,这些都是下层会帮助完成的事,但是不管怎么说,如果缓冲区为0或者以及满了,对于IO的操作都是不被允许的

IO的本质可以如何理解?IO的本质就是等待加拷贝,在绝大多数的情况下,等待的时间是要占据绝大多数的时间的,也就是说在我们IO的过程中,绝大多数的时间都是在IO,只有少部分的时间是在等待,而在普遍的认知当中,我们往往会忽略这个等待的过程,而是直接去看它拷贝的过程

所以,我们该如何看待提升IO效率这件事?提升效率本质上就是要不然提升拷贝的效率,要不然提升等待的效率,换句话说就是提升单位时间内拷贝的效率,在单位时间内可以拷贝足够多的数据,这本身就是一种提升IO的表现,所以在未来的这些IO模型当中,其实本质上都是在解决等待的这件事,想办法让等待的时间变短,就是提升IO的一种具体体现

五种IO模型

下面要进入的话题是五种IO模型,这里我简单进行一些讲解,我们以钓鱼为例,对于钓鱼这件事来说,什么叫钓鱼?说最简单的来理解就是一直在等待钓鱼,然后等到了把鱼钓起来,这就是对于钓鱼的一个最简单的整体认知,那这有什么用呢?该如何理解呢?我用下面的这五个故事来进行理解

现在有一个人叫做张三,他在钓鱼的时候采用的方式是一直在这等着,双手握着鱼竿死死的看着水面,如果有鱼咬了,就把杆子拽起来,这就完成了一次钓鱼的过程,那么张三在进行钓鱼的过程中,在看着鱼漂的这件事,本质上来说就是在等待的过程,而在张三进行钓鱼的过程中,没有任何人可以打扰他,只有当底层有鱼就绪了才会结束这个事,张三的这种行为就是阻塞式钓鱼,在绝大多数的IO接口当中,都是阻塞式IO的

过了一会,有一个人叫做李四,李四感觉没什么意思也来钓鱼,但是他和张三不一样,李四钓鱼的时候并不会一直在这里等着,而是一会看看手机,一会看看书,一会吃点零食,一会看看水面,当他发现水面上有鱼来了的时候,就把鱼钓起来了,那么李四的这个行为和张三并不一样,他选择的做法是一会钓钓鱼,一会干点别的事,而不是一直在看着水面,那么李四的这种做法也比较好理解,他就是所谓的非阻塞式IO

又过了一会,有一个人叫做王五,他也来钓鱼了,但是不同的是,他要做的是把鱼竿扔到水里面,然后就走了,在旁边躺着看手机,而在鱼竿上有一个铃铛,当有鱼咬钩的时候,铃铛就开始响,之后王五就发现有鱼咬钩了,直接把鱼竿拽起来,完成了一次钓鱼,所以对于王五来说,他没有主动的去检测鱼有没有上钩,而是去选择等着鱼上钩了提醒自己,这种IO的模式被叫做是信号驱动式IO

又过了一会,有一个人叫做赵六,赵六是个小富豪,他的钓鱼装备很多,他一下拿了100个钓鱼竿,同时去钓鱼,赵六要做事就是不断的在这个过程中去遍历这100个钓鱼竿,如果有上钩的就拿起来,没有上钩的就不管他,那么赵六的这件事本身就被叫做是多路复用,也叫做多路转接

那上述的这四个人的钓鱼方法,谁是最高效的呢?无疑是赵六,他的多路转接的效率非常高,在短时间内可以把等待的时间压缩到最短,从而起到提升IO的作用

又过了一会,有一个人叫田七,田七就和他们不一样了,他是一个超级大富豪,他从车上下来之后拿出装备,准备进行钓鱼,此时他突然接到了电话,有人告诉他说他现在要去开会,于是田七就不能继续钓鱼了,但是田七又觉得今天很想吃鱼,于是就和司机说,让司机来帮他钓鱼,司机就开始帮他钓鱼,而田七本人去开会去了,到了下班的时候田七就收到了司机钓的一桶鱼

异步和同步

那对于田七来说,他的这个做法属于什么呢?我们把这样的行为叫做是异步,而前面的这四种人的方式都叫做同步,对于同步来讲,一个很重要的事就是他们需要进行等待,前面的四个人,不管是用什么方式进行等待,但是最终都需要进行等待,而我们要学习的重点内容是对于多路转接来进行理解

阻塞IO

在这里插入图片描述
如上所示的是五种基本的IO模型,当有一个系统调用被调用的时候,如果数据没有就绪,那么就会一直卡在这里,等待内核当中的数据包就绪,直到就绪之后才会进行返回,然后处理数据包,这个就是阻塞IO

非阻塞IO

在这里插入图片描述
那什么是非阻塞IO?如上所示就是一个非阻塞IO的示意图,非阻塞IO和阻塞IO一个比较大的区别就是,非阻塞IO会进行轮询的操作,而不是一直在内核当中进行等待,当数据报准备好的时候就会返回,如果没有准备好也会返回,只不过回返回的是一个EWOULDBLOCK的错误码

那在非阻塞IO当中,是可以对于标记位进行设置的,我们回顾一下参数的接口:

在这里插入图片描述
在这里插入图片描述
read的参数和recvfrom基本相同,但是却少了一个标记位的参数,那在之前的内容中对于标记位通常设置的都是0,表示的是阻塞等待,如果想要设置的是非阻塞等待,就可以对于这个标记位进行一些设置

对于文件描述符来说,它是一个数组的下标,而这个数组当中的每一个文件本质上都是一个内核当中的文件对象,文件对象中是有对于文件的flag标记位的,所以可以用一个叫做fcntl函数来对于一个文件的底层flag标记位进行设置,这个设置的原理就是告诉内核,对于这个特定的文件描述符,我要把它设置为非阻塞

在这里插入图片描述
对于这个函数的使用细节,在后面的篇章中会有详细的讲解,这里先不进行使用

信号驱动IO

在这里插入图片描述
下面我们来谈的是信号驱动的IO,

GitHub 加速计划 / li / linux-dash
6
1
下载
A beautiful web dashboard for Linux
最近提交(Master分支:3 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐