[Linux][网络][高级IO][IO多路转接][select][poll]详细讲解

linux-dash

A beautiful web dashboard for Linux

项目地址：https://gitcode.com/gh_mirrors/li/linux-dash

免费下载资源

DieSnowK

4810人浏览 · 2024-05-15 00:01:28

DieSnowK · 2024-05-15 00:01:28 发布

1.IO多路转接之select

1.初识select

select系统调用是用来让程序监视多个文件描述符的状态变化的
程序会停在select这里等待，直到被监视的文件描述符有一个或多个发生了状态改变
总结：
- 帮用户进行一次等待多个文件描述符
- 当哪些文件描述符就绪了，select就要通知用户，对应就绪的sock有哪些，然后用户再调用recv/read等接口进行数据读取

2.select()

原型：int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
参数：
- nfds：要监视的最大的文件描述符+1
- readfds,writefds,exceptfds：均为输入输出型参数，分别对应于需要检测的可读/可写/异常文件描述符的集合
  - 输入时：用户告诉内核，你要帮我关心哪些fd的哪一种事件
    - bit位的位置表示文件描述符值，bit位的内容表示是否关心(1/0)
  - 输出时：内核告诉用户，我所关心的fd中，哪些fd上的哪类事件已经就绪了
    - bit位的位置表示文件描述符值，bit位的内容表示是否就绪(1/0)
  - 用户和内核都会修改同一个位图结构，这些参数用一次之后，一定要进行重新设定
- timeout：用来设置select()的等待时间，其取值
  - nullptr：阻塞等待
  - 0：非阻塞等待
  - 特定时间值：如果在指定的时间段里没有事件发生，select()将超时返回
  - 如果等待时间内，有fd就绪，会怎样呢？
    - 呈现输出型，存放距离下一次timeout剩余多长时间
返回值：
- 执行成功则返回文件描述词状态已改变的个数
- 如果返回0代表在描述词状态改变前已超过timeout时间，没有返回
- 当有错误发生时则返回-1，错误原因存于errno，此时参数readfds，writefds, exceptfds和timeout的值变成不可预测
错误码可能值：
- EBADF：文件描述词为无效的或该文件已关闭
- EINTR：此调用被信号所中断
- EINVAL：参数n为负值
- ENOMEM：核心内存不足

3.关于fd_set结构

/* The fd_set member is required to be an array of longs.  */
typedef long int __fd_mask;

typedef struct
  {
    /* XPG4.2 requires this member name.  Otherwise avoid the name
       from the global namespace.  */
#ifdef __USE_XOPEN
    __fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];
# define __FDS_BITS(set) ((set)->fds_bits)
#else
    __fd_mask __fds_bits[__FD_SETSIZE / __NFDBITS];
# define __FDS_BITS(set) ((set)->__fds_bits)
#endif
  } fd_set;

其实这个结构就是一个整数数组，更严格的说，是一个**“位图”，使用位图中对应的bit位来表示要监视的文件描述符**

提供了一组操作fd_set的接口, 来比较方便的操作位图

void FD_CLR(int fd, fd_set *set); // 用来清除描述词组set中相关fd的bit位
int FD_ISSET(int fd, fd_set *set); // 用来测试描述词组set中相关fd的but位是否为真
void FD_SET(int fd, fd_set *set); // 用来设置描述词组set中相关fd的bit位
void FD_ZERO(fd_set *set); // 用来清除描述词组set的全部bit位

4.关于timeval结构

timeval结构用于描述一段时间长度，如果在这个时间内，需要监视的文件描述符没有事件发生则函数返回，返回值为0
```
struct timeval
{
  __time_t tv_sec;    /* Seconds. */
  __suseconds_t tv_usec;  /* Microseconds. */
};
```

5.理解select执行过程

理解select模型的关键在于理解fd_set，为说明方便，取fd_set长度为1字节
fd_set中的每一bit可以对应一个文件描述符fd，则1字节长的fd_set最大可以对应8个fd.
1. 执行fd_set set; FD_ZERO(&set);
  - 则set用位表示是0000,0000
2. 若fd＝5，执行FD_SET(fd, &set);
  - set变为0001,0000(第5个bit位置为1)
3. 若再加入fd＝2，fd=1
  - 则set变为0001,0011
4. 执行**select(6, &set, nullptr, nullptr, nullptr)**阻塞等待
5. 若fd=1，fd=2上都发生可读事件，则select返回
  - 此时set变为0000,0011
  - **注意：**没有事件发生的fd=5被清空

6.select就绪条件

读就绪
- socket内核中，接收缓冲区中的字节数，大于等于低水位标记SO_RCVLOWAT
  - 此时可以无阻塞的读该文件描述符，并且返回值大于0
- socket TCP通信中，对端关闭连接，此时对该socket读，则返回0
- 监听的socket上有新的连接请求
- socket上有未处理的错误
写就绪
- socket内核中，发送缓冲区中的可用字节数(发送缓冲区的空闲位置大小)，大于等于低水位标记SO_SNDLOWAT
  - 此时可以无阻塞的写，并且返回值大于0
- socket的写操作被关闭(close或者shutdown)，对一个写操作被关闭的socket进行写操作，会触发SIGPIPE信号
- socket使用非阻塞connect连接成功或失败之后
- socket上有未读取的错误

7.select特点

可监控的文件描述符个数取决与sizeof(fd_set)的值
- 我虚拟机上sizeof(fd_set)＝128，每bit表示一个文件描述符，则支持的最大文件描述符是128*8=1024
将fd加入select监控集的同时，还要再使用一个第三方数组用来保存所有的合法fd
1. 用于在select返回后，array作为源数据和fd_set进行FD_ISSET判断
2. select返回后会把以前加入的但并无事件发生的fd清空，则每次开始select前都要重新从array取得fd并逐一加入(FD_ZERO最先)，扫描array的同时取得fd最大值maxfd，用于select的第一个参数

8.select优点(任何一个多路转接方案，都具备)

效率高
应用场景：有大量的链接，但是只有少量是活跃的，节省资源

9.select缺点

为了维护第三方数组，select服务器会充满大量遍历，OS底层帮用户关心fd的时候，也要遍历
每一次都要对select输出参数进行重新设定
能够同时管理的fd的个数是有上限的 <-- fd_set大小是被固定了的
因为几乎每一个参数都是输入输出型的，select一定会频繁地进行用户到内核，内核到用户的参数数据拷贝
编码比较复杂

10.select的一般编写代码的模式

while(true)
{
    // 1.遍历数组，更新出最大值
    // 2.遍历数组，添加所有需要关心的fd到fd_set位图中
    // 3.调用select进行事件检测
    // 4.遍历数组，找到就绪的事件，根据就绪的事件，完成对应的动作
    // a.Accepter b.recver
}

11.思考 && 问题

如何看待_listensock?
- 获取新连接，依然把它看成IO，如果没有连接到来，就阻塞
参数影响编码模式
1. nfds：随着获取的sock越来越多，添加到select的sock越来越多，注定了nfds每一次都可能要变化，需要对它动态计算
2. readfds/writefds/exceptfds：都是输入输出型参数，输入输出不一定是一样的，所以注定每次都要对其进行重新添加
3. timeout：输入输出型参数，每一次都要进行重置，前提是需要的话
  - 1,2 --> 注定必须自己将合法的fd单独全部保存起来，以支持：a.更新最大fd b.更新位图结构

2.IO多路转接之poll

1.poll()

原型：int poll(struct pollfd *fds, nfds_t nfds, int timeout);
参数：
- fds：是一个poll()监听的结构的数组，每一个元素中，包含了三部分内容：文件描述符，监听的事件集合，返回的事件集合
- nfds：表示fds数组的长度
- **timeout：
  - 表示poll()的超时时间，单位是毫秒
  - 设置为0，表示非阻塞等待
  - 设置为-1，表示阻塞等待
返回值：
- 执行成功则返回文件描述词状态已改变的个数
- 如果返回0代表在描述词状态改变前已超过timeout时间，没有返回
- 当有错误发生时则返回-1，错误原因存于errno

2.pollfd结构

struct pollfd
{
   int fd;        /* File descriptor to poll.  */
   short int events;  /* Types of events poller cares about.  */
   short int revents; /* Types of events that actually occurred. */
};

events****和revents的取值

事件	描述	是否可作为输入	是否可作为输出
POLLIN	数据(包括普通数据和优先数据)可读	是	是
POLLRDNORM	普通数据可读	是	是
POLLRDBAND	优先级带数据可读(Linux不支持)	是	是
POLLPRI	高优先级数据可读，比如TCP带外数据	是	是
POLLOUT	数据(包括普通数据和优先数据)可写	是	是
POLLWRNORM	普通数据可写	是	是
POLLRDHUP	TCP连接被对方关闭，或者对方关闭了写操作，它由GNU引入	是	是
POLLERR	错误	否	是
POLLHUP	挂起，比如管道的写端被关闭后，读端描述符上将收到POLLHUP事件	否	是
POLLNVAL	文件描述符没有打开	否	是

3.poll就绪条件

同select

4.poll的优点

效率高
应用场景：有大量的链接，但是只有少量是活跃的，节省资源
输入输出参数是分离的，不需要进行大量的重置
没有可以管理的fd最大数量限制

5.poll缺点

poll依旧需要不少的遍历，在用户层检测事件就绪、内核检测fd就绪，都需要大量遍历
- 且用户还是需要自己维护第三方数组
poll需要内核到用户的拷贝 – 少不了的
poll的代码结构依然比较复杂 – 比select容易

GitHub 加速计划 / li / linux-dash

10.39 K

1.2 K

下载

A beautiful web dashboard for Linux

最近提交(Master分支：2 个月前 )

186a802e added ecosystem file for PM2 4 年前

5def40a3 Add host customization support for the NodeJS version 4 年前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m