转载自:https://blog.csdn.net/cstarbl/article/details/7645298

在Linux中,内核利用文件描述符(File Descriptor)即文件句柄,来访问文件。文件描述符是非负整数。打开现存文件或新建文件时,内核会返回一个文件描述符。读写文件也需要使用文件描述符来指定待读写的文件。宏FD_ZERO、FD_SET、FD_CLR、FD_ISSET中“FD”即为file descriptor的缩写,下面来一一进行介绍。

首先介绍一个重要的结构体:fd_set,它会作为下面某些函数的参数而多次用到,fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,它用一位来表示一个fd(下面会仔细介绍)。fd_set集合可以通过下面的宏来进行人为来操作。

1》FD_ZERO

用法:FD_ZERO(fd_set*);

用来清空fd_set集合,即让fd_set集合不再包含任何文件句柄。在对文件描述符集合进行设置前,必须对其进行初始化,如果不清空,由于在系统分配内存空间后,通常并不作清空处理,所以结果是不可知的。

2》FD_SET

用法:FD_SET(int ,fd_set *);

用来将一个给定的文件描述符加入集合之中。

3》FD_CLR

用法:FD_CLR(int ,fd_set*);

用来将一个给定的文件描述符从集合中删除。

4》FD_ISSET

用法:FD_ISSET(int ,fd_set*);

检测fd在fdset集合中的状态是否变化,当检测到fd状态发生变化时返回真,否则,返回假(也可以认为集合中指定的文件描述符是否可以读写)。

5》函数select

用法:int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

作用:用来够监视我们需要监视的文件描述符(读或写的文件集中的文件描述符)的状态变化情况。并能通过返回的值告知我们。

参数解释:

int maxfdp:集合中所有文件描述符的范围,为所有文件描述符的最大值加1。

fd_set *readfds:要进行监视的读文件集。

fd_set *writefds :要进行监视的写文件集。

fd_set *errorfds:用于监视异常数据。

struct timeval* timeout:select的超时时间,它可以使select处于三种状态:

  • 第一,若将NULL以形参传入,即不传入时间结构,就是 将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;
  • 第二,若将时间值设为0秒0毫秒,就变成一个纯粹的非阻塞函数, 不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;
  • 第三,timeout的值大于0,这就是等待的超时时间,即 select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。
struct timeval timeout; timeout.tv_sec = 0; //秒 timeout.tv_usec = dwTimeout * 1000; //微秒 1毫秒 = 1000微秒

返回值介绍:

>0:被监视的文件描述符有变化,返回对应位仍然为1的fd的总数。
-1:出错
0 :超时

举例:

比如recv(),在没有数据到来调用它的时候,你的线程将被阻塞,如果数据一直不来,你的线程就要阻塞很久。这样显然不好,所以采用select来查看套节字是否可读(也就是是否有数据读了) 。

步骤如下— —

socket   s;   
.....   
fd_set   set;   
while(1)   
{       
      FD_ZERO(&set);//将你的套节字集合清空   
      FD_SET(s,   &set);//加入你感兴趣的套节字到集合,这里是一个读数据的套节字s   
      select(0,&set,NULL,NULL,NULL);//检查套节字是否可读,   
                                                        //很多情况下就是是否有数据(注意,只是说很多情况)  
                                                        //这里select是否出错没有写   
      if(FD_ISSET(s,   &set)   //检查s是否在这个集合里面,   
      {                                           //select将更新这个集合,把其中不可读的套节字去掉   
                                                  //只保留符合条件的套节字在这个集合里面                         
              recv(s,...);   
      }   
      //do   something   here   
}

理解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。

  • (1)执行fd_set set; FD_ZERO(&set); 则set用位表示是0000,0000。
  • (2)若fd=5,执行FD_SET(fd,&set); 后set变为0001,0000(第5位置为1)
  • (3)若再加入fd=2,fd=1,则set变为0001,0011
  • (4)执行 select(6,&set,0,0,0) 阻塞等待
  • (5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。

基于上面的讨论,可以轻松得出select模型的特点:

(1)可监控的文件描述符个数取决与sizeof(fd_set)的值。我这边服务器上sizeof(fd_set)=512,每bit表示一个文件描述符,则我服务器上支持的最大文件描述符是512*8=4096。据说可调,另有说虽然可调,但调整上限受于编译内核时的变量值。本人对调整fd_set的大小不太感兴趣,参考http://www.cppblog.com /CppExplore/archive/2008/03/21/45061.html中的模型2(1)可以有效突破select可监控的文件描述符上限。

(2)将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。

(3)可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。

下面给一个伪码说明基本select模型的服务器模型:

array[slect_len];
nSock=0;
array[nSock++]=listen_fd;(之前listen port已绑定并listen)
maxfd=listen_fd;
while{
   FD_ZERO(&set);
   foreach (fd in array) 
   {
       fd大于maxfd,则maxfd=fd
       FD_SET(fd,&set)
   }
   res=select(maxfd+1,&set,0,0,0)if(FD_ISSET(listen_fd,&set))
   {
       newfd=accept(listen_fd);
       array[nsock++]=newfd;
            if(--res=0) continue
   }
   foreach 下标1开始 (fd in array) 
   {
       if(FD_ISSET(fd,&set))
          执行读等相关操作
          如果错误或者关闭,则要删除该fd,将array中相应位置和最后一个元素互换就好,nsock减一
             if(--res=0) continue
   }
}

使用select函数的过程一般是:

先调用宏FD_ZERO将指定的fd_set清零,然后调用宏FD_SET将需要测试的fd加入fd_set,接着调用函数select测试fd_set中的所有fd,最后用宏FD_ISSET检查某个fd在函数select调用后,相应位是否仍然为1。

以下是一个测试单个文件描述字可读性的例子:

     int isready(int fd)
     {
         int rc;
         fd_set fds;
         struct tim tv;    
         FD_ZERO(&fds);
         FD_SET(fd,&fds);
         tv.tv_sec = tv.tv_usec = 0;    
         rc = select(fd+1, &fds, NULL, NULL, &tv);
         if (rc < 0)   //error
         return -1;    
         return FD_ISSET(fd,&fds) ? 1 : 0;
     }

下面还有一个复杂一些的应用:

//这段代码将指定测试Socket的描述字的可读可写性,因为Socket使用的也是fd

uint32 SocketWait(TSocket *s,bool rd,bool wr,uint32 timems)    
{
     fd_set rfds,wfds;
#ifdef _WIN32
     TIM tv;
#else
     struct tim tv;
#endif    
     FD_ZERO(&rfds);
     FD_ZERO(&wfds); 
     if (rd)     //TRUE
     FD_SET(*s,&rfds);   //添加要测试的描述字 
     if (wr)     //FALSE
       FD_SET(*s,&wfds); 
     tv.tv_sec=timems/1000;     //second
     tv.tv_usec=timems%1000;     //ms 
     for (;;) //如果errno==EINTR,反复测试缓冲区的可读性
          switch(select((*s)+1,&rfds,&wfds,NULL,
              (timems==TIME_INFINITE?NULL:&tv))) //测试在规定的时间内套接口接收缓冲区中是否有数据可读
         {                                              //0--超时,-1--出错
         case 0:    
              return 0; 
         case (-1):   
              if (SocketError()==EINTR)
                   break;              
              return 0; //有错但不是EINTR 
          default:
              if (FD_ISSET(*s,&rfds)) //如果s是fds中的一员返回非0,否则返回0
                   return 1;
              if (FD_ISSET(*s,&wfds))
                   return 2;
              return 0;
         };
}
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐