UDP报文的覆盖/重叠问题
对一个UDP Server来说,如果同时有几个UDP Client向其发送数据,而UDP Server使用了单线程串行处理的方式来处理收到的UDP报文,那么,会不会在UPD Server还没有处理完一条报文的时候,其他几个Client同时发送了数据,并且这些数据累加在一起(或者重叠在一起),导致UDP Server下一次使用recvfrom函数接收数据的时候,实际上一次接收到的数据是几个Client数据的集合(或者错乱了)呢?
答案是:不会。
我们可以做下面的实验(这是Linux下的程序)。
这是一个UDP Server的实现,它阻塞地接收Client的数据。大家会注意到,在绑定端口成功后,会sleep 10秒钟,在这期间,你可以用多个Client向这个UDP Server使劲地发不同的数据,从而观察效果。
至于Client,我们可以直接使用其他工具来模拟(例如TCP/UDP调试助手),不需要编写代码了。
// 编译命令 : g++ udp.cpp -o udp -g
#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h> // memset()
#include <unistd.h> // close()
void set_socket_option(int &sock_fd);
int main()
{
int sock_fd = 0;
if ((sock_fd = socket(AF_INET, SOCK_DGRAM, 0)) == -1)
{
printf("Error occured!/n");
}
else
{
printf("Create socket successfully./n");
set_socket_option(sock_fd);
struct sockaddr_in local_server_addr;
local_server_addr.sin_family = AF_INET;
local_server_addr.sin_port = htons(7777);
local_server_addr.sin_addr.s_addr = INADDR_ANY;
memset(local_server_addr.sin_zero, '/0', sizeof(local_server_addr.sin_zero));
if (bind(sock_fd, (struct sockaddr *)&local_server_addr, sizeof(struct sockaddr)) == -1)
{
printf("Error occured!/n");
}
else
{
printf("Listen on port 7777.../n");
usleep(1000 * 10000);
while (true)
{
struct sockaddr_in client_addr;
socklen_t sin_size = sizeof(client_addr);
char buf[1024] = "0";
int ret = recvfrom(sock_fd, buf, 1024, 0, (struct sockaddr *)&client_addr, &sin_size);
printf("Size : %d. Buffer : %s/n", ret, buf);
}
}
close(sock_fd);
}
return 0;
}
void set_socket_option(int &sock_fd)
{
int optval = 1;
setsockopt(sock_fd, SOL_SOCKET, SO_REUSEADDR, &optval, sizeof(int));
int recv_buf_size = 1048576; // 1MB
setsockopt(sock_fd, SOL_SOCKET, SO_RCVBUF, (const char*)&recv_buf_size, sizeof(recv_buf_size));
int send_buf_size = 1048576; // 1MB
setsockopt(sock_fd, SOL_SOCKET, SO_SNDBUF, (const char*)&send_buf_size, sizeof(send_buf_size));
}
实验结果是什么呢?
如果在sleep 10秒钟的时候,有两个Client,第一个先发了“AB”,第二个紧跟着发了“12”(此处:非16进制),也就是说,两个Client都分别发了2个字节的数据,那么UDP Server打印出来的信息是:
Size : 2. Buffer : AB
Size : 2. Buffer : 12
并不会出现下面的情形:
Size : 4. Buffer : AB12
所以,如前文所述,不会产生累加或重叠问题,放心地用吧。
另一个问题:有人说,一般来说报文头里会含有报文长度信息,我想先接收报文头,从报文头里解析出报文长度,然后再根据报文长度来动态分配内存,再用分配的内存来接收剩余的数据。这样做的目的可能是:报文长度未知,可能会很长,如果直接使用一个char buf[1024]或者char buf[2048]之类的太浪费了,而且不知道够不够用呢。
我们来讨论一下这种做法“值不值”。
首先,来看看下面的函数:
bool recv_msg(int &sock_fd, char *buf, int len)
{
bool res = true; // return result
struct sockaddr_in client_addr; // client's address information
socklen_t sin_size = sizeof(client_addr);
int ret = 0, total_size = 0;
while (total_size < len)
{
// if can't receive specified length in a time, we should continue receiving until get enough length
ret = recvfrom(sock_fd, buf + total_size, len - total_size, 0, (struct sockaddr *)&client_addr, &sin_size);
if (-1 == ret || 0 == ret) // error occured or the peer has performed an orderly shutdown
{
break;
res = false;
}
total_size += ret;
}
return res;
}
上面的函数,就是“收够了指定长度字节的数据才收手”的示例。
假设你想先接收报文header,并且正确的header为10个字节,如果你接收数据时,使用:
char buf[10] = "0";
recv_msg(sock_fd, buf, 10);
那么你就会发现这样的隐患:Client A由于出错,第一次只发送了3个字节的数据(实际上,仅报文头就有10个字节了),那么接收函数就会一直等待,然后,Client 1第二次发送数据正常了,发送了21个字节的数据(其中,报文头有10个字节),那么UDP Server就会继续把这21个字节中的前7个字节拿出来,与第一次接收到的3个字节凑成10个字节,当作一个报文头,然后解析。这显然是错误的,而且第二次正确的报文也被“破坏”了。所以,我不敢说先接收报文头这种做法是不是可取,至少我觉得没有意义。因为对UDP来说,局域网内的UDP数据长度应设计在1472 Bytes以下,Internet上的UDP数据长度应设计在548 Bytes以下(这两个数字是怎么来的,请看后面的转载资料),所以,用一个char buf[2048]完全足够接收完整条报文了(不需要先接收header再接收后面的部分),这个开销根本不大。如果你的UDP数据长度大于前面所说的上限,那么请考虑重新设计一下报文结构吧。
最后附上一篇不错的文章:
在进行UDP编程的时候,我们最容易想到的问题就是,一次发送多少bytes好?
当然,这个没有唯一答案,相对于不同的系统,不同的要求,其得到的答案是不一样的,我这里仅对像ICQ一类的发送聊天消息的情况作分析,对于其他情况,你或许也能得到一点帮助:
首先,我们知道,TCP/IP通常被认为是一个四层协议系统,包括链路层,网络层,运输层,应用层.
UDP属于运输层,下面我们由下至上一步一步来看:
以太网(Ethernet)数据帧的长度必须在46-1500字节之间,这是由以太网的物理特性决定的.
这个1500字节被称为链路层的MTU(最大传输单元).
但这并不是指链路层的长度被限制在1500字节,其实这这个MTU指的是链路层的数据区. 并不包括链路层的首部和尾部的18个字节.
所以,事实上,这个1500字节就是网络层IP数据报的长度限制.
因为IP数据报的首部为20字节,所以IP数据报的数据区长度最大为1480字节.而这个1480字节就是用来放TCP传来的TCP报文段或UDP传来的UDP数据报的.
又因为UDP数据报的首部8字节,所以UDP数据报的数据区最大长度为1472字节.这个1472字节就是我们可以使用的字节数。:)
当我们发送的UDP数据大于1472的时候会怎样呢?
这也就是说IP数据报大于1500字节,大于MTU.这个时候发送方IP层就需要分片(fragmentation).
把数据报分成若干片,使每一片都小于MTU.而接收方IP层则需要进行数据报的重组.
这样就会多做许多事情,而更严重的是,由于UDP的特性,当某一片数据传送中丢失时,接收方便
无法重组数据报.将导致丢弃整个UDP数据报。
因此,在普通的局域网环境下,我建议将UDP的数据控制在1472字节以下为好.
进行Internet编程时则不同,因为Internet上的路由器可能会将MTU设为不同的值.
如果我们假定MTU为1500来发送数据的,而途经的某个网络的MTU值小于1500字节,那么系统将会使用一系列的机
制来调整MTU值,使数据报能够顺利到达目的地,这样就会做许多不必要的操作.
鉴于Internet上的标准MTU值为576字节,所以我建议在进行Internet的UDP编程时. 最好将UDP的数据长度控件在548字节(576-8-20)以内.
更多推荐
所有评论(0)