如何判断机器的字节顺序是高字节在前还是低字节在前

2015年08月12日 21:41:58

阅读数:4544

最近经常听各种人在群里面讨论各种机,linux,mac,windows,单片机的啥都有。讨论的焦点就是在这些机器上到底是高字节在前还是低字节在前。

围绕这些各种口水战也是不亦乐乎,除了浪费时间以外,并没有什么卵用。

其实这个问题是很简单,只要稍微懂一点c语言知识。对,只要知道如何使用指针就可以做出正确的判断了。甚至你也许连指针都不会也没关系。只要你的电脑上有一个c的编译器,随便百度或者google以下判断的代码,拷贝黏贴上去,然后在运行一下,什么问题都可以搞定了。


#include <stdio.h>

int main() {

    int  x  =  1;
    if(*(char  *)&x  ==  1)
        printf("低字节在前\n");
    else
        printf("高字节在前\n");

    return 0;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

本机的运行结果: 
这里写图片描述

代码解释说明:

  1. 1是整型,在不同机器上,可能是16位,也可能是32位,即2字节或4字节。假设是4字节。(如图左边是高字节,右边是低字节) 
    这里写图片描述
  2. C语言中只有char是单字节数据,所以,只有通过(char )地址这种方式,才能查看某个确切地址空间上的数据。

  3. 在低字节在前的机器上,1在内存空间中的二进制形式是 


    这里写图片描述

     

这时候令x=1的话,&x是x的地址,即指向0x01这个字节,通过 (char )&x得到的是1。 
在高字节在前的机器上,1在内存中是 


这里写图片描述

 

&x指向的是0x00这个字节,(char )&x得到的0

不同的CPU有不同的字节序类型 这些字节序是指整数在内存中保存的顺序 这个叫做主机序 
最常见的有两种
1. Little endian:将低序字节存储在起始地址(即小的字节先存放)
2. Big endian:将高序字节存储在起始地址(即大的字节先存放)

LE little-endian 
最符合人的思维的字节序 
地址低位存储值的低位 
地址高位存储值的高位 
怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说 
低位值小,就应该放在内存地址小的地方,也即内存地址低位 
反之,高位值就应该放在内存地址大的地方,也即内存地址高位 

BE big-endian 
最直观的字节序 
地址低位存储值的高位 (地址低位就是下面的4000不是4003,值的高位就是0x01020304这个值的01)
地址高位存储值的低位 
为什么说直观,不要考虑对应关系 
只需要把内存地址从左到右按照由低到高的顺序写出 
把值按照通常的高位到低位的顺序写出 
两者对照,一个字节一个字节的填充进去 

例子:在内存中双字0x01020304(DWORD)的存储方式 

内存地址 
4000 4001 4002 4003 
LE 04 03 02 01 
BE 01 02 03 04 


例子:如果我们将0x1234abcd写入到以0x0000开始的内存中,则结果为
      big-endian  little-endian
0x0000  0x12      0xcd
0x0001  0x23      0xab
0x0002  0xab      0x34
0x0003  0xcd      0x12

x86系列CPU都是little-endian的字节序. 

网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。

为了进行转换 bsd socket提供了转换的函数 有下面四个
htons 把unsigned short类型从主机序转换到网络序  (可以这样理解:h  to  n  s的解释:h就是host ,to就是“到”,n就是network,s就是                                                                                               short)
htonl 把unsigned long类型从主机序转换到网络序
ntohs 把unsigned short类型从网络序转换到主机序
ntohl 把unsigned long类型从网络序转换到主机序

在使用little endian的系统中 这些函数会把字节序进行转换 
在使用big endian类型的系统中 这些函数会定义成空宏

同样 在网络程序开发时 或是跨平台开发时 也应该注意保证只用一种字节序 不然两方的解释不一样就会产生bug.

注:
1、网络与主机字节转换函数:htons ntohs htonl ntohl (s 就是short  l是long  h是host  n是network)
2、不同的CPU上运行不同的操作系统,字节序也是不同的,参见下表。
处理器    操作系统    字节排序
Alpha    全部    Little endian
HP-PA    NT    Little endian
HP-PA    UNIX    Big endian
Intelx86    全部    Little endian <-----x86系统是小端字节序系统
Motorola680x()    全部    Big endian
MIPS    NT    Little endian
MIPS    UNIX    Big endian
PowerPC    NT    Little endian
PowerPC    非NT    Big endian  <-----PPC系统是大端字节序系统
RS/6000    UNIX    Big endian
SPARC    UNIX    Big endian
IXP1200 ARM核心    全部    Little endian 

 

GitHub 加速计划 / li / linux-dash
10.39 K
1.2 K
下载
A beautiful web dashboard for Linux
最近提交(Master分支:2 个月前 )
186a802e added ecosystem file for PM2 4 年前
5def40a3 Add host customization support for the NodeJS version 4 年前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐