问题引出
C语言中,在需要用到16进制数据的时候,可以通过printf函数的%x格式打印数据的16进制形式。在某些位标记、位操作的场合,需要用到2进制格式的数据,但printf函数不能输出2进制格式,虽然可以通过使用itoa或_itoa的方法转为2进制的字符串打印,但显示的长度是不固定的,无法显示有效数位前面的0。
例如:现在需要打印数字258的2进制格式,且需要将32位全部显示出来,即想要得到结果00000000 00000000 00000001 00000010,而使用_itoa的方法和打印结果为:
不是我们想要的显示32位的格式!
数据存储原理探析
那要怎么办呢?自己写个小程序吧,思路如下:
首先弄清楚数据在计算机中是如何存储的,对于int型数字,在32或64位计算机中都占4个字节,而计算机中的数据存储是以字节(Byte)为单位,1个字节包含8个位(bit),例如,数字258的16进制形式为0x00000102,2进制形式为:00000000 00000000 00000001 00000010,其在计算机内存中的存储方式如图所示:
右侧的16进制数是内存的地址,向上递增,方框里的二进制数是内存单元实际存储的字节内存,我们可以通过程序测试验证一下,因为unsigned char或char类型在系统是占用一个字节,因此可以定义该变量的指针,分别指向int的4个字节,打印其内存地址和实际存储的内存进行验证,代码如下:
运行结果:
[a] p2:5216f805, 1
[a] p3:5216f806, 0
[a] p4:5216f807, 0
可以看出,随着地址的增加,存储的内存依次是2、1、0、0,对应数字258的从低到高的4个字节的值,另外每次运行程序,变量a的地址是自动分配的,所以每次的输出与上面示意图的地址是不同的,但都是4个连续增加的地址值。
另外补充一下,这是一种小端字节序的存储方法,即将一个数据的低字节存储在内存的低地址,或理解为先存储数据的低字节。与之对应的是大端字节序存储方式,即先存储数据的高位字节,类似与我们书写数字时从左到右先写高位数字一样。由于计算机先处理地位字节的效率比较高,因此计算机内部的数据处理均采用小端字节序,而为了方便人的阅读,除了计算机内部处理,其它场合是采用大端字节序的。可通过下面的示意图助记:
另外,需要区分一点,无论大端还小端字节序,在一个字节的内部的8位2进制数,都是按照人类的习惯从左到右存放,如00000010在字节中也是按照这样存储的,不需要反过来。