位域是什么?

有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。例如开关只有通电和断电两种状态,用 0 和 1 表示足以,也就是用一个二进位。正是基于这种考虑,C语言又提供了一种叫做位域的数据结构。

在结构体定义时,我们可以指定某个成员变量所占用的二进制位数(Bit),这就是位域。请看下面的例子:

1struct bs{
2    unsigned m;
3    unsigned n: 4;
4    unsigned char ch: 6;
5};

:后面的数字用来限定成员变量占用的位数。成员 m 没有限制,根据数据类型即可推算出它占用 4 个字节(Byte)的内存。成员 n、ch 被:后面的数字限制,不能再根据数据类型计算长度,它们分别占用 4、6 位(Bit)的内存。

n、ch 的取值范围非常有限,数据稍微大些就会发生溢出,请看下面的例子:

 1#include 2int main(){3    struct bs{4        unsigned m;5        unsigned n: 4;6        unsigned char ch: 6;7    } a = { 0xad, 0xE, '$'};8    //第一次输出9    printf("%#x, %#x, %c\n", a.m, a.n, a.ch);
10    //更改值后再次输出
11    a.m = 0xb8901c;
12    a.n = 0x2d;
13    a.ch = 'z';
14    printf("%#x, %#x, %c\n", a.m, a.n, a.ch);
15    system("pause");
16    return 0;
17}

运行结果:

对于 n 和 ch,第一次输出的数据是完整的,第二次输出的数据是残缺的。

第一次输出时,n、ch 的值分别是 0xE、0x24('$' 对应的 ASCII 码为 0x24),换算成二进制是111010 0100,都没有超出限定的位数,能够正常输出。

第二次输出时,n、ch 的值变为 0x2d、0x7a('z' 对应的 ASCII 码为 0x7a),换算成二进制分别是 10 1101111 1010,都超出了限定的位数。超出部分被直接截去,剩下 110111 1010,换算成十六进制为 0xd、0x3a(0x3a 对应的字符是 :)。

C语言标准规定,位域的宽度不能超过它所依附的数据类型的长度。通俗地讲,成员变量都是有类型的,这个类型限制了成员变量的最大长度,:后面的数字不能超过这个长度。

例如上面的 bs,n 的类型是 unsigned int,长度为 4 个字节,共计 32 位,那么 n 后面的数字就不能超过 32;ch 的类型是 unsigned char,长度为 1 个字节,共计 8 位,那么 ch 后面的数字就不能超过 8。

我们可以这样认为,位域技术就是在成员变量所占用的内存中选出一部分位宽来存储数据。

C语言标准还规定,只有有限的几种数据类型可以用于位域。在 ANSI C 中,这几种数据类型是 int、signed int 和 unsigned int(int 默认就是 signed int);到了 C99,_Bool 也被支持了。

但编译器在具体实现时都进行了扩展,额外支持了 char、signed char、unsigned char 以及 enum 类型,所以上面的代码虽然不符合C语言标准,但它依然能够被编译器支持。

位域的存储

C语言标准并没有规定位域的具体存储方式,不同的编译器有不同的实现,但它们都尽量压缩存储空间。

位域的具体存储规则如下:

  1. 当相邻成员的类型相同时,如果它们的位宽之和小于类型的 sizeof 大小,那么后面的成员紧邻前一个成员存储,直到不能容纳为止;如果它们的位宽之和大于类型的 sizeof 大小,那么后面的成员将从新的存储单元开始,其偏移量为类型大小的整数倍。

以下面的位域 bs 为例:

 1#include 2int main(){3    struct bs{4        unsigned m: 6;5        unsigned n: 12;6        unsigned p: 4;7    };8    printf("%d\n", sizeof(struct bs));9    return 0;
10}

运行结果:

m、n、p 的类型都是 unsigned int,sizeof 的结果为 4 个字节(Byte),也即 32 个位(Bit)。m、n、p 的位宽之和为6 12 4 = 22,小于 32,所以它们会挨着存储,中间没有缝隙。

sizeof(struct bs)的大小之所以为 4,而不是 3,是因为要将内存对齐到 4 个字节,以便提高存取效率。

如果将成员 m 的位宽改为 22,那么输出结果将会是 8,因为22 12 = 34,大于 32,n 会从新的位置开始存储,相对 m 的偏移量是 sizeof(unsigned int),也即 4 个字节。

如果再将成员 p 的位宽也改为 22,那么输出结果将会是 12,三个成员都不会挨着存储。

  1. 当相邻成员的类型不同时,不同的编译器有不同的实现方案,GCC 会压缩存储,而VC/VS 不会。

请看下面的位域 bs:

 1#include 2int main(){3    struct bs{4        unsigned m: 12;5        unsigned char ch: 4;6        unsigned p: 4;7    };8    printf("%d\n", sizeof(struct bs));9    return 0;
10}

在 GCC 下的运行结果为 4,三个成员挨着存储;在 VC/VS 下的运行结果为 12,三个成员按照各自的类型存储(与不指定位宽时的存储方式相同)。

m 、ch、p 的长度分别是 4、1、4 个字节,共计占用 9 个字节内存,为什么在 VC/VS 下的输出结果却是 12 呢?期待您的回复。

  1. 如果成员之间穿插着非位域成员,那么不会进行压缩。例如对于下面的 bs:

1struct bs{
2    unsigned m: 12;
3    unsigned ch;
4    unsigned p: 4;
5};

在各个编译器下 sizeof 的结果都是 12。

通过上面的分析,我们发现位域成员往往不占用完整的字节,有时候也不处于字节的开头位置,因此使用&获取位域成员的地址是没有意义的,C语言也禁止这样做。地址是字节(Byte)的编号,而不是位(Bit)的编号。

声明:

本文于网络整理,版权归原作者所有,如来源信息有误或侵犯权益,请联系我们删除或授权事宜。

纠缠不清的C语言位域(位段)详解相关推荐

  1. C语言自定义类型详解

    C语言自定义类型详解 一.结构体 1.结构的声明 2.特殊的声明 3.结构的自引用 4.结构体变量的定义和初始化 5.结构体内存对齐 6.修改默认对齐数 7.结构体传参 二.位段 1.什么是位段 2. ...

  2. (转)C语言位运算详解

    地址:http://www.cnblogs.com/911/archive/2008/05/20/1203477.html C语言位运算详解 作者:911 说明:本文参考了http://www2.ts ...

  3. R语言基础知识详解及概括

    R语言基础知识详解及概括 目录 R语言基础知识详解及概括 R数据可视化示例 R语言进行数据创建

  4. c语言练习题及答案)(1),c语言练习题(带详解答案)1.pdf

    c语言练习题(带详解答案)1 (-2) -1: 一单项选择题 /为求商运算符,该运算符能够对整型.字符.浮点等类型的数 据进行运算,5/2 2 1.(A )是构成C语言程序的基本单位. 11.如果 i ...

  5. python语言的格式框架_django框架模板语言使用方法详解

    本文实例讲述了django框架模板语言使用方法.分享给大家供大家参考,具体如下: 模板功能 作用:生成html界面内容,模版致力于界面如何显示,而不是程序逻辑.模板不仅仅是一个html文件,还包括了页 ...

  6. C语言再学习 -- 详解C++/C 面试题 2

    (经典)C语言测试:想成为嵌入式程序员应知道的0x10个基本问题. 参看:嵌入式程序员面试问题集锦 1.用预处理指令#define 声明一个常数,用以表明1年中有多少秒(忽略闰年问题) #define ...

  7. python自动解析json_Python语言解析JSON详解

    本文主要向大家介绍了Python语言解析JSON详解,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助. JSON 函数使用 JSON 函数需要导入 json 库:import jso ...

  8. c语言4 答案详解,2019考研数据结构C语言版详解答案(4)

    <数据结构(C语言版)>复习重点在二.三.六.七.九.十章,考试内容两大类:概念,算法,自从计算机专业课统考以后,专业课考试题型分为2类,一类选择题,一类综合应用题.本次新东方在线整理了数 ...

  9. 计算机科学类专升本复习之“C语言结构体”详解(初稿)

    C语言结构体详解,C语言struct用法详解 前面所学到的"数组":它是一组具有"相同类型"的数据的集合. 但是在实际的编程中,我们往往还需要 一组" ...

  10. 【C语言】函数详解(入门到进阶)

    目录 前言 一.什么是函数 二.函数的构成 三.函数的调用和声明 四.函数的参数 五.函数的递归 总结 写在后面 前言 最近帮家里的小朋友整理一些学习C语言的知识点 有整体入门基础文章--[C语言]拯 ...

最新文章

  1. 一文帮你理解什么是深层置信网络(DBN)
  2. ADO.NET中的五个主要对象介绍及使用
  3. 获取application.yml中的属性的方法
  4. flask_requirements
  5. Windows系统进程全解剖
  6. 如何避免把 Python 代码写得跟屎一样?
  7. logcat read :Invaild argument
  8. json转为tfrecord格式文件怎么转_word怎么转换成pdf格式?这样转很方便
  9. 免费视频直播点播服务器系统,搭建一套完整的网络视频流媒体直播/点播服务系统需要具备哪些条件?...
  10. java同步通信_java-线程-线程同步通信技术
  11. 玩转JavaScript OOP[0]——基础类型
  12. Shiro 详细教程(集各教程内容为一体)
  13. TMS320F28335之外部中断和自定义中断
  14. 光影精灵usb安装linux,惠普光影精灵5笔记本怎么装win10系统(uefi+gpt)
  15. VirtualBox 安装增强功能错误
  16. 开关电源的电感选择和布局布线
  17. Android 12 已来,你的 App 崩溃了吗?
  18. 小米CC9 国际版使用体验
  19. Til the Cows Come Home(简单的最短路)
  20. Mac Fabric 安装

热门文章

  1. Java的最新发展– 2018年4月下旬
  2. arraylist内存溢出_ArrayList使用内存映射文件
  3. lucene 增加相关性_事务性Lucene
  4. jpa命名 多条件查询命名_JPA 2 | 动态查询与命名查询
  5. spring javafx_带有Spring的JavaFX 2
  6. qotd服务_QOTD:Java线程与Java堆空间
  7. idea如何把包变为模块_让我们将包变成模块系统!
  8. 测试驱动开发 测试前移_测试驱动陷阱,第2部分
  9. jdbc:log4jdbc_使用Log4jdbc记录JDBC操作
  10. 简单一致的Log4j2 Logger命名