0


C语言结构体深度剖析


📌————本章重点————📌

✨————————————✨

前言:

什么是结构体:

    结构体是由一批数据组合而成的结构型数据。组成结构型数据的每个数据称为结构型数据的“成员”。

结构体变量:

    结构体是C语言中一种重要的数据类型,该数据类型由一组称为成员(或称为域,或称为元素)的不同数据组成,其中每个成员可以具有不同的类型。

    结构体类型不是由系统定义好的,而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。

    关键字struct和结构体名组合成一种类型标识符,其地位如同通常的int、char等类型标识符,其用途就像 int 类型标识符标识一样可以用来定义结构体变量。

    定义变量以后,该变量就可以像定义的其他变量一样使用了;成员又称为成员变量,它是结构体所包含的若干个基本的结构类型,必须用“{}”括起来,并且要以分号结束,每个成员应表明具体的数据类型。


结构的声明:

这里先练习一个最简单且直观的声明写法:

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};

匿名类结构体类型

  • 在声明结构的时候,可以声明标签,这样的写法叫做匿名类型;
  • 匿名结构体类型只能使用一次;
  • 如果声明多个匿名类型,即使它们的成员变量都相同,编译器也会将它们视为不同类型;
struct {
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};

结构体自引用

  • 在一个结构体内部包含类型为该结构体本身的成员,叫做自引用;
  • 结构体不能包含同类型的结构体,只能包含同类型的结构体指针;

1.未重命名的:

2.重命名的:


结构体变量的定义和初始化

1.全局定义和初始化:p1,p2,p3都作为全局变量.

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
}p1,p2,p3;
struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
}p1={"zhangsan", 12, '男'};

2.局部变量的定义和初始化:在主函数内部产生.

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};
int main()
{
    struct Peo p2  ={"zhansan", 12, '男'};//在主函数内部定义一个p2变量

    return 0;
}

结构体传参

  • 结构体传参时可以传值也可以传址;
  • 首选传址:因为函数传参时是需要压栈的,只要压栈就会导致系统在时间和空间上的开销,倘若传的是结构体对象,而且过大时,更会导致效率大打折扣;

1.传值

解引用使用点号(.):

struct stu
{
    int arr[5];
    char ch;
};
void Print(struct stu s)
{
    for (int i = 0; i < 5; i++)
    {
        printf("%d ", s.arr[i]);
    }
    printf("%c\n", s.ch);
}
int main()
{
    struct stu s1 = { { 1,2,3,4,5 },'a' };

    Print(s1);

    return 0;
}

2.传址

解引用使用指向符(->):

struct stu
{
    int arr[5];
    char ch;
};
void Print(struct stu* s)
{
    for (int i = 0; i < 5; i++)
    {
        printf("%d ", s->arr[i]);
    }
    printf("%c\n", s->ch);
}
int main()
{
    struct stu s1 = { { 1,2,3,4,5 },'a' };

    Print(&s1);

    return 0;
}


结构体内存对齐

思考:当我们计算某个结构体的大小时,难道也是直接根据对应成员的数据类型大小求和吗?

  • 其实结构体的大小不能直接根据成员大小来计算,而是与每个成员的定义顺序有关;

我们先来看这个在面这个例子:三个结构体的成员只是顺序不同,就导致大小有所差异。

究其原因是因为结构体在存储时存在内存对齐。

接下来就手把手带你计算结构体大小,不想会都难,学会了将一劳永逸。

对齐规则:

  • 第一个成员在偏移量为0的地址处;
  • 后面的成员变量,从上一个成员的结束位置开始向后找,找到某个数(对齐数的整数倍位置);
  • 对齐数 = 编译器默认对齐数 与 该成员类型的较小值;(vs默认是8)
  • 最终结构体的总大小:是最大对齐数(每个成员的对齐数)的整数倍;
  • 如果结构体嵌套:嵌套的结构体先根据上述方法对齐到正确的位置,最终结构体的大小是所有对齐数的整数倍(包括被嵌套的结构体的对齐数);
  • 上述代码图解:*

修改默认对齐数:

有时候结构对齐数不合适,我们可以使用#pragam预处理命令,可以修改默认对齐数;

像下面这样,默认对齐数改为了1该结构体大小就变为14:

#pragma pack(1)
struct Peo
{
    char name[5];
    int age;
    char sex[5];
};
#pragma pack()
int main()
{
    printf("%zd\n", sizeof(struct Peo));

    return 0;
}

若将默认对齐数改为7,会出现这样的警告:

offsetof宏

这里介绍一个宏:可以计算结构体成员在内存中的偏移量

size_t****offsetof(structName,memberName);

内存对齐的意义:

通过上述演示我们发现,既然内存对齐存在浪费空间的情况,那为什么要注意做呢?

实质上:内存对齐是拿空间换去时间的做法;

  • 性能方面:

      首先我们要搞清楚一点:在cpu看来,内存并不是简单的以一个字节去划分的,而是以块为单位,一个块可能是2,4,8,16个字节,因此将结构体内存对齐,可以避免处理器进行二次访问内存,节省时间成本;
    
  • 移植性原因:

      并不是所有的硬件平台都能访问任意地址处的数据;
    

结论:我们在设计结构体成员时,要尽可能安排合适的顺序,考虑到内存对齐,防止过多的空间被浪费。


位段

什么是位段

    位段这一概念是结构体中必须提到的知识点,C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员称为“位段”或称“卫浴”( bit field) 。利用位段能够用较少的位数存储数据。

    比如我只需要一个表示0或1的数,那么就只需要给它分配1个bit位即可,如果只需要一个表示0~3的数,那么只需要给它分配2个bit位即可。

要求:

  • 位段的成员必须是int、unsigned int、signed int(或者char);
  • 位段的我成员名之后有一个冒号和数字;
  • 冒号后面的大小不能超过前面类型的所属bit位大小;

比如:下面这样一个结构体大小只占4个字节:

因此,结构体在内存对齐时会浪费空间,那么利用位段可以节省空间

struct stu
{
    int a : 1;
    int b : 2;
    int c : 3;
    int d : 4;
};
int main()
{
    printf("%zd\n", sizeof(struct stu));

    return 0;
}

既然如此,那位段的内存又是如何分配的呢?

位段的内存分配

下面这个例子输出为:3 0 3 12 13;

struct stu
{
    char a : 1;
    char b : 3;
    char c : 5;
    char d : 6;
};
int main()
{
    printf("%zd\n", sizeof(struct stu));

    struct stu s1 = { 0 };

    s1.a = 10;
    s1.b = 11;
    s1.c = 12;
    s1.d = 13;

    printf("%d\n", s1.a);
    printf("%d\n", s1.b);
    printf("%d\n", s1.c);
    printf("%d\n", s1.d);

    return 0;
}

过程:

  1. a只有分配了1个bit位,而10的二进制有效位占了4个bit位,10被截断为0,先开辟一个字节(假设8个bit位)空间,放a,这个字节剩余7个bit位;
  2. b同样得到3个bit位,11被截断为三位变成3,这三位在刚才剩余的7位中能放下,则紧跟着放入b;
  3. c同样的到5个bit位,12被截断为5位,可以完整表示12,但由于刚才已经使用了(1+3=)4个bit位,剩余4位不够放c的值,那么再开辟一个字节空间,依次类推,最终为该结构开辟了3个字节空间。

图解:

位段的跨平台问题:

虽说使用位段可以很好的节省空间,但是它也存在缺陷,那就是跨平台问题:

  • int 位段被当成有符号数还是无符号数是不确定的;
  • 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题);
  • 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义;
  • 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的;

标签: c语言 开发语言

本文转载自: https://blog.csdn.net/m0_65190367/article/details/126538082
版权归原作者 @Main. 所有, 如有侵权,请联系我们删除。

“C语言结构体深度剖析”的评论:

还没有评论