C语言结构体深度剖析

📌————本章重点————📌

✨————————————✨

前言：

什么是结构体：

    结构体是由一批数据组合而成的结构型数据。组成结构型数据的每个数据称为结构型数据的“成员”。

结构体变量：

    结构体是C语言中一种重要的数据类型，该数据类型由一组称为成员（或称为域，或称为元素）的不同数据组成，其中每个成员可以具有不同的类型。

    结构体类型不是由系统定义好的，而是需要程序设计者自己定义的。C语言提供了关键字struct来标识所定义的结构体类型。

    关键字struct和结构体名组合成一种类型标识符，其地位如同通常的int、char等类型标识符，其用途就像 int 类型标识符标识一样可以用来定义结构体变量。

    定义变量以后，该变量就可以像定义的其他变量一样使用了；成员又称为成员变量，它是结构体所包含的若干个基本的结构类型，必须用“{}”括起来，并且要以分号结束，每个成员应表明具体的数据类型。

结构的声明：

这里先练习一个最简单且直观的声明写法：

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};

匿名类结构体类型

在声明结构的时候，可以声明标签，这样的写法叫做匿名类型；

匿名结构体类型只能使用一次；

如果声明多个匿名类型，即使它们的成员变量都相同，编译器也会将它们视为不同类型；

struct {
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};

结构体自引用

在一个结构体内部包含类型为该结构体本身的成员，叫做自引用；

结构体不能包含同类型的结构体，只能包含同类型的结构体指针；

1.未重命名的：

2.重命名的：

结构体变量的定义和初始化

1.全局定义和初始化：p1，p2，p3都作为全局变量.

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
}p1,p2,p3;

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
}p1={"zhangsan", 12, '男'};

2.局部变量的定义和初始化：在主函数内部产生.

struct Peo
{
    char name[10];//姓名
    int age;      //年龄
    char sex[5];  //性别
};
int main()
{
    struct Peo p2  ={"zhansan", 12, '男'};//在主函数内部定义一个p2变量

    return 0;
}

结构体传参

结构体传参时可以传值也可以传址；

首选传址：因为函数传参时是需要压栈的，只要压栈就会导致系统在时间和空间上的开销，倘若传的是结构体对象，而且过大时，更会导致效率大打折扣；

1.传值

解引用使用点号（.）:

struct stu
{
    int arr[5];
    char ch;
};
void Print(struct stu s)
{
    for (int i = 0; i < 5; i++)
    {
        printf("%d ", s.arr[i]);
    }
    printf("%c\n", s.ch);
}
int main()
{
    struct stu s1 = { { 1,2,3,4,5 },'a' };

    Print(s1);

    return 0;
}

2.传址

解引用使用指向符（->）：

struct stu
{
    int arr[5];
    char ch;
};
void Print(struct stu* s)
{
    for (int i = 0; i < 5; i++)
    {
        printf("%d ", s->arr[i]);
    }
    printf("%c\n", s->ch);
}
int main()
{
    struct stu s1 = { { 1,2,3,4,5 },'a' };

    Print(&s1);

    return 0;
}

结构体内存对齐

思考：当我们计算某个结构体的大小时，难道也是直接根据对应成员的数据类型大小求和吗？

其实结构体的大小不能直接根据成员大小来计算，而是与每个成员的定义顺序有关；

我们先来看这个在面这个例子：三个结构体的成员只是顺序不同，就导致大小有所差异。

究其原因是因为结构体在存储时存在内存对齐。

接下来就手把手带你计算结构体大小，不想会都难，学会了将一劳永逸。

对齐规则：

第一个成员在偏移量为0的地址处；

后面的成员变量，从上一个成员的结束位置开始向后找，找到某个数（对齐数的整数倍位置）；

对齐数 = 编译器默认对齐数与该成员类型的较小值；（vs默认是8）

最终结构体的总大小：是最大对齐数（每个成员的对齐数）的整数倍；

如果结构体嵌套：嵌套的结构体先根据上述方法对齐到正确的位置，最终结构体的大小是所有对齐数的整数倍（包括被嵌套的结构体的对齐数）；

上述代码图解：*

修改默认对齐数：

有时候结构对齐数不合适，我们可以使用#pragam预处理命令，可以修改默认对齐数；

像下面这样，默认对齐数改为了1该结构体大小就变为14：

#pragma pack(1)
struct Peo
{
    char name[5];
    int age;
    char sex[5];
};
#pragma pack()
int main()
{
    printf("%zd\n", sizeof(struct Peo));

    return 0;
}

若将默认对齐数改为7，会出现这样的警告：

offsetof宏

这里介绍一个宏：可以计算结构体成员在内存中的偏移量

size_t****offsetof(structName,memberName);

内存对齐的意义：

通过上述演示我们发现，既然内存对齐存在浪费空间的情况，那为什么要注意做呢？

实质上：内存对齐是拿空间换去时间的做法；

性能方面：

  首先我们要搞清楚一点：在cpu看来，内存并不是简单的以一个字节去划分的，而是以块为单位，一个块可能是2,4,8,16个字节，因此将结构体内存对齐，可以避免处理器进行二次访问内存，节省时间成本；

移植性原因：

  并不是所有的硬件平台都能访问任意地址处的数据；

结论：我们在设计结构体成员时，要尽可能安排合适的顺序，考虑到内存对齐，防止过多的空间被浪费。

位段

什么是位段

    位段这一概念是结构体中必须提到的知识点，C语言允许在一个结构体中以位为单位来指定其成员所占内存长度，这种以位为单位的成员称为“位段”或称“卫浴”( bit field) 。利用位段能够用较少的位数存储数据。

    比如我只需要一个表示0或1的数，那么就只需要给它分配1个bit位即可，如果只需要一个表示0~3的数，那么只需要给它分配2个bit位即可。

要求：

位段的成员必须是int、unsigned int、signed int（或者char）；

位段的我成员名之后有一个冒号和数字；

冒号后面的大小不能超过前面类型的所属bit位大小；

比如：下面这样一个结构体大小只占4个字节：

因此，结构体在内存对齐时会浪费空间，那么利用位段可以节省空间

struct stu
{
    int a : 1;
    int b : 2;
    int c : 3;
    int d : 4;
};
int main()
{
    printf("%zd\n", sizeof(struct stu));

    return 0;
}

既然如此，那位段的内存又是如何分配的呢？

位段的内存分配

下面这个例子输出为：3 0 3 12 13；

struct stu
{
    char a : 1;
    char b : 3;
    char c : 5;
    char d : 6;
};
int main()
{
    printf("%zd\n", sizeof(struct stu));

    struct stu s1 = { 0 };

    s1.a = 10;
    s1.b = 11;
    s1.c = 12;
    s1.d = 13;

    printf("%d\n", s1.a);
    printf("%d\n", s1.b);
    printf("%d\n", s1.c);
    printf("%d\n", s1.d);

    return 0;
}

过程：

a只有分配了1个bit位，而10的二进制有效位占了4个bit位，10被截断为0，先开辟一个字节（假设8个bit位）空间，放a，这个字节剩余7个bit位；
b同样得到3个bit位，11被截断为三位变成3，这三位在刚才剩余的7位中能放下，则紧跟着放入b；
c同样的到5个bit位，12被截断为5位，可以完整表示12，但由于刚才已经使用了（1+3=）4个bit位，剩余4位不够放c的值，那么再开辟一个字节空间，依次类推，最终为该结构开辟了3个字节空间。

图解：

位段的跨平台问题：

虽说使用位段可以很好的节省空间，但是它也存在缺陷，那就是跨平台问题：

int 位段被当成有符号数还是无符号数是不确定的；

位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题）；

位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义；

当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的；

标签： c语言开发语言

本文转载自: https://blog.csdn.net/m0_65190367/article/details/126538082
版权归原作者 @Main. 所有，如有侵权，请联系我们删除。