【Linux】深入理解GCC/G++编译流程及库文件管理

1.背景知识

(1) 预处理（宏替换，条件编译）

(2) 编译（生成汇编）

(3) 汇编（生成机器可识别代码）

(4) 链接（生成可执行文件或库文件）

2.gcc/g++如何完成编译

格式 gcc [选项] 要编译的文件 [选项] [目标文件]

(1) 预处理（进行宏替换）

● 预处理功能个主要包括宏定义，文件包含，条件编译，去注释等。

● 预处理指令是以#号开头的代码行

● 【-E】选项的作用是，从现在开始进入程序编译，在预处理的时候就停下来

● 【-o】选项是指定目标文件，【.i】文件为已经预处理过的C原始程序

● 实例：**gcc -E test.c -o test.i **将原始C语言代码预处理后的内容写到指定的 test.i 文件里

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc -E test.c -o test.i
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll
-rw-rw-rw- 1 zyt zyt   270 Nov 18 09:16 test.c
-rw-rw-r-- 1 zyt zyt 16951 Nov 18 09:16 test.i

● 得到的【.i】文件还是C语言文件

● 预处理后的【.i 】文件相比原来大很多

那是因为预处理器会将

#include

指令包含的头文件内容直接插入到源文件中（这些头文件都是被提前装在系统的

/usr/include

目录下）；预处理器宏定义展开；预处理器还会处理条件编译指令，如

#ifdef

、

#ifndef

、

#endif

等，这些指令可能会根据条件包含或排除某些代码段。

● 如何理解条件编译？

对软件进行专业度，收费情况进行区分（业务），使用条件编译，可以进行代码动态裁剪。

内核源代码也是用条件编译进行代码裁剪。

开发工具，应用软件也是用条件编译对功能代码动态裁剪。

(2) 编译（生成汇编）

● 在这个阶段中，gcc首先要检查代码的规范性、是否有语法错误等，以确定代码实际要做的工作，在检查无误后，gcc把代码翻译成汇编语言。

● 使用【-S】选项，gcc 会将C语言代码编译成汇编语言，并将结果输出到一个文件中，该文件的扩展名通常是【.s】

。

● 实例：gcc -S test.i -o test.s

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc -S test.i -o test.s
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll
total 28
-rw-rw-rw- 1 zyt zyt   284 Nov 18 09:36 test.c
-rw-rw-r-- 1 zyt zyt 16945 Nov 18 09:37 test.i
-rw-rw-r-- 1 zyt zyt   589 Nov 18 09:39 test.s

我们打开.s文件看看，得到的是汇编文件

(3) 汇编（生成机器可识别代码）

● 汇编阶段是把编译阶段生成的【.s】文件转成目标文件

● 这个目标文件其实就是可重定位目标文件，此时已经是二进制文件了，但是无法直接执行，即使加上可执行权限。那是因为这个.o文件只是把我写的源文件编译成二进制了，而我们写的源文件中会包含很多的库方法，这些库方法还没有跟我们写的内容关联起来，所以是不可能运行的。（形象来说，就是我写的代码里用到了ptintf方法，但.o文件里没有print方法的实现，它的实践是在库里面实现的），win上形成的是XXX.obj。

● 使用【-c】选项就可以看到汇编代码转化为.o后缀的二进制目标代码了

● 实例：gcc -c test.s -o test.o

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc -c test.s -o test.o
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll
total 32
-rw-rw-rw- 1 zyt zyt   284 Nov 18 09:36 test.c
-rw-rw-r-- 1 zyt zyt 16945 Nov 18 09:37 test.i
-rw-rw-r-- 1 zyt zyt  1672 Nov 18 09:57 test.o
-rw-rw-r-- 1 zyt zyt   589 Nov 18 09:39 test.s

vim打开【.o】文件后：

(4) 链接（生成可执行文件或库文件）

● gcc 本身是编译C语言的，会在系统里找出可执行程序依赖的库

● 链接器它将一个或多个.o文件与所需的库文件链接起来，解决所有的外部引用，并生成一个单一的可执行文件。

● 实例：** gcc test.o -o test**

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc test.o -o test
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll
total 44
-rwxrwxr-x 1 zyt zyt  8496 Nov 18 10:13 test
-rw-rw-rw- 1 zyt zyt   284 Nov 18 09:36 test.c
-rw-rw-r-- 1 zyt zyt 16945 Nov 18 09:37 test.i
-rw-rw-r-- 1 zyt zyt  1672 Nov 18 09:57 test.o
-rw-rw-r-- 1 zyt zyt   589 Nov 18 09:39 test.s
# 运行一下
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ./test
Hello!,100
Hello!
hello N!

(5) 总结

我们上面将gcc完成编译的整个过程通过【-E】【-S】【-c】选项显性的展示成后缀为【.i】【.s】【.o】的临时文件，但是正常编译时，这些后缀文件不会以文件的形式写到磁盘上，而是在gcc编译器启动之后将这些编译形成的临时文件全都写到编译器内部，在内存中就处理好了，最终直接给我们呈现一个可执行文件。

选项记忆技巧：**将编译带选项时联想到键盘上的ESC键，即

-E

、

-S

、

-c

，依次生成的文件可以联想到.iso镜像文件，即

.i

、

.s

、

.o

(6) 函数库

● 我们的C程序中，并没有定义“printf”的函数实现，且在预编译中包含的“stdio.h”中也只有该函数的声明，而没有定义函数的实现，那么是在哪里实现的？

● 其实是：系统把这些函数实现都放到名为【libc.so.6】的库文件中了，在没有特别指定时，gcc会到系统默认的搜索路径【/usr/lib】下进行查找，也就是链接到【libc.so.6】库函数中去就能实现函数“printf”了，而这也就是链接的作用。

● 函数库一般分为两大类，分别是静态（static）与动态（dynamic）函数库。

● 什么叫做动静态链接？如何理解？

① 静态函数库

● 扩展名：libxxx.a

● 编译操作

编译链接时，把库文件的代码全部加入到可执行文件中，因此生成的文件比较大。但在运行时也就不再需要库文件了，也就是编译成功的可执行文件可以独立运行。

● 升级难易程度

虽然执行文件可以独立执行，但因为函数库是直接整合到执行文件中的，所以若函数库升级时，整个执行文件必须要重新编译才能将新版的函数库整合到程序中。也就是说，在升级方面只要函数库升级了，所有使用此函数库的程序都要重新编译。

② 动态函数库

● 扩展名：libxxx.so

● 编译操作

与静态函数被整个整合到程序中不同的是，动态函数库在编译时，在程序里面只有一个【指针】的位置而已（地址上产生关联，让我的程序能找到库里面方法的地址）。也就是说，动态函数库的内容并没有被整合到执行文件当中，而是当执行文件要使用到函数库的功能时，程序才会去读取函数库来使用（跳转到库里面执行，完了再返回）。由于执行文件当中仅具有指向动态函数库所在的指针而已，并不包含函数库的内容，所以它的文件会比较小。

● 独立执行状态

这类函数库所编译出的程序不能被独立执行，因为当我们使用到函数库的功能时，程序才会去读取函数，所以函数库文件【必须要存在】才行，而且，函数库的【所在目录也不能改变】，因为我们的可执行文件里面仅有【指针】，亦即当要使用该动态函数库时，程序会主动去某个路径下读取，所以动态函数库可不能随意移动或删除，会影响很多依赖的程序软件。

● 升级难易程度

当函数库升级后，执行文件根本不需要进行重新编译的操作，因为执行文件会直接指向新的函数库文件（前提是函数库新旧版本的文件名相同）。

**● **gcc默认生成的二进制程序，是动态链接的，这点可以通过file命令验证。

● 动态库的本质：使语言层面的公共代码在内存中只出现一份。

在执行gcc动态链接形成可执行文件时，这个动态库会跟该文件一样被加载到内存里，后续再用gcc编译其他文件时要是也用到这个库，就不用在加载了，直接跳转到内存中的库即可。

③ 动静态库比较

1、动态库形成的可执行程序体积一定很小

2、可执行程序对静态库的依赖度很小，但动态库不能缺失

3、程序运行需要加载到内存，静态链接时，会在内存中出现大量的重复代码，动态链接时，比较节省内存和磁盘资源。

④ 验证动/静态链接

1、验证gcc默认是动态链接

test.c文件里面简单写入：

  1 #include<stdio.h>
  2 int main()
  3 {
  4     printf("Hello!\n");
  5     return 0;
  6 }

用gcc完成编译后用 ldd,file 查看该文件详细信息: 得到的 test 是64位、可执行、动态链接的文件。

链接的动态库就是libc-2.17.so（这是系统里本来就预装的）

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll /usr/lib64/libc.so*
-rw-r--r-- 1 root root 253 Jul  3  2019 /usr/lib64/libc.so
lrwxrwxrwx 1 root root  12 Jul 11  2019 /usr/lib64/libc.so.6 -> libc-2.17.so

** 2、如果我们想要用静态库连接**

前提：系统里就必须要存在C静态库，但我们指明【-satic】执行后发现系统里没有C静态库。

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc test.c -o test -static
/usr/bin/ld: cannot find -lc
collect2: error: ld returned 1 exit status

安装glic静态库用【sudo yum install -y glibc-static】系统会默认把它装到【/usr/lib64/】下，文件名就叫做libc.a。（g++使用也与之类似【sudo yum install libstdc++-static】）

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll /usr/lib64/libc.a
-rw-r--r-- 1 root root 5105516 Jun  4 23:05 /usr/lib64/libc.a

然后再进行gcc静态编译，发现这个可执行文件会特别的大。比之前动态链接生成的可执行文件大了100倍。用ldd、file观察也显示的是静态链接。

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc test.c -o test -static
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ll
total 848
-rwxrwxr-x 1 zyt zyt 861336 Nov 18 15:43 test
-rw-rw-rw- 1 zyt zyt     71 Nov 18 15:21 test.c

⑤ ldd - 程序的动态函数库解析

我们如何判断某个可执行的二进制文件含有什么动态函数库？

ldd [-vdr] [filename]

-v：列出所有内容信息

-d：重新将数据有遗失的链接点显示出来

-r：将ELF有关的的错误内容显示出来（某些特定信息，比如ELF头信息、节信息等。这些信息对于调试和分析ELF文件非常有用，尤其是在遇到与ELF文件格式相关的问题时）

用ldd查看一下我们刚刚实现的可执行文件test，我们观察到【libc.so.6】就是我们使用的动态链接库，【libc.so.6】是C标准库实现的，是大多数 Linux 程序运行时所依赖的核心库之一。

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ldd -v test
    linux-vdso.so.1 =>  (0x00007ffea694a000)
    libc.so.6 => /lib64/libc.so.6 (0x00007fefa2f56000)
    /lib64/ld-linux-x86-64.so.2 (0x00007fefa3323000)

    Version information:
    ./test:
        libc.so.6 (GLIBC_2.2.5) => /lib64/libc.so.6
    /lib64/libc.so.6:
        ld-linux-x86-64.so.2 (GLIBC_2.3) => /lib64/ld-linux-x86-64.so.2
        ld-linux-x86-64.so.2 (GLIBC_PRIVATE) => /lib64/ld-linux-x86-64.so.2

(7) gcc选项

● -D：进行命令行级别的宏定义

这个选项后面跟着你想要定义的宏名称，如果你还想要为宏指定一个值，如果宏没有值，GCC 会定义它为

1。

test.c文件里面的内容：

  1 #include<stdio.h>
  2 #define M 100
  3 
  4 int main()
  5 {
  6     printf("Hello!%d\n",M);
  7     //printf("Hello!");
  8     //printf("Hello!");    
  9     printf("Hello!\n");
 10 
 11     #ifdef N
 12         printf("hello N!\n");
 13     #else
 14         printf("hello no N!\n");
 15     #endif
 16         return 0;
 17 }

我们命令行新定义的一个宏N（不能与源代码中定义的宏相同）

[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ gcc test.c -o test -DN=10
[zyt@iZ2vcf9wvlgcetfeub9f11Z ~]$ ./test
Hello!100
Hello!
hello N!

**● **-E 只激活预处理,这个不生成文件,你需要把它重定向到一个输出文件里面

**● **-S 编译到汇编语言不进行汇编和链接

**● **-c 编译到目标代码

**● **-o 文件输出到文件

**● **-static 此选项对生成的文件采用静态链接

**● **-g 生成调试信息。GNU 调试器可利用该信息。

**● **-shared 此选项将尽量使用动态库，所以生成文件比较小，但是需要系统由动态库.

**● **-O0

**● **-O1

**● **-O2

**● **-O3 编译器的优化选项的4个级别，-O0表示没有优化,-O1为缺省值，-O3优化级别最高

**● **-w 不生成任何警告信息。

**● **-Wall 生成所有警告信息。

标签： linux 运维服务器

本文转载自: https://blog.csdn.net/2401_83431652/article/details/143843225
版权归原作者 忧伤的大鼻嘎 所有，如有侵权，请联系我们删除。

【Linux】深入理解GCC/G++编译流程及库文件管理

1.背景知识

2.gcc/g++如何完成编译

(1) 预处理（进行宏替换）

(2) 编译（生成汇编）

(3) 汇编（生成机器可识别代码）

(4) 链接（生成可执行文件或库文件）

(5) 总结

(6) 函数库

① 静态函数库

② 动态函数库

③ 动静态库比较

④ 验证动/静态链接

⑤ ldd - 程序的动态函数库解析

(7) gcc选项

发表评论

“【Linux】深入理解GCC/G++编译流程及库文件管理”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航