【Linux】进程的程序替换

文章目录

1. 程序替换

1.创建子进程的目的是什么？

目标：为了让子进程帮父进程执行特定的任务

具体做法：1. 让子进程执行父进程的一部分代码

红框中的代码实际上是父进程的代码，在没有执行fork之前代码就有了，在没有创建子进程之前，父进程的代码加载到内存了，子进程被创建出来是没有独立的代码，这个代码是父进程的代码，父进程通过if判断分流让子进程去跑了
2.创建一个子进程不执行父进程的代码，而是让子进程在磁盘当中执行全新的程序，这种操作称之为进程的程序替换

2.了解程序是如何进行替换的

程序替换函数

execl

输入

man execl

查看程序替换接口

int execl(const char *path, const char *arg, …);
括号内部的 . . . 称为可变参数列表，可以给c函数传递任意个数的参数
第一个参数为要执行什么命令
第二个参数为要怎样执行程序
最后以NULL结尾表示参数传完了

创建test.c文件并输入以下内容

#include<stdio.h>#include<stdlib.h>#include<unistd.h>intmain(){printf("begin......\n");printf("begin......\n");printf("begin......\n");printf("begin......\n");execl("/bin/ls","ls","-a","-l",NULL);printf("end........\n");printf("end........\n");printf("end........\n");printf("end........\n");}

运行可执行程序发现，只有begin 以及执行 ls -l -a显示的指令

再次修改test.c文件内容如下

#include<stdio.h>#include<stdlib.h>#include<unistd.h>intmain(){printf("begin......\n");printf("begin......\n");printf("begin......\n");printf("begin......\n");printf("我已经是一个进程啦，我的PID:%d\n",getpid());execl("/bin/ls","ls","-a","-l",NULL);printf("end........\n");printf("end........\n");printf("end........\n");printf("end........\n");}

test.c 经过编译形成mytest可执行程序，./可执行程序就变成进程了，CPU调度进程，打印出代码中的打印语句，同时调用程序替换execl，将ls程序执行起来了

[yzq@VM-8-8-centos nn]$ file /bin/ls
/bin/ls: ELF 64-bit LSB executable, x86-64, version 1(SYSV), dynamically linked(uses shared libs),for GNU/Linux 2.6.32, BuildID[sha1]=c8ada1f7095f6b2bb7ddc848e088c2d615c3743e, stripped

使用的 /bin/ls 命令实际上是一个可执行程序，所以ls程序是在磁盘上的

前面执行的是自己代码的一部分，当调用execl时，将磁盘中可执行程序替换当前进程的代码和数据
后半部分就不执行自己的代码了，执行ls所对应的代码，这个现象就叫做程序替换

程序替换就是让一个进程去执行另一个在磁盘中的程序，让一个进程把一个新的程序运行起来

3. 程序替换的基本原理

在这里插入图片描述
当前的进程执行当前代码时，如果执行了函数execl等接口，就会根据你所传入的程序的路径以及你要执行的名称及选项，把磁盘当中的一个其他的程序加载到对应的内存，
用新程序的代码替换当前进程的代码段，用当前进程的数据替换老进程的数据段

站在进程的角度
进程的程序替换有没有创建新的进程呢？
没有，只是将新的程序加载到当前进程的代码段和数据段，用CPU去调度当前进程就可以跑起来了

站在程序的角度
程序被加载了内存中，就可以称程序替换的接口(execl) 为加载器

当创建进程的时候，先有进程数据结构，还是先加载代码和数据？

修改test.c文件为以下内容

#include<stdio.h>2    #include<stdlib.h>3   #include<unistd.h>4intmain()5{6execl("/bin/ls","ls","-a","-l",NULL);7}

此时运行可执行程序，自己就写了一个ls命令

创建子进程，让子进程调用execl，在调用execl把代码和数据加载到内存
所以当创建进程的时候，先有进程数据结构，再加载代码和数据

程序替换是整体替换，不是局部替换

修改test.c文件内容如下

#include<stdio.h>2    #include<stdlib.h>3   #include<unistd.h>4 #include<sys/wait.h>5intmain()6{7      pid_t id=fork();8if(id==0)9{10//child11printf("我是子进程:%d\n",getpid());12execl("/bin/ls","ls","-a","-l",NULL);13}sleep(5);14printf("我是父进程:%d\n",getpid());15waitpid(id,NULL,0);16}

查看子进程完成替换后会不会影响父进程，如果影响父进程，就不应该打印父进程的这句话了

过了5秒钟，父进程结果打印出来，说明父进程不受子进程影响

程序替换只会影响调用进程，进程具有独立性
父子进程都有自己独立的PCB 地址空间页表也会自己的映射关系
虽然代码有可能是跟父进程共享，当子进程进行程序替换的时候，子进程会加载新进程的代码和数据
操作系统会发生写时拷贝，将代码和数据进行区分，使子进程形成新的映射关系，从而使子进程不会影响到父进程

execl 返回值

如果出错了，execl返回值为-1

修改test.c文件内容如下

#include<stdio.h>2    #include<stdlib.h>3   #include<unistd.h>4 #include<sys/wait.h>5intmain()6{7      pid_t id=fork();8if(id==0)9{10//child11printf("我是子进程:%d\n",getpid());12int n=execl("/bin/lsss","lsss","-a","-l",NULL);//lsss命令不存在     13printf("you can see me:%d\n",n);14exit(0);15}16sleep(5);17printf("我是父进程:%d\n",getpid());18waitpid(id,NULL,0);19}20

输入的lsss命令不存在，查询报错后的execl的返回值

程序替换只要成功，就会跑去执行新程序，失败了就会继续向后运行
所以execl程序替换成功不会有返回值——>如果替换失败，一定有返回值——>如果失败了，必定返回——>只要有返回值就失败了
说明不用对execl函数的返回值进行判断，只要继续向后运行一定失败

4. 替换函数

1. execl

int execl(const char *path, const char *arg, …);
l 代表 list 链表
path：代表你想执行谁 (需要带路径)
执行一个程序最基本的原则为：找到它，加载执行它
arg：你想怎么执行它(若想执行ls指令，是只执行ls，还是执行ls- l 、ls -l -a指令
在命令行怎么执行这个命令，就把参数一个一个的传递给execl就可以了
最终以NULL结尾

具体的实现以及返回值问题上面在演示程序替换时已经使用过啦

2. execv

int execv(const char *path, char *const argv[]);
v代表vector 容器
path：代表你想执行谁 (需要带路径)
把原来需要一个一个传的参数放在argv[]数组中

修改test.c文件内容

1    #include<stdio.h>2    #include<stdlib.h>3   #include<unistd.h>4 #include<sys/wait.h>5intmain()6{7      pid_t id=fork();8if(id==0)9{10//child11printf("我是子进程:%d\n",getpid());12char*const myargv[]={"ls","-l","-a",NULL};13execv("/bin/ls",myargv);14exit(0);15}16sleep(5);17printf("我是父进程:%d\n",getpid());18waitpid(id,NULL,0);19}20

执行可执行程序，依旧可以执行ls指令

3. execlp

int execlp(const char *file, const char *arg, …);
带p:代表当执行程序的时候，只需要指定程序名即可，系统会自动在PATH环境变量中查找
file: 不需要传路径，只需要把在PATH环境变量的指令传过来
最后以NULL结尾

#include<stdio.h>2    #include<stdlib.h>3   #include<unistd.h>4 #include<sys/wait.h>5intmain()6{7      pid_t id=fork();8if(id==0)9{10//child  11printf("我是子进程:%d\n",getpid());12execlp("ls","ls","-l","-a",NULL);13exit(0);14}15sleep(5);16printf("我是父进程:%d\n",getpid());17waitpid(id,NULL,0);18}

执行可执行程序，依旧可以执行ls指令

4. execvp

int execvp(const char *file, char *const argv[]);
带p:代表当执行程序的时候，只需要指定程序名即可，系统会自动在PATH环境变量中查找
v代表vector 容器

#include<stdio.h>#include<stdlib.h>#include<unistd.h>#include<sys/wait.h>intmain(){    
       pid_t id=fork();if(id==0){//child    printf("我是子进程:%d\n",getpid());char*const myargv[]={"ls","-l","-a",NULL};execvp("ls", myargv);exit(0);}sleep(5);printf("我是父进程:%d\n",getpid());waitpid(id,NULL,0);}

在这里插入图片描述

5. execle

int execle(const char *path, const char *arg,
…, char * const envp[]);
path：代表你想执行谁 (需要带路径)
envp[]：代表自定义环境变量
如果调用程序替换时，若不想让子进程使用父进程的环境列表，想自定义环境变量，就可以自己传一个环境变量

在另一个目录中创建other.cc (以cc为结尾说明是一个c++程序)，并输入以下内容

#include<iostream>#include<unistd.h>#include<stdlib.h>usingnamespace std;intmain(){for(int i =0; i <5; i++){    
      cout<<"我是另一个程序，我的pid是:"<<getpid()<<endl;                                                                                                                                 
        cout <<" MYENV: "<<(getenv("MYENV")==NULL?"NULL":getenv("MYENV"))<< endl;sleep(1);}return0;}

修改test.c文件为以下内容

#include<stdio.h>#include<stdlib.h>#include<unistd.h>#include<sys/wait.h>intmain(){    
       pid_t id=fork();if(id==0){//child    printf("我是子进程:%d\n",getpid());    
W>char*const myenv[]={"MYENV=YouCanSeeMe",NULL};execle("/home/mydir/my/mm/myother","myother",NULL,myenv);exit(0);}sleep(1);printf("我是父进程:%d\n",getpid());int  status=0;waitpid(id,&status,0);return0;}

在这里插入图片描述

第一个路径为other.cc生成的可执行程序 myother 所在的绝对路径

2. 自定义shell

编写极简版本的shell(bash)
目标:为了深刻的理解shell的运行原理

输入

ps ajx |grep bash

，发现bash就是一个进程

在这里插入图片描述

由于shell是一个进程，所以用while死循环

缓冲区问题

在这里插入图片描述
正常来说，运行可执行程序会显示命令行，但是由于没有\n刷新缓冲区，也没有使用相关的刷新库函数，所以命令行会一直在缓冲区中直到程序结束才显示，但是这是个死循环，所以什么都不会显示

在这里插入图片描述

执行可执行程序后即可显示命令行

fgets 使用出现空格问题

fgets 标准输入按行获取
char *fgets(char *s, int size, FILE *stream);
从特定的标准输入当中获取对应的命令行输入，把对应的数据放在缓冲区中

执行可执行程序后，发现在命令行中输入 ls -a ，就会打印出 ls -a,但是输入时会多出一个空行

在这里插入图片描述

正常来说，都会使用回车来到下一行，而这个回车被fgets读取到了

在这里插入图片描述
将最后的回车符替换成’\0’

在这里插入图片描述
此时就没有空格出现了

完整代码

: mybash.c ???? buffers 
  #include<stdio.h>#include<unistd.h>#include<string.h>#include<assert.h>#include<sys/types.h>#include<sys/wait.h>#include<stdlib.h>#defineMAX1024#defineARGC64#defineSEP" "intsplit(char*commandstr,char*argv[]){assert(commandstr);assert(argv);
      argv[0]=strtok(commandstr,SEP);//在commandstr以空格作为分割符if(argv[0]==NULL)//切割失败{return-1;}int i=1;while(1){
       argv[i]=strtok(NULL,SEP);//继续切割空格if(argv[i]==NULL){break;}
       i++;}
W>}voidprint(char*argv[]){int i=0;for(i=0;argv[i];i++){printf("%d:%s\n",i,argv[i]);}}intmain(){while(1){char commandstr[MAX]={0};char*argv[ARGC]={NULL};printf("[yzq@mymachine currpath]# ");fflush(stdout);char*s=fgets(commandstr,sizeof(commandstr),stdin);assert(s);(void)s;//保证在release方式发布的时候，因为去掉assert了，所以s就没有被使用，而带来的编译告警, 什么都没做，但是充当一次使用
    commandstr[strlen(commandstr)-1]='\0';//将最后的回车符用'\0'覆盖掉int n=split(commandstr,argv);//从命令行中获取的字符串传入argv中if(n!=0)continue;//切割失败就什么都不做// print(argv);//打印字符串
    pid_t id=fork();assert(id>=0);(void)id;if(id==0){//childexecvp(argv[0],argv);exit(1);}int status=0;waitpid(id,&status,0);}}

动图演示

在这里插入图片描述

标签： linux 运维服务器

本文转载自: https://blog.csdn.net/qq_62939852/article/details/129546632
版权归原作者 风起、风落 所有，如有侵权，请联系我们删除。

【Linux】进程的程序替换

文章目录

1. 程序替换

1.创建子进程的目的是什么？

2.了解程序是如何进行替换的

3. 程序替换的基本原理

当创建进程的时候，先有进程数据结构，还是先加载代码和数据？

程序替换是整体替换，不是局部替换

execl 返回值

4. 替换函数

1. execl

2. execv

3. execlp

4. execvp

5. execle

2. 自定义shell

缓冲区问题

fgets 使用出现空格问题

完整代码

动图演示

发表评论

“【Linux】进程的程序替换”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航