【Linux】进程创建/终止/等待/替换

一、子进程的创建

1、fork函数的概念

在linux中fork函数是非常重要的函数，它从已存在进程中创建一个新进程。新进程为子进程（子进程的PID是0），而原进程为父进程。

#include <unistd.h>
pid_t fork(void);

返回值：fork创建子进程成功后，会给父进程返回子进程的PID，给子进程返回0，失败则返回-1。

为什么要让父进程拿到子进程的PID?因为子进程变为僵尸状态后，需要父进程读取子进程的退出信息并回收资源。

操作系统将会给创建成功的子进程：

1、给子进程分配新的内存块和内核数据结构（PCB、进程地址空间、页表等，并构建对应的映射关系）；

2、将父进程的部分数据结构内容拷贝至父进程；

3、把子进程添加到系统进程列表中；

4、fork返回，调度器开始调度。

2、如何理解fork拥有两个返回值

在fork函数return之前，就已经有了父子两个进程，给父进程返回子进程的PID，给子进程返回0，失败则返回-1。

利用这个特性，我们可以用变量接收返回值，根据fork返回值不同让父子进程执行不同的代码。

#include <stdio.h>
#include <unistd.h>
int main()
{
    pid_t id=fork();
    if(id==0)
    {
        printf("子进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
    }
    else if(id>0)
    {
        printf("父进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
        sleep(1);
    }
    else 
    {
        printf("fork error\n");
        return 1;
    }
    return 0;
}

pid_t id=fork()这句代码父子进程谁先返回不确定。谁先返回，谁就在虚拟内存中写入id的值，后返回的进程由于进程的独立性将会发生写时拷贝。所以，我们可以看到父子进程的id变量的虚拟地址是一样的，但是内容却不一样。

3、fork调用失败的场景

系统中的进程数达到了最大限制。

二、进程的终止

1、main函数返回值

1.1main函数的返回值的意义

int main()
{
    return 0;
}

return 后面的值代表进程退出的时候，对应的退出码。标定进程执行的结果是否正确。

如果不关心一个进程的退出码，可以直接return 0；如果要关心进程的退出码，则要返回特定的数字以表明进程不同的错误。

1.2将错误码转化为错误信息

函数原型：

#include <string.h>
char* strerror(int errnum);

遍历打印错误码：

#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main()
{
    for(int i=0;i<150;++i)
    {
        printf("num[%d]:%s\n",i,strerror(i));
    }
    return 0;
}

可以看到不同的错误码对应的出错误信息。

1.3查看进程的退出码

echo $?

$?会记录最近一个进程在命令行中执行完毕时的退出码，即main函数的返回值。

2、进程退出的情况

1、进程的正常退出与异常退出

正常终止（父进程获取退出码）：

1、程序执行完毕，main函数返回0

2、程序执行完毕，但是返回值不为0，例如调用exit()和_exit()或return !0。

异常终止（父进程获取退出信号）：

ctrl+c或除0错误等导致程序被信号终止。

2、库函数exit

函数原型：

#include <stdlib.h>
void exit(int status);

库函数exit在进程退出后，会主动刷新缓冲区。

3、系统调用_exit

函数原型：

#include <unistd.h>
void _exit(int status);

系统调用_exit在进程退出后，并不会主动刷新缓冲区。

三、进程等待

1、进程等待的必要性

子进程退出后会进入僵尸状态，父进程通过进程等待的方式，获取子进程的退出信息，回收子进程资源，让子进程结束僵尸状态。当然，在子进程没有退出时，父进程只能阻塞等待子进程变成僵尸状态。

2、进程等待的方法

头文件：

#include <sys/types.h>
#include <sys/wait.h>

2.1系统调用wait

函数原型：

pid_t wait(int* status);

返回值：等待成功被等待进程的pid，失败返回-1。

参数：status输出型参数，获取子进程退出码和退出状态,不关心则可以设置成为NULL。

通过wait让父进程获取子进程的PID。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
    pid_t id=fork();
    if(id==0)
    {
        //子进程
        int cnt=3;
        while(cnt--)
        {
            printf("子进程：%d  父进程：%d  %d\n",getpid(),getppid(),cnt);
            sleep(1);
        }
        exit(0);//子进程退出
    }
    sleep(5);
    pid_t ret =wait(NULL);
    if(id>0) 
    {
        //父进程
        printf("等待成功:%d\n",ret);
    }
    
    return 0;
}

2.2系统调用waitpid

函数原型：

pid_t waitpid(pid_t pid,int* status,int options);

返回值：当正常返回的时候waitpid返回收集到的子进程的进程PID；如果设置了选项WNOHANG,而调用waitpid发现没有已退出的子进程可收集,则返回0；如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在；

参数：

PID：

PID=-1,等待任一个子进程。与wait等效。PID>0，等待进程为PID的子进程。

**status: **

WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）

WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）

//WIFEXITED和WEXITSTATUS是两个宏
if(WIFEXITED(status))//判断子进程是否正常退出（判断退出信号）
{
    printf("exit code:%d\n",WEXITSTATUS(status));//判断子进程运行结果是否正常（判断退出码）
}
else{
    //something to do 
}

options:

WNOHANG: 若PID指定的子进程没有结束，则waitpid()函数返回0，不予以等待。若正常结束，则返回该子进程的PID。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
    pid_t id=fork();
    if(id==0)
    {
        //子进程
        int cnt=3;
        while(cnt--)
        {
            printf("子进程：%d  父进程：%d  %d\n",getpid(),getppid(),cnt);
            sleep(1);
        }
        exit(10);//子进程退出
    }
    int status=0;
    pid_t ret =waitpid(id,&status,0);
    if(id>0) 
    {
        //父进程
        printf("等待成功:%d,ret=%d\n",ret,status);
    }
    sleep(5);
    return 0;
}

通过修改子进程的退出码，可以打印出不同的status值，因为status用于存储子进程的退出码和退出信号。

3、status值的意义

wait和waitpid，都有一个status参数，该参数是一个输出型参数，由操作系统填充。

如果传递NULL，表示不关心子进程的退出状态信息。

否则，操作系统会根据该参数，将子进程的退出信息反馈给父进程。

status不能简单的当作整型，可以当作位图来看待。（只研究status低16比特位）：

在进程退出时，终止信号是评判一个进程是否正常退出；退出状态是评判一个进程运行的结果是否正确。

1、使用kill -l来查看进程终止的信号。

2、根据退出码确定进程的退出状态。

以下代码手动调用waitpid模拟父进程等待子进程的过程：

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
    pid_t id=fork();
    if(id==0)
    {
        //子进程
        int cnt=3;
        while(cnt--)
        {
            printf("子进程：%d  父进程：%d  %d\n",getpid(),getppid(),cnt);
            sleep(1);
        }
        exit(10);//子进程退出
    }
    int status=0;
    pid_t ret =waitpid(id,&status,0);
    if(id>0) 
    {
        //父进程
        printf("等待成功,返回值子进程的PID:%d,终止信号：%d,子进程退出码：%d\n",ret,(status&0X7F),((status>>8)&0XFF));
    }
    sleep(5);
    return 0;
}

4、图解父进程等待子进程的方式

1、调用wait/waitpid后，父进程只能阻塞等待子进程变成僵尸状态。

2、子进程退出后变成僵尸状态，task_struct中的代码和数据会被释放掉，并把自己的退出信号、退出码写入到自己的task_struct中；

3、wait/waitpid是系统调用，操作系统有资格也有能力去读取子进程的task_struct。

4、父进程通过进程等待的方式，获取子进程的退出信息，回收子进程资源，让子进程结束僵尸状态。

5、阻塞/非阻塞式等待

阻塞式等待：当父进程调用wait/waitpid（第三个参数为0）等待子进程，如果子进程暂未退出，父进程会被阻塞，暂停运行，如果父进程刚好没事干，可以选择使用阻塞等待。

非阻塞式等待：当父进程调用waitpid（第三个参数为WNOHANG）等待子进程，如果父进程检测到子进程未退出，父进程并不会原地等待，而是继续执行自己的代码。如果使用while循环，便能达到轮询的效果。

非阻塞式等待不会占用父进程的精力，父进程可以在轮询的过程中做其他事情：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>

#define NUM 5
typedef void (*func_t)(); //函数指针
func_t handlerTask[NUM];//函数指针数组

//任务
void task1()
{
    printf("handler task1\n");
}
void task2()
{
    printf("handler task2\n");
}
void task3()
{
    printf("handler task3\n");
}

void loadTask()
{
    memset(handlerTask, 0, sizeof(handlerTask));//将函数指针数组初始化为0
    handlerTask[0] = task1;//函数指针数组handlerTask[0]存放task1的地址
    handlerTask[1] = task2;
    handlerTask[2] = task3;
}
int main()
{
    pid_t id = fork();
    assert(id != -1);
    if(id == 0)
    {
        //child
        int cnt = 10;
        while(cnt)
        {
            printf("child running, pid: %d, ppid: %d, cnt: %d\n", getpid(), getppid(), cnt--);
            sleep(1);
        }
        exit(10);
    }
    loadTask();//加载任务
    // parent
    int status = 0;
    while(1)//父进程对子进程状态轮询
    {
        pid_t ret = waitpid(id, &status, WNOHANG);//第三个参数为0表示阻塞式等待，为WNOHANG表示非阻塞式等待
        if(ret == 0)//等于0代表没有被等待的进程暂未退出
        {
            printf("wait done, but child is running...., parent running other things\n");
            for(int i = 0; handlerTask[i] != NULL; i++)//遍历到NULL，即0停止
            {
                handlerTask[i](); //采用回调的方式，执行我们想让父进程在空闲的时候做的事情
            }
        }
        else if(ret > 0)//waitpid调用成功，并且子进程退出，返回值为被等待子进程的pid
        {
            printf("wait success, exit code: %d, sig: %d\n", (status>>8)&0xFF, status & 0x7F);
            break;
        }
        else//等于-1表示等待失败，waitpid中的第一个参数值传错会导致调用失败
        {
            printf("waitpid call failed\n");
            break;
        }
        sleep(1);
    }
    return 0;
}

四、进程程序替换

1、进程程序替换的概念

将磁盘中指定的程序加载到内存中，让指定的进程进行执行。不论是何种后端语言写的程序，exec*函数都可以调用。

替换函数：

#include <unistd.h>`
//execve的封装
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[],char *const envp[]);
//系统调用
int execve(const char *filename, char *const argv[],char *const envp[]);

l(list) : 表示参数采用列表；

p(path) : 带p，不用传入地址，传入可执行程序的名字即可，它会自动去环境变量PATH中寻找该可执行程序的地址；

v(vector) :执行参数放入数组中，统一传递；

e(env) : 可以传入自己写的环境变量。

1、通过execl函数调用ls命令：

#include <stdio.h>
#include <unistd.h>
int main()
{
    printf("process is running·····\n");
    execl("/usr/bin/ls"/*要执行的程序*/,"ls","--color=auto","-a","-l",NULL/*如何执行*/);//一定要用NULL结尾
    printf("process is down·····\n");//这句话并不会被打印，因为后续代码和数据已经被execl函数替换了
    return 0;
}

如果调用execl函数，参数传错导致函数调用失败，后续代码将不会被覆盖。

2、通过execle函数调用外部程序并使用自定义环境变量：

#include <stdio.h>
#include <unistd.h>
int main()
{
    printf("process is running··\n");
    //使用自定义的环境变量
    //char* const _env[]={(char*)"MYENV=12345",NULL};
    //execle("./mybin","mybin",NULL,_env);
    
    //使用系统的环境变量
    //extern char** environ;
    //execle("./mybin","mybin",NULL,environ);//系统环境变量不传，进程也能获取
    
    //使用putenv将自己的环境变量导入到environ指向的环境变量表中
    extern char** environ;
    char* const _env[]={(char*)"MYENV=12345",NULL};
    putenv((char*)"MYENV=654321");
    execle("./mybin","mybin",NULL,environ);
    printf("process is running··\n");
    return 0;
}

2、进程程序替换的原理

程序替换的本质：用磁盘指定位置上的程序的代码和数据，覆盖进程自身的代码和数据，达到让进程执行指定程序的目的。

3、exec*()系列函数的返回值

exec()函数仅在发生错误时返回。返回值为-1，设置errno以指示错误。

可以看到exec系列函数调用成功后并没有返回值，因为exec一旦被调用成功，后续代码将被覆盖，根本没机会用到返回值。

4、main函数在磁盘中被加载到内存的原理

五、写一个shell

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>
#include <string.h>
#define NUM 100
#define OPT_NUM 20
char LineCommand[NUM];
char* myargv[OPT_NUM];//指针数组，用于记录切割出来的字符串
int  lastCode = 0;
int  lastSig = 0;
int main()
{   
    while(1)
    {
        printf("用户名@主机名 当前路径:");
        fflush(stdout);
        //获取输入内容
        char* s=fgets(LineCommand,sizeof(LineCommand),stdin);
        assert(s!=NULL);
        //清除最后一个\n
        LineCommand[strlen(LineCommand)-1]=0;
        //字符串切割
        myargv[0]=strtok(s," ");
        int i=1;
        if(myargv[0]!=NULL&&strcmp(myargv[0],"ls")==0)//判断myargv[0]是否切割正常，穷举指令，为指令添加选项
        {
            myargv[i++]=(char*)"--color=auto";
        }
        while(myargv[i++]=strtok(NULL," "));//如果切割完毕，strtok会返回NULL，刚好myargv[end]需要等于NULL
        if(myargv[0]!=NULL&&strcmp(myargv[0],"cd")==0)//解决cd命令返回的是子进程的上级目录问题
        {
            if(myargv[1]!=NULL)
            {
               chdir(myargv[1]);//使用chdir()改变父进程的当前路径
               continue;//如果改变路径，就continue跳出本轮循环，后续子进程可以不用创建
            }
        }
        if(myargv[0] != NULL && myargv[1] != NULL && strcmp(myargv[0], "echo") == 0)
        {
            if(strcmp(myargv[1], "$?") == 0)
            {
                printf("%d, %d\n", lastCode, lastSig);
            }
            else
            {
                printf("%s\n", myargv[1]);
            }
            continue;
        }
        //测试是否成功
#ifdef DEBUG 
        for(i=0;myargv[i];++i)
        {
            printf("myargv[%d]:%s\n",i,myargv[i]);
        }
#endif
        //执行命令
        pid_t id=fork();//创建子进程，让子进程去执行被切割出来的指令
        assert(id!=-1);
        if(id==0)
        {
            execvp(myargv[0],myargv);
            exit(1);
        }
        int status = 0;
        pid_t ret = waitpid(id, &status, 0);
        assert(ret > 0);
        (void)ret;
        lastCode = ((status>>8) & 0xFF);
        lastSig = (status & 0x7F);
    }
    return 0;
}

运行该程序，可以实现shell的效果，如果33行-40行逻辑如果不写，使用cd ..指令回到上级目录时，发现我们在原地TP。

原因：因为这个"模拟shell"程序会使用fork()创建子进程执行指令，当使用cd ..时，回到的是子进程的上级目录，不会改变父进程的当前工作目录。可以额外判断一下cd命令，如果是cd命令，使用chdir改变父进程的工作目录，continue跳出本轮循环。（无需创建后续子进程）

像这种不需要子进程来执行，而是让shell来执行的命令叫做内建/内置命令。这也解释了为什么echo能打印本地环境变量，因为echo也是一个内建命令，由shell执行，shell当然能打印本地环境变量。

查看进程当前目录：

可以使用chdir()更改进程的当前目录。

标签： linux 运维服务器

本文转载自: https://blog.csdn.net/gfdxx/article/details/128046685
版权归原作者 蒋灵瑜的笔记本 所有，如有侵权，请联系我们删除。

【Linux】进程创建/终止/等待/替换

一、子进程的创建

1、fork函数的概念

2、如何理解fork拥有两个返回值

3、fork调用失败的场景

二、进程的终止

1、main函数返回值

1.1main函数的返回值的意义

1.2将错误码转化为错误信息

1.3查看进程的退出码

2、进程退出的情况

1、进程的正常退出与异常退出

2、库函数exit

3、系统调用_exit

三、进程等待

1、进程等待的必要性

2、进程等待的方法

2.1系统调用wait

2.2系统调用waitpid

3、status值的意义

4、图解父进程等待子进程的方式

5、阻塞/非阻塞式等待

四、进程程序替换

1、进程程序替换的概念

2、进程程序替换的原理

3、exec*()系列函数的返回值

4、main函数在磁盘中被加载到内存的原理

五、写一个shell

发表评论

“【Linux】进程创建/终止/等待/替换”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航