一、子进程的创建
1、fork函数的概念
在linux中fork函数是非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程(子进程的PID是0),而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:fork创建子进程成功后,会给父进程返回子进程的PID,给子进程返回0,失败则返回-1。
为什么要让父进程拿到子进程的PID?因为子进程变为僵尸状态后,需要父进程读取子进程的退出信息并回收资源。
操作系统将会给创建成功的子进程:
1、给子进程分配新的内存块和内核数据结构(PCB、进程地址空间、页表等,并构建对应的映射关系);
2、将父进程的部分数据结构内容拷贝至父进程;
3、把子进程添加到系统进程列表中;
4、fork返回,调度器开始调度。
2、如何理解fork拥有两个返回值
在fork函数return之前,就已经有了父子两个进程,给父进程返回子进程的PID,给子进程返回0,失败则返回-1。
利用这个特性,我们可以用变量接收返回值,根据fork返回值不同让父子进程执行不同的代码。
#include <stdio.h>
#include <unistd.h>
int main()
{
pid_t id=fork();
if(id==0)
{
printf("子进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
}
else if(id>0)
{
printf("父进程:pid=%d,ppid=%d | grobal_val=%d,&grobal_val=%p\n",getpid(),getppid(),grobal_val,&grobal_val);
sleep(1);
}
else
{
printf("fork error\n");
return 1;
}
return 0;
}
pid_t id=fork()这句代码父子进程谁先返回不确定。谁先返回,谁就在虚拟内存中写入id的值,后返回的进程由于进程的独立性将会发生写时拷贝。所以,我们可以看到父子进程的id变量的虚拟地址是一样的,但是内容却不一样。
3、fork调用失败的场景
系统中的进程数达到了最大限制。
二、进程的终止
1、main函数返回值
1.1main函数的返回值的意义
int main()
{
return 0;
}
return 后面的值代表进程退出的时候,对应的退出码。标定进程执行的结果是否正确。
如果不关心一个进程的退出码,可以直接return 0;如果要关心进程的退出码,则要返回特定的数字以表明进程不同的错误。
1.2将错误码转化为错误信息
函数原型:
#include <string.h>
char* strerror(int errnum);
遍历打印错误码:
#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main()
{
for(int i=0;i<150;++i)
{
printf("num[%d]:%s\n",i,strerror(i));
}
return 0;
}
可以看到不同的错误码对应的出错误信息。
1.3查看进程的退出码
echo $?
$?会记录最近一个进程在命令行中执行完毕时的退出码,即main函数的返回值。
2、进程退出的情况
1、进程的正常退出与异常退出
正常终止(父进程获取退出码):
1、程序执行完毕,main函数返回0
2、程序执行完毕,但是返回值不为0,例如调用exit()和_exit()或return !0。
异常终止(父进程获取退出信号):
ctrl+c或除0错误等导致程序被信号终止。
2、库函数exit
函数原型:
#include <stdlib.h>
void exit(int status);
库函数exit在进程退出后,会主动刷新缓冲区。
3、系统调用_exit
函数原型:
#include <unistd.h>
void _exit(int status);
系统调用_exit在进程退出后,并不会主动刷新缓冲区。
三、进程等待
1、进程等待的必要性
子进程退出后会进入僵尸状态,父进程通过进程等待的方式,获取子进程的退出信息,回收子进程资源,让子进程结束僵尸状态。当然,在子进程没有退出时,父进程只能阻塞等待子进程变成僵尸状态。
2、进程等待的方法
头文件:
#include <sys/types.h>
#include <sys/wait.h>
2.1系统调用wait
函数原型:
pid_t wait(int* status);
返回值:等待成功被等待进程的pid,失败返回-1。
参数:status输出型参数,获取子进程退出码和退出状态,不关心则可以设置成为NULL。
通过wait让父进程获取子进程的PID。
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
pid_t id=fork();
if(id==0)
{
//子进程
int cnt=3;
while(cnt--)
{
printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
sleep(1);
}
exit(0);//子进程退出
}
sleep(5);
pid_t ret =wait(NULL);
if(id>0)
{
//父进程
printf("等待成功:%d\n",ret);
}
return 0;
}
2.2系统调用waitpid
函数原型:
pid_t waitpid(pid_t pid,int* status,int options);
返回值:当正常返回的时候waitpid返回收集到的子进程的进程PID;如果设置了选项WNOHANG,而调用waitpid发现没有已退出的子进程可收集,则返回0;如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;
参数:
PID:
PID=-1,等待任一个子进程。与wait等效。PID>0,等待进程为PID的子进程。
**status: **
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
//WIFEXITED和WEXITSTATUS是两个宏
if(WIFEXITED(status))//判断子进程是否正常退出(判断退出信号)
{
printf("exit code:%d\n",WEXITSTATUS(status));//判断子进程运行结果是否正常(判断退出码)
}
else{
//something to do
}
options:
WNOHANG: 若PID指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的PID。
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
pid_t id=fork();
if(id==0)
{
//子进程
int cnt=3;
while(cnt--)
{
printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
sleep(1);
}
exit(10);//子进程退出
}
int status=0;
pid_t ret =waitpid(id,&status,0);
if(id>0)
{
//父进程
printf("等待成功:%d,ret=%d\n",ret,status);
}
sleep(5);
return 0;
}
通过修改子进程的退出码,可以打印出不同的status值,因为status用于存储子进程的退出码和退出信号。
3、status值的意义
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整型,可以当作位图来看待。(只研究status低16比特位):
在进程退出时,终止信号是评判一个进程是否正常退出;退出状态是评判一个进程运行的结果是否正确。
1、使用kill -l来查看进程终止的信号。
2、根据退出码确定进程的退出状态。
以下代码手动调用waitpid模拟父进程等待子进程的过程:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
pid_t id=fork();
if(id==0)
{
//子进程
int cnt=3;
while(cnt--)
{
printf("子进程:%d 父进程:%d %d\n",getpid(),getppid(),cnt);
sleep(1);
}
exit(10);//子进程退出
}
int status=0;
pid_t ret =waitpid(id,&status,0);
if(id>0)
{
//父进程
printf("等待成功,返回值子进程的PID:%d,终止信号:%d,子进程退出码:%d\n",ret,(status&0X7F),((status>>8)&0XFF));
}
sleep(5);
return 0;
}
4、图解父进程等待子进程的方式
1、调用wait/waitpid后,父进程只能阻塞等待子进程变成僵尸状态。
2、子进程退出后变成僵尸状态,task_struct中的代码和数据会被释放掉,并把自己的退出信号、退出码写入到自己的task_struct中;
3、wait/waitpid是系统调用,操作系统有资格也有能力去读取子进程的task_struct。
4、父进程通过进程等待的方式,获取子进程的退出信息,回收子进程资源,让子进程结束僵尸状态。
5、阻塞/非阻塞式等待
阻塞式等待:当父进程调用wait/waitpid(第三个参数为0)等待子进程,如果子进程暂未退出,父进程会被阻塞,暂停运行,如果父进程刚好没事干,可以选择使用阻塞等待。
非阻塞式等待:当父进程调用waitpid(第三个参数为WNOHANG)等待子进程,如果父进程检测到子进程未退出,父进程并不会原地等待,而是继续执行自己的代码。如果使用while循环,便能达到轮询的效果。
非阻塞式等待不会占用父进程的精力,父进程可以在轮询的过程中做其他事情:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>
#define NUM 5
typedef void (*func_t)(); //函数指针
func_t handlerTask[NUM];//函数指针数组
//任务
void task1()
{
printf("handler task1\n");
}
void task2()
{
printf("handler task2\n");
}
void task3()
{
printf("handler task3\n");
}
void loadTask()
{
memset(handlerTask, 0, sizeof(handlerTask));//将函数指针数组初始化为0
handlerTask[0] = task1;//函数指针数组handlerTask[0]存放task1的地址
handlerTask[1] = task2;
handlerTask[2] = task3;
}
int main()
{
pid_t id = fork();
assert(id != -1);
if(id == 0)
{
//child
int cnt = 10;
while(cnt)
{
printf("child running, pid: %d, ppid: %d, cnt: %d\n", getpid(), getppid(), cnt--);
sleep(1);
}
exit(10);
}
loadTask();//加载任务
// parent
int status = 0;
while(1)//父进程对子进程状态轮询
{
pid_t ret = waitpid(id, &status, WNOHANG);//第三个参数为0表示阻塞式等待,为WNOHANG表示非阻塞式等待
if(ret == 0)//等于0代表没有被等待的进程暂未退出
{
printf("wait done, but child is running...., parent running other things\n");
for(int i = 0; handlerTask[i] != NULL; i++)//遍历到NULL,即0停止
{
handlerTask[i](); //采用回调的方式,执行我们想让父进程在空闲的时候做的事情
}
}
else if(ret > 0)//waitpid调用成功,并且子进程退出,返回值为被等待子进程的pid
{
printf("wait success, exit code: %d, sig: %d\n", (status>>8)&0xFF, status & 0x7F);
break;
}
else//等于-1表示等待失败,waitpid中的第一个参数值传错会导致调用失败
{
printf("waitpid call failed\n");
break;
}
sleep(1);
}
return 0;
}
四、进程程序替换
1、进程程序替换的概念
将磁盘中指定的程序加载到内存中,让指定的进程进行执行。不论是何种后端语言写的程序,exec*函数都可以调用。
替换函数:
#include <unistd.h>`
//execve的封装
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[],char *const envp[]);
//系统调用
int execve(const char *filename, char *const argv[],char *const envp[]);
l(list) : 表示参数采用列表 ;
p(path) : 带p,不用传入地址,传入可执行程序的名字即可,它会自动去环境变量PATH中寻找该可执行程序的地址;
v(vector) :执行参数放入数组中,统一传递;
e(env) : 可以传入自己写的环境变量。
1、通过execl函数调用ls命令:
#include <stdio.h>
#include <unistd.h>
int main()
{
printf("process is running·····\n");
execl("/usr/bin/ls"/*要执行的程序*/,"ls","--color=auto","-a","-l",NULL/*如何执行*/);//一定要用NULL结尾
printf("process is down·····\n");//这句话并不会被打印,因为后续代码和数据已经被execl函数替换了
return 0;
}
如果调用execl函数,参数传错导致函数调用失败,后续代码将不会被覆盖。
2、通过execle函数调用外部程序并使用自定义环境变量:
#include <stdio.h>
#include <unistd.h>
int main()
{
printf("process is running··\n");
//使用自定义的环境变量
//char* const _env[]={(char*)"MYENV=12345",NULL};
//execle("./mybin","mybin",NULL,_env);
//使用系统的环境变量
//extern char** environ;
//execle("./mybin","mybin",NULL,environ);//系统环境变量不传,进程也能获取
//使用putenv将自己的环境变量导入到environ指向的环境变量表中
extern char** environ;
char* const _env[]={(char*)"MYENV=12345",NULL};
putenv((char*)"MYENV=654321");
execle("./mybin","mybin",NULL,environ);
printf("process is running··\n");
return 0;
}
2、进程程序替换的原理
程序替换的本质:用磁盘指定位置上的程序的代码和数据,覆盖进程自身的代码和数据,达到让进程执行指定程序的目的。
3、exec*()系列函数的返回值
exec()函数仅在发生错误时返回。返回值为-1,设置errno以指示错误。
可以看到exec系列函数调用成功后并没有返回值,因为exec一旦被调用成功,后续代码将被覆盖,根本没机会用到返回值。
4、main函数在磁盘中被加载到内存的原理
五、写一个shell
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>
#include <string.h>
#define NUM 100
#define OPT_NUM 20
char LineCommand[NUM];
char* myargv[OPT_NUM];//指针数组,用于记录切割出来的字符串
int lastCode = 0;
int lastSig = 0;
int main()
{
while(1)
{
printf("用户名@主机名 当前路径:");
fflush(stdout);
//获取输入内容
char* s=fgets(LineCommand,sizeof(LineCommand),stdin);
assert(s!=NULL);
//清除最后一个\n
LineCommand[strlen(LineCommand)-1]=0;
//字符串切割
myargv[0]=strtok(s," ");
int i=1;
if(myargv[0]!=NULL&&strcmp(myargv[0],"ls")==0)//判断myargv[0]是否切割正常,穷举指令,为指令添加选项
{
myargv[i++]=(char*)"--color=auto";
}
while(myargv[i++]=strtok(NULL," "));//如果切割完毕,strtok会返回NULL,刚好myargv[end]需要等于NULL
if(myargv[0]!=NULL&&strcmp(myargv[0],"cd")==0)//解决cd命令返回的是子进程的上级目录问题
{
if(myargv[1]!=NULL)
{
chdir(myargv[1]);//使用chdir()改变父进程的当前路径
continue;//如果改变路径,就continue跳出本轮循环,后续子进程可以不用创建
}
}
if(myargv[0] != NULL && myargv[1] != NULL && strcmp(myargv[0], "echo") == 0)
{
if(strcmp(myargv[1], "$?") == 0)
{
printf("%d, %d\n", lastCode, lastSig);
}
else
{
printf("%s\n", myargv[1]);
}
continue;
}
//测试是否成功
#ifdef DEBUG
for(i=0;myargv[i];++i)
{
printf("myargv[%d]:%s\n",i,myargv[i]);
}
#endif
//执行命令
pid_t id=fork();//创建子进程,让子进程去执行被切割出来的指令
assert(id!=-1);
if(id==0)
{
execvp(myargv[0],myargv);
exit(1);
}
int status = 0;
pid_t ret = waitpid(id, &status, 0);
assert(ret > 0);
(void)ret;
lastCode = ((status>>8) & 0xFF);
lastSig = (status & 0x7F);
}
return 0;
}
运行该程序,可以实现shell的效果,如果33行-40行逻辑如果不写,使用cd ..指令回到上级目录时,发现我们在原地TP。
原因:因为这个"模拟shell"程序会使用fork()创建子进程执行指令,当使用cd ..时,回到的是子进程的上级目录,不会改变父进程的当前工作目录。可以额外判断一下cd命令,如果是cd命令,使用chdir改变父进程的工作目录,continue跳出本轮循环。(无需创建后续子进程)
像这种不需要子进程来执行,而是让shell来执行的命令叫做内建/内置命令。这也解释了为什么echo能打印本地环境变量,因为echo也是一个内建命令,由shell执行,shell当然能打印本地环境变量。
查看进程当前目录:
可以使用chdir()更改进程的当前目录。
版权归原作者 蒋灵瑜的笔记本 所有, 如有侵权,请联系我们删除。