送给大家一句话:
何必向不值得的人证明什么,生活得更好,乃是为你自己。
-- 亦舒
进程信号的发生
1 何为信号
生活中信号随处可见,我们的生活离不开信号。就比如过红路灯,看见绿灯亮的信号,我们就可以过马路了;听见闹钟响了,我们知道时间到了;看见别人脸色不好,我们就知道他有心事…所以信号在生活中随时可以产生(与我们的动作是异步的):
- 我们可能认识这个信号,知道这个信号如何处理。
- 但是当信号产生时,我们可能在做着其他事情,会把信号暂时不做处理。
- 暂不处理就要求我们记得这个信号,并确定什么时候处理。
对此,如果把上面的“我们”换成“进程”,就是进程中的信号了!我们可以看看在Linux系统下的信号:
信号时从 1 - 64 的数字对应信号(32 - 64 是实时信号,暂不考虑)
信号的生命周期可以划分为:
预备 -> 产生 -> 保存 -> 处理
。我们把这个过程研究明白就可以了
2 信号概念的基础储备
信号是Linux系统通过的一种向目标进程发送指定事件的方式。要做识别和处理。
信号产生时异步的:对于一个进程不知道什么时候会收到信号,他只能先做自己的事情,信号产生时也不知道进程在干什么,所以是异步的!!!
先说明一个概念信号处理有三种(只能三选一):
- 默认动作 — 进程处理信号都是默认的 ,通常是终止自己(term , core),暂停 ,忽略…
- 忽略动作
- 自定义动作 — 信号的捕捉 :
signal(int signum, sighandler_t handler)
,该函数可以捕捉signum
信号,并执行自定义的handler函数
接下来我们来看看signal函数的使用:
对信号的自定义捕捉 ,只需捕捉一次,后续就一直有效!!!
#include<signal.h>#include<iostream>#include<sys/types.h>#include<unistd.h>voidhandler(int sig){
std::cout <<"get sig:"<< sig << std::endl;}intmain(){//对信号的自定义捕捉 ,只需捕捉一次,后续就一直有效!!!signal(2, handler);while(true){
std::cout <<"pid :"<<getpid()<< std::endl;sleep(1);}return0;}
该程序的功能是每隔一秒打印出当前进程的ID,并且当接收到SIGINT信号*(2号信号)时,会调用handler函数打印出信号编号。通常情况下,当你运行这个程序并按下Ctrl+C时,程序会打印出"get sig:2"并继续运行,因为它已经处理了SIGINT信号。如果你想要终止程序,使用kill命令。
来看效果:
我们也可以多设置一些捕捉:
signal(2, handler);signal(3, handler);signal(4, handler);signal(5, handler);
这样可以与之捕捉对应的信号!
如何理解信号的发送和处理??? 浅度理解:
进程我们知道是通过task_struct来管理的,里面有一个
uint32_t signal
变量,其收到的信号是通过位图来保存的(1 - 31比特位分别代表 1 - 31 号信号)。
那么发送信号:就是修改指定进程pcb的信号的指定位图 0 -> 1。也就是“写信号”
通过上面的分析,发送信号改变了内核数据结构,而这个工作只能是OS来进行,所以只有OS可以发送信号。
那么kill信号能向进程发送信号!还有其他可以发送信号的方式吗?我们来看:
3 信号产生
信号产生的方式有以下几种:
- 通过kill命令:向指定进程发送指定的信号
- 键盘可以产生信号:我们常用的
ctrl + c
(2号信号)和ctrl + \
(3号信号)都可以向进程发送信号 - 系统调用: -
int kill(pid_t pid, int sig)
该系统调用可以向pid
对应的进程,发送sig
信号。发送成功返回 1 反之返回 0。- 还有int raise(int sig);
系统调用是向当前进程发送指定信号。比较简单奥。- 还有void abort(void);
库函数异常终止当前进程。是对应的6号信号(终止会打印Aborted!)其特殊的性质是可以被捕捉,但是进程还是会被终止掉
,就是为了防止发生所有信号都被捕捉,没有信号可以终止的情况
,9号信号和19号信号不能被自定义捕捉!!! - 软件条件: 我们回忆一下:管道的读端关闭、写端一直进行时 — 系统就会关闭管道(因为该管道无意义)发送13号信号
SIGPIPE
。也就在软件层面某些条件不满足而产生的信号!这里着重介绍一下alarm
系统调用。 - 异常 :进程非法操作的时候,OS会发送信号!让进程崩溃(默认是终止进程,也可以进行捕捉异常信号。推荐终止进程!)
接下来我们来看看一下
kill
系统调用 、
alarm
系统调用 、 异常。
kill系统调用
#include<signal.h>#include<iostream>#include<sys/types.h>#include<unistd.h>#include<string>voidhandler(int sig){
std::cout <<"get sig:"<< sig << std::endl;}// ./mykill 2 277015intmain(int argc ,char* argv[]){if(argc !=3){
std::cerr <<"Usage: "<< argv[0]<<" signum pid"<< std::endl;return1;}uint32_t sig = std::stoi(argv[1]);
pid_t pid = std::stoi(argv[2]);//发送信号kill(pid , sig);return0;}
这样我们就被
kill
系统调用进行了一个封装!
我们使用一下来看:
成功向目标进行发送指定信号!
alarm系统调用
alarm
系统调用会设置一个时间为
seconds
的“闹钟”,时间到了就会发送信号
14) SIGALRM
。
我们设置一个闹钟看看
#include<signal.h>#include<iostream>#include<sys/types.h>#include<unistd.h>#include<string>#include<cstdio>intmain(){int cnt =1;alarm(1);//设定1秒的闹钟while(true){
std::cout << cnt << std::endl;
cnt++;}}
运行看看:
1s后就停止了!因为14号信号对应的是term会进行终止!
我们也可以进行一个捕捉
#include<signal.h>#include<iostream>#include<sys/types.h>#include<unistd.h>#include<string>#include<cstdio>voidhandler(int sig){
std::cout <<"get sig:"<< sig << std::endl;exit(1);}intmain(){int cnt =1;signal(SIGALRM , handler);alarm(1);//设定1秒的闹钟while(true){
std::cout << cnt << std::endl;
cnt++;}}
成功捕捉到是14号信号!
如果我们不加上每次IO的输出,只在最后打印一次,我们会发现cnt会达到近10亿。
这就验证了IO是很慢的一个过程!因为IO的本质是向外设进行输出数据,外设的传输速度肯定比内存慢!!!
alarm
的本质是通过时间戳来比对,在设置闹钟的那一刻,操作系统会获取当前时间戳,然后加上闹钟时间得到一个新的时间戳。在以后的运行中不断和系统时间戳进行比对,相等的时候是就是闹钟的结束时刻!!!
操作系统对闹钟的管理是也是通过内核数据结构
struct alarm
,并通过最小堆来进行。按照过期时间来排序,最上面的闹钟到时间了就进行pop,这样就可以进行一个管理!
闹钟的返回值是什么意义呢? 闹钟的返回值是
上一个闹钟的剩余时间
(alarm(0)表示取消闹钟)
注意闹钟默认只触发一次
voidhandler(int sig){alarm(1);//设定1秒的闹钟
std::cout <<"get sig:"<< sig << std::endl;}intmain(){int cnt =1;signal(SIGALRM , handler);alarm(1);//设定1秒的闹钟while(true){
std::cout << cnt << std::endl;
cnt++;}}
这样可以设置出一个一直在运行的闹钟:
异常
在学习C语言之初,一定接触过这样的代码:
intmain(){while(true){int a =100;
a /=0;// int *p = nullptr;// *p = 100;}return0;}
我们运行看看:
运行起来就崩溃了!
再来试试
int*p =nullptr;*p =100;
也崩溃了,那么为什么程序会崩溃呢???
因为程序非法访问,导致OS给进程发送信号,进程就崩溃了。来捕捉信号来证明一下:
voidhandler(int sig){
std::cout <<"get sig:"<< sig << std::endl;exit(1);}intmain(){signal(SIGFPE , handler);while(true){
std::cout <<"pid :"<<getpid()<< std::endl;int a =100;
a /=0;}}
运行看看:
这样就说明崩溃是因为收到了OS发送的信号!
那么OS是怎样知道进程进行非法操作的呢?以浮点数错误为例:
在CPU 运算中,数据是储存在内存中的。CPU可以进行算术运算和逻辑元素
CPU中有大量的寄存器,其中有一个
eflag
状态寄存器,在里面有一个溢出标记位,运算时出现溢出,溢出标记为为1,就证明出错了(10 / 0 首先会转换为加法运算,导致无限循环溢出)。这时候操作系统就要处理这种硬件问题!即向目标进程发送信号!
那为什么不退出就会一直发信号?
因为寄存器只有一套,但是寄存器里面的数据是属于每一个进程的 — 对应硬件上下文的保存与恢复。如果进程不退出,下一次调度的时候,对寄存器的数据进行恢复时,就会触发溢出标记位的错误,OS就会又一次发送信号!!!
这也就是为什么推荐终止进程 — 释放进程的上下文数据,包括溢出标记位数据和其他异常数据!
段错误也是硬件的问题,空指针无法通过页表(实际上是MMU内存管理模块进行操作)映射到物理地址,会发生错误!
CR2 - 控制寄存器2:
用于存储导致页错误的线性地址,当发生页错误异常时,CPU会自动将出错的线性地址加载到CR2中。
CR3 - 控制寄存器3:
包含页目录基址寄存器(PDBR),用于存储页目录表的物理地址,是分页机制的关键组成部分。
错误的地址会放入CR2中 , 触发故障。
core term
上面我们看到了许多信号的默认动作是core term 。他们有什么区别?
我们来看,进程退出时有一个
status
,其中的
core dump字段
我们来仔细看看。
- core : 异常终止,但是会形成一个debug文件(默认在云服务器是关闭的)
- term : 直接异常终止
debug文件是什么,我们一起看看:
首先默认是不能创建的,我们要进行一个修改:
接下来我们运行就会产生了一个core文件!!!,里面记录了错误信息!
通过这样的代码可以获取退出信息:
#include<signal.h>#include<iostream>#include<sys/types.h>#include<sys/wait.h>#include<unistd.h>#include<string>#include<cstdio>intsum(int start,int end){int sum =0;for(int i =0; i < end; i++){
sum /= i;
sum += i;}return sum;}intmain(){
pid_t id =fork();if(id ==0){sleep(1);//子进程sum(0,100);exit(0);}//父进程int status =0;
pid_t rid =waitpid(id ,&status ,0);if(rid == id){printf("exit code : %d , exit sig : %d , core dump : %d",(status >>8)&0xFF, status &0x7F,(status >>7)&1);}return0;}
Thanks♪(・ω・)ノ谢谢阅读!!!
下一篇文章见!!!
版权归原作者 叫我龙翔 所有, 如有侵权,请联系我们删除。