0


【Linux杂货铺】进程的基本概念


🌈前言🌈

    欢迎观看本期【Linux杂货铺】,本期内容,将讲解操作系统中重要的概念——进程。本篇文章将讲解操作系统关于进程的通用知识,以及在Linux中如何组织管理进程,以及运行进程。

    如果你还不是很了解操作系统的概念,可以收看上期关于操作系统的知识:

【Linux杂货铺】操作系统-CSDN博客

    这里简单概括一下操作系统的的前置知识,即什么管理,简单概括就是先描述,在组织。举个例子,操作系统将一个个硬件描述为一个结构体struct,将结构体组织称不同数据结构,例如链表,通过对链表的增删查改来管理硬件。

    这里就先介绍了操作系统重**管理**的概念。

📁进程的概念

    除法任何一个事件时,系统都会将它定义为一个进程,并给予这个进程一个ID,称为PID,同时根据触发这个进程的用户与相关属性关系,给予这个PID一组有效的权限设置。

    执行一个程序或者命令,就是触发一个事件,而获取一个PID。
    简单来说就是一个正在运行的程序。

📂描述进程-PCB

** ** 进程的信息会被放在一个叫进程控制块的数据结构中,可以理解为进程的属性。在Linux系统中PCB是:task_struct。

    task_stuct就是Linux内核中的一个数据结构,它会被装载到内存里并且包含进程的信息。

*task_ struct***内容分类 **

● 标示符: 描述本进程的唯一标示符,用来区别其他进程。

● 状态: 任务状态,退出代码,退出信号等。

● 优先级: 相对于其他进程的优先级。

● 程序计数器: 程序中即将被执行的下一条指令的地址。

● 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针

上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。

● I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。

● 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

● 其他信息

** 进程 = 内核结构体PCB + 程序的代码和数据。**

    每个进程都有一个唯一标识符,叫pid。

📂 查看进程

    进程信息可以通过 /proc 系统文件查看。如获得PID为1的进程信息,需要查看/proc/1这个文件。

    大多数进程信息同样可以使用top和ps这些用户级工具来获取。

📂 查看正在运行的程序

ps -ajx 
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 while(1){
 sleep(1);
 }
 return 0;
}

📂杀死进程

kill -9 pid
    kill 先简单理解为向进程发了个信号,-9表示杀死进程,在进程的状态会进行讲解。

📂通过系统调用获取进程标识符

进程id = pid

父进程id = ppid

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 //获得子进程
 printf("pid: %d\n", getpid());
 
 //获得父进程 
 printf("ppid: %d\n", getppid());
 return 0;
}
    我们通过父进程来创建子进程,**子进程继承父进程的代码和数据**,会有自己的PCB。

📂通过系统调用创建进程

    fork函数,fork函数会有两个返回值,父进程一个,子进程一个。这里可以这样理解,进入fork函数后,已经有了两个进程,父进程和子进程,父子进程会进行代码共享,即有两个return。

** 父进程会得到子进程的pid,子进程的返回值为0。**

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 int ret = fork();
 printf("hello proc : %d!, ret: %d\n", getpid(), ret);
 sleep(1);
 return 0;
}
    fork之后通常要用 if 分流。
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 int ret = fork();
 if(ret < 0){
 perror("fork");
 return 1;
 }
 else if(ret == 0){ //child
 printf("I am child : %d!, ret: %d\n", getpid(), ret);
 }else{ //father
 printf("I am father : %d!, ret: %d\n", getpid(), ret);
 }
 sleep(1);
 return 0;
}

📂 进程的特点

    1. **竞争性**:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间具有竞争属性,为了高效完成任务,更合理的竞争相关资源,便具有了优先级。

    2. **独立性**:多进程运行,需要独享各种资源,多进程运行期间互不干扰。

    3. **并行**: 多个进程在多个CPU下分别,同时进行运行,这称之为并行。

    4. **并发**: 多个进程在1个CPU下采用进程切换的方式,在一段时间内,让多个进程得以推进,称之为并发。

📁进程的状态

static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};

R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列
里。

S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
(interruptible sleep))。

D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的
进程通常会等待IO的结束。

T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可
以通过发送 SIGCONT 信号让进程继续运行。

X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。

僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)
没有读取到子进程退出的返回代码时就会产生僵死(尸)进程

R : 进程运行状态

S:(浅)休眠状态,进程处于等待状态,等待资源就绪,可中断休眠。

D:(深)休眠状态,不可被杀,深度睡眠,不可中断睡眠。

  1. 等待进程自己醒来。

  2. 断电重启。

T:暂停状态

    kill -19 pid 改为暂停状态,即将进程暂停。

    kill -18 pid  继续运行进程。

t : 调试暂停,debug调试,遇到断点就暂停。

📂 kill 信号

    kill 向指定进程发送信号。kill -l 查看信号

📂 僵尸进程

    z状态,即进程已经运行完毕,但需要维持自己的退出信息,在自己的task_struct记录自己的退出信息,未来让父进程读取,如果父进程没有读取,僵尸进程会一直存在。

    僵尸进程不可以被杀死。如果僵尸进程一直没有被父进程读取,就会造成内存泄漏。

    x状态就就是,读取了z,由os释放进程。

📂 孤儿进程

    父进程先退出,子进程就被称为“孤儿进程”。孤儿进程被1号进程领养,由os进行回收。

    孤儿进程可以被杀死。

📂 运行状态

** R运行状态**:并不意味着程序一定在运行中,表明程序要么在运行中,要么在运行队列中。

    分时操作系统,即每个进程都有一个时间片,在规定时间片内执行进程,如果进程没有执行完毕,则会再次进入运行队列等待。

📂 阻塞状态

    S休眠状态:意味着进程正在等待事件完成。

    D磁盘休眠状态:有时候也叫不可中断休眠状态,在这个状态的进程通常会等待IO结束。

📂 挂起状态

    内存资源不足,且进程处于阻塞状态时,进程就会被唤出到swap分区中。过多的挂起,会导致效率问题

📁进程的切换

    基于时间片等原因,进程可能会切换到其他状态,那么CPU是如何知道进程执行到哪了呢,接着上一次执行继续执行呢?

    CPU的寄存器会保存着进程的临时数据。CPU内部所有寄存器中的临时数据,就叫做进程的上下文。![](https://img-blog.csdnimg.cn/direct/dfba7b834228481d9ce256602dc77c22.png)

📁进程的优先级

📂 概念

    本质是指定一个进程获得某种资源的先后顺序,在task_struct中是一个数字int,优先级数字越小,优先级越高。

    为什么要有优先级呢?因为进程访问的资源是有限的。

📂 原则

    分时操作系统,基于时间片调度轮转,要保证基本的公平。如果进程因为长时间不被调度,就会造成饥饿问题。

📂 查看方式

ps -l

UID : 代表执行者的身份

PID : 代表这个进程的代号

PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号

PRI :代表这个进程可被执行的优先级,其值越小越早被执行

NI :代表这个进程的nice值

📂 PRI 和 NI

    **PRI就是进程的优先级,其值越小,进程的优先级就越高。**

** NI就是nice值,即进程可被执行的优先级的修证数据。**

  **  进程优先级 = PRI + NI。**

    nice值的取值范围是[-20 , 19] 一共**40**个级别。

    RPI优先级默认是从801开始的,取值是[60 , 99]。

📂 调整方式

    用top命令更改已存在的进程的nice

● top

● 输入“r” -> 输入PID -> 输入nice值

📁 进程的地址空间 (虚拟地址)

    我们在C/C++语言中看到的地址都是虚拟地址。物理地址,用户是看不到的,由os统一管理。os负责将虚拟地址转换为物理地址。

    地址空间本质上是一个结构体,内部是很多属性,表示每个区间的范围。可以简单理解,每个进程都有一个地址空间和页表,页表负责将地址空间上的虚拟地址转为物理地址。

    父进程创建子进程后,子进程的页表与父进程的页表是一样的,即相同的虚拟地址映像到相同的物理地址。但是如果一个进程想要修改,则物理地址就会发生改变,即虚拟地址对应不同的物理地址。这就是**写实拷贝**。![](https://img-blog.csdnimg.cn/direct/87d18ed73d6a4225bd8e5b493b63d683.png)

📂 虚拟地址的好处

1. 将无序变为有序,以统一的视角看待物理内存以及运行各个区域。

2. 进程管理模块和内存管理模块进行解耦

3. 有效的拦截非法请求。

📁 Linux2.6 内核进程调度队列

    一个CPU拥有一个requeue(运行队列)。

    普通优先级:100-139 

    实时优先级:0 - 99 (不关心)

📂 活动队列

     时间片还没有结束的所有进程都会按照优先级放在该队列。

**nr_active:**总共有多少个运行状态的进程

**queue[140]:**一个元素就是一个进程队列,相同优先级的进程按照FIFO规则进行排队调度,所以,数组下标就是优先级!

从该结构中,选择一个最合适的进程,过程是怎么的呢?

  1. 从0下表开始遍历queue[140]

  2. 找到第一个非空队列,该队列必定为优先级最高的队列

  3. 拿到选中队列的第一个进程,开始运行,调度完成!

  4. 遍历queue[140]时间复杂度是常数!但还是太低效了!

**bitmap[5]:*一共140个优先级,一共140个进程队列,为了提高查找非空队列的效率,就可以用532个

比特位表示队列是否为空,这样,便可以大大提高查找效率

    上图,我们展示活动队列,过期队列也是同理。

📂 过期队列

    过期队列和活动队列一模一样,过期队列上放置的集成,都是时间片耗尽,但是还没有结束的进程。当活动队列上的进程都处理完毕后,对过期队列进程时间片重计算。

📂active指针和expired****指针

** **active指针永远指向活动队列。

    expired指针永远指向过期队列。

    可是活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的。 

    没关系,在合适的时候,只要能够交换active指针和expired指针的内容,就相当于有具有了一批新的活动进程!

📁总结

    以上,就是本期【Linux杂货铺】进程基本概念的所有内容了,讲解了什么事进程,进程的状态有哪些,包括僵尸进程,孤儿进程,讲解了进程的优先级,也粗略的讲解了进程的地址空间,也就是平常说的虚拟地址,以及Linux中临时拷贝是什么,在Linux中是如何调度进程的。

    如果感觉本期内容对你有帮助,欢迎点赞,收藏,关注Thanks♪(・ω・)ノ

标签: linux 运维 服务器

本文转载自: https://blog.csdn.net/jupangMZ/article/details/136791189
版权归原作者 秋刀鱼的滋味@ 所有, 如有侵权,请联系我们删除。

“【Linux杂货铺】进程的基本概念”的评论:

还没有评论