0


【JavaEE初阶】进程篇

写在前面

本篇博客主要介绍的是 计算机操作系统方面的知识,在看完本篇博客之后,我们需要知道:操作系统是什么,其核心功能又是什么;进程是什么,进程又是如何去管理、调度的;PCB里面有什么;进程的虚拟地址空间又是啥;以及进程间的通信又是怎么回事~~

下面,就让我们进入到正文吧~~

一、操作系统

像之前所说的,CPU、存储器、输入设备、输出设备,

总体上来说,都属于 "硬件" 设备!!!

而对于咱们普通用户,和硬件打交道,并不是一件方便的事情~~

为了可以更好的和这些 "硬件" 设备打交道,聪明的程序员发明了一个 "**软件" ** —— 操作系统~~

操作系统的核心功能:

  1. 对下,要管理各种硬件设备
  2. 对上,要给各种软件提供稳定的运行环境

如:Windows、Mac、Android、IOS 都是操作系统,虽然厂商不同,细节上有所差别,但是核心操作都是这两条~~

如:张三在QQ中写一段话,点击发送,这个过程 就是操作系统在进行工作~~

操作系统本身就是一个非常复杂的软件~~

如:内存管理、文件管理、设备管理、进程管理、......

其中,"进程管理" 是一个非常重要的概念,作为程序员,就必须要去深入了解它~~

二、进程

2.1 进程的概念

"进程(process)" 是操作系统里面的一个非常重要的概念,虽然 可能在不同的操作系统里面的叫法也许会有所差别,叫做 "任务(task)" ,但是其实它们都是一个意思~~

一个正在运行的程序,都是以 "进程" 的方式来体现出来的~~

通过双击 可执行文件(**.exe文件**),操作系统就会把 可执行文件的核心信息 加载到内存上,并且开始运行里面的代码,从而形成了一个进程,这个进程 就是可执行程序跑起来的模样~~

现在的电脑,可以有多个进程一起执行起来的,可以打开任务管理器,看看此时电脑的进程:

大家需要注意区分,"进程" 和 "程序(可执行文件)" 之间的区别:

如:

这是一个 进程,是QQ所跑起来的模样(是动态的,被加载到内存中的)~~

这是一个 可执行文件,是静态的,躺在硬盘上的~~

换句话说,一个计算机的硬盘上,可能会躺着很多的可执行文件~~

同一时刻,可能只有一小部分在运行(变成了进程)~~

2.2 进程的管理

一个操作系统上,同时跑着许多个进程~~

有的是自己双击过后打开的进程(如:QQ),还有的是电脑一开机 操作系统自动打开的进程~~

既然有这么多的进程,操作系统就需要对它们进行管理,把它们安排的明明白白~~

管理 的思路就是:先描述再组织~~

  1. 先描述:使用一个类/结构体,把这个东西有啥特征 都表示出来~~
  2. 再组织:使用一个数据结构,把很多个这样的 对象/结构体 给整理到一起~~

比如说,现在有一个需求场景:需要给正在好好学习的同学发奖品

那么,首先需要把这些同学的信息给描述出来,虽然信息有很多,但是 此时我们只需要知道 这些同学的学号、姓名就可以了(至于说同学的性别、身高、体重啥的都不关心);

然后就可以用一些数据结构 把这些同学整理到一起,然后就可以发奖品啦~~

类似的,操作系统在进行管理进程的时候,首先用一个 结构体 把很多进程相关的特征 都去进行了一些表示;再用数据结构把这些结构体变量组织在一起~~

2.3 PCB

PCB,叫做 "进程控制块" ~

它就是一个结构体,这个结构体里就包含了一些表示进程的核心信息~

在操作系统内核中,就把若干 PCB 串成了一个双向链表~

这就是进程管理的核心模块~

在任务管理器中,看到了许多的进程,本质上 每一个进程都是一个 PCB,

进程与进程之间 是通过双向链表串起来的,

当我们运行一个进程,就是在链表里面 新增一个节点,

当我们销毁一个进程,就是在链表里面 删除一个节点~

2.3.1 PCB里面的一些属性

pid:进程的身份标识,唯一,类似于 "学号"~~

内存指针:操作系统要把一些必要的数据加载到内存中~~

必要的数据:有些是运行的指令(代码),有些是运行时依赖的数据(全局变量)~~

内存指针就描述了 该进程中哪些部分是指令,哪些部分是数据~~

文件描述符表:表示了当前进程都打开了哪些文件,进程每打开一次文件,就会在文件描述表上记录一些重要的信息~~

在代码中打开一个文件,就会在进程的 文件描述符表 里给这个文件分配一个表项~~

可以看作 数组,每个元素代表了一个打开的文件,它对应的数组下标就是 "文件描述符"~~

所以说,内存指针 和 文件描述符表 就描述了进程有哪些系统的资源,也认为 进程是操作系统中 "资源分配" 的具体单位!!!

2.3.2 进程的调度

进程里面还有一组比较关键的属性,用来实现进程的调度~~

  1. 进程的优先级
  2. 进程的状态
  3. 进程的记账信息
  4. 进程的上下文

什么是调度:

本质问题,当前计算机 CPU 是有限的,但是进程的数量却比较多,都需要消耗一定的资源,但是 每个进程都需要消耗一定的 CPU~

操作系统要做到尽可能的公平,这时候就需要进行 "调度"~

需要让这些有限的资源 贡献出更多的力量~

类似于高铁站的 "调度"工作,铁轨就只有几根,但是每天在上面跑的高铁 确实有许多的,那么 "调度" 就是要规划好 高铁什么时候开,从哪条铁轨上开,从哪里开到哪里......"调度"工作就是需要保证 这些高铁之间需要有条不紊的开,相互之间不可以打架~~

这里的解决方法,就是 "轮流来",虽然进程的运行速度会受到一定的影响,但是 受到的影响是比较小的~

毕竟,CPU的主频是 XX GHz,1秒钟有上几十亿个时钟周期~~

人是感受不到这样的轮转的~

比如说,此时 我正在打开 CSDN,但是 QQ也照样是开着的,

从宏观上面来说,就好像这些进程是同时执行一样,

但是 从微观上来说,并不是同时,而是 "轮流" 的方式占用 CPU 执行~~

类似于这种方式,我们称之为 "并发式的执行"~~

由于 CPU 上有多个核心,每个核心上都可以跑一个进程,某一时刻 两个进程就是在两个 CPU 核心上同时执行的~~

宏观上和微观上都是同时执行的~~

我们把这种方式,称之为 "并形式的执行"~~


那么,现在就可以来解释 进程里的那些关键属性了~

为了方便理解,我们首先需要引进一个场景(大家不要模仿哦):

假设 小欣是一位漂亮小姐姐,追求者有很多,她的选男友的标准是 有钱+长得帅~~

但是,没有哪个追求者具备这两个条件~

于是 她就决定同时交往多个男朋友(A,B,C)~

其中,A 有钱,B 长得帅,C 虽然没有这两个条件,但是他会舔~

所以,小欣 不能让 A、B、C 之间有交集~

于是,小欣 就需要化身为一个 "时间管理大师",即 规划一个时间表,规划哪段时间给和谁干什么~

如:
时间段安排星期一和 A 买个包,出去逛街星期二和 B 一起去吃个饭,看一场电影星期三和 C 一起去上课............

好啦,场景已经设立~~

如果此时,把 小欣 当成一个 CPU,把 A,B,C 当成是三个进程的话,

上述的时间表的安排的情况下,就是 三个进程 在 CPU 上并发的执行~~

进程的优先级:

那么,什么是 进程的优先级 呢?

简单的来说,就是 小欣在安排时间表的时候,先安排哪一个,再安排哪一个......

假设,小欣比较喜欢 money,然后再考虑其他的,

那么 她就可以优先给 A 安排时间,把一周的大部分时间都陪伴在 A 的身边;

其次,在分出一点时间 陪伴 B;

至于 C,就看剩下的时间了~~

进程的状态:

指的是,安排时间表的时候,需要考虑到每个人的当前的特定情况~~

比如说,A 说他这周需要出差两个礼拜,不能够陪她了,

于是 接下来的时间就只给 B 和 C 了~~

对于 进程 来说,有很多的状态,其中最典型的,就是 就绪状态 和 堵塞状态:

就绪状态:进程是准备就绪的,随时都可以让 CPU 执行~

阻塞状态:进程在等待某个任务结束之后,才可以让 CPU 执行;在完成之前,就没法继续执行~

比如说,正常情况下,A、B、C 都是就绪状态(小欣随便安排时间,他们都是随叫随到);

但是,如果 A 出差了,就相当于进入阻塞状态,此时就没法给 A 安排时间了~~

进程的记账信息:

在安排时间的时候,就需要考虑到一些历史记录(以往的安排)~~

比如说,连续有好几个礼拜,给 C 安排的时间都太少了,小欣一看历史记录,发现了这个问题,再不进行一些调整的话,就要失去 C 这个小可爱啦~

于是,就在下一周安排时间的时候,就给 C 多安排一些时间~

操作系统 在安排进程的时候,也会记录以往每个进程在 CPU 上执行的时间,如果发现某个进程被安排得太少,就会适当的调整策略~~

记录以往每个进程在 CPU 上执行的时间,就叫做 进程的记账信息~~

当然,也不一定是一执行的时间为单位,也可能是以执行的指令数为单位~~

进程的上下文:

比如说,某一次 小欣和 A 在一起的时候,和 A 说好了,两周之后 一起去夏威夷旅游~

有一次 小欣和 B 在一起的时候,和 B 说好了,下次见面的时候 他会带来一个小礼物~

于是,当小欣下次遇到 A 的时候,就可以问他说:夏威夷那边准备的咋样了~

下次遇到 B 的时候,就可以问他说:礼物准备的怎么样了~

当然,在这个过程中 可千万不要把 A 和 B 两个对象给搞反了,不然就 "穿帮" 了~

为了避免出现 "穿帮" 的情况,小欣就需要记录好 每次约会后的一些关键信息,尤其是 这次约会还没有处理完的一些事情 需要在下次处理,就需要明确的记录好当前处理的进度/中间结果,这样下次约会的时候,就可以继续从上次的结果中继续往下进行了~

进程在调度的时候也是一样,进程很可能执行了某一个操作,执行到一半,就被调度走了~

过一段时间,进程还是要回来的~

回来就需要从上次执行的位置继续执行下去了~

这就很类似于 玩游戏的时候的 存档和读档,存档保存的信息,就是上次退出之前 的游戏的状态,这个就是 "上下文"~~

对于进程来说,"上下文",具体指的就是 CPU 里的一堆寄存器里面的值,上下文 就会在进程被切出 CPU 的时候,把寄存器的状态保存到 PCB里(内存 里);下次进程回到 CPU 上,就把 PCB 里的上下文读取出来,恢复到 CPU 寄存器中,做到从上次执行的结果 继续往下执行了~~

2.3.3 进程的虚拟地址空间

这是一个和进程非常相关的概念~

进程,需要调用一些系统的资源,其中的内存资源,就是一个很关键的资源~

我们期望每个进程,都用自己的内存,不要相互干扰!!!

但是,在 C语言 中有一个操作,叫做 指针解引用~

解引用的时候,我们需要保证 这个指针里包含的地址,指向的是自己搞得合法的内存地址~

此处必须有程序员来保证,当前指针指向的内存是否合法~

如果指向的内存地址不合法,甚至会伴随着这个操作,把别的进程就直接搞挂了~

但是,但凡是由人来操作的,都会有出错的可能性,甚至使得整个操作系统都不稳定~

为了让各个进程之间不要相互干扰,操作系统就引入了 "虚拟地址空间" 这样的概念~

每个进程都只能访问到自己的地址空间,相互之间都不会有影响了,哪怕指针指错,操作系统也能及时发现,不会影响到其他的进程~

就算出问题,问题也会被限制到进程的内部,不会把其他的进程搞挂了~

正因为有了 虚拟地址空间,进程有了一个非常重要的特性:隔离性!!!

一个进程的运行一般不会影响到另一个进程,尤其是一个进程崩溃也不会影响到另一个进程崩溃~

现在又引出一个问题:

每个进程都有一个 "虚拟地址空间",那么 一个系统里面的进程又那么多,这些虚拟地址空间加到一起,比物理内存大了,那怎么办呢?

  1. 虽然系统里面的进程有这么多,但是 实际上同一时刻进行的进程没有几个!!!
  2. 即使同一时刻,有好几个进程在跑,这些进程也不是同时把所有的虚拟内存地址空间的内存都用上了(假设 同时有6个进程在跑,很可能每个进程只用了 1M 的内存空间,虽然每个进程的虚拟空间很大,但实际使用的内存只有一小部分,物理内存只需要把真实使用的这部分内存数据给表示出来即可)!!!
  3. 极端情况下,同时跑的几个进程同时吃了很多的真实内存,会导致物理内存不够,此时 出现这种情况,算 bug,程序员需要想出办法来优化一下内存占用,或者扩容换一个内存更大的机器!!!

2.3.4 进程间通信

进程引入了隔离性,确实使得系统更稳定了,但是也带来了其他的问题:

如果多个进程之间想要配合工作,就麻烦了~~

操作系统又引入了 "进程间通信",在隔离行的前提下 开了个口子,让多个进程之间能相互通信~~

操作系统提供的进程通信方式有很多种,但是本质上都是一样的:搞一个多个进程之间都能访问到的公共资源,借助公共资源来进行通信!!!

就类似于之前疫情比较严重的时候,点外卖的时候要求 "无接触配送",外卖小哥直接把外卖放到一个专门的 集中放置的地点,点外卖的人直接去那个地点去取外卖~~

这一章的内容就到此为止了, 如果感觉这篇文章对大家有帮助的话,点赞评论关注走一波,非常非常感谢啦~~

标签: 操作系统 进程 PCB

本文转载自: https://blog.csdn.net/qq_53362595/article/details/126063676
版权归原作者 哎呀是小张啊 所有, 如有侵权,请联系我们删除。

“【JavaEE初阶】进程篇”的评论:

还没有评论