送给大家一句话:
人要成长,必有原因,背后的努力与积累一定数倍于普通人。所以,关键还在于自己。 – 杨绛
从零开始认识进程间通信
1 为什么要进程间通信
以前我们学习的过程中,进程是具有独立性的。但有些时候需要多个进程进行协同,这时候就需要进程间的通信来保证信息的互通。
就比如学校就分有教务处 , 学生处,教研组,班主任等部分。如果学校想要组织一场考试,就通知教务处安排好考场和监考员,告诉教研组老师需要出卷子,等教务处与教研组完成对应工作再告知学生处和班主任,然后通知学生进行考试,班主任和学生处做好考试监督工作。
这里面就少不了沟通交流,传递信息。进程工作也是这样:进程的协同工作需要一个前提提交——通信。通信就是传递数据,控制相关信息
2 进程如何通信
首先 , 我们知道进程是具有独立性的,一个进程的状态不会影响其他进程的运行。而独立性的本质是
进程 = 内核数据结构 + 代码和数据
,内核数据结构
PCB
是独立的,
代码和数据
是独立的 , 进程自然就是独立的。
所以,进程间通信的成本的成本稍微高一些,因为进程本身是独立的,两个进程天然是无法进行数据共享的!
可是子进程建立的时候不是会拷贝(继承)一份父进程的数据吗,这不是进行通信吗???
这就要我们明确区分两个概念:能通信与可以一直通信是不一样的。子进程继承的父进程数据是只读的,而且只进行一次。而一直通信是时不时就“打个电话”。
所以进程间通信的前提是:先让不同的进程看到同一份(操作系统)资源(“一段内存”)。
- 首先,一定是某一个进程先需要通信,让OS创建一个共享资源
- 那么OS必须通过对应的系统调用来创建共享资源
- OS创建的共享资源的不同 , 系统调用接口的不同----就导致进程间通信会有不同的种类
3 进程通信的常见方式
一般通信有以下种类:
- 管道 - 匿名管道pipe- 命名管道
- System V IPC 标准 (早期的本地通信) - System V 消息队列- System V 共享内存- System V 信号量
- POSIX IPC 标准(现代版本) - 消息队列- 共享内存- 信号量- 互斥量- 条件变量- 读写锁
今天来讲解管道
早期的时候,程序员们面对通信的需求时,不想再单独设计一个通信模块,直接复用内核级代码,就产生了管道!!!管道分为命名管道和匿名管道。
4 管道
4.1 什么是管道
【Linux】 拿下 系统 基础文件操作!!!
【Linux】开始了解重定向
这两篇文章了我们讲解了文件的底层,知道每一个进程都有对应的文件管理结构体,文件管理结构体中有管理已经打开文件的数组。数组下标为文件描述符,指向文件结构体,而文件结构体又会指向文件真正属性inode。
当我们以不同方式打开文件时,只需要在内存中加载一份数据(通过引用计数来管理),以读写方式打开,便会有两个对应的文件结构体。他们共同使用一份代数据,那自然就使用同一个内核级缓冲区。
那么为了要通信,不用在写一个新的模块,直接建立一个子进程来通信多简单。子进程会以父进程为模版进行写时拷贝。
进行拷贝的只有进程对应的结构体,因为进程具有独立性,而文件系统我们可没提过什么对立性,所以文件管理数组进行浅拷贝,同样指向原先的文件结构体。
这时也就理解为什么父子进程会向同一块显示器终端打印数据了。
也理解为什么进程会默认打开012三个标准输入输出:因为所有进程都是bash的子进程,而bash打开了这三个文件,所以自然就打开了!!!
子进程要主动close(0 / 1 /2)不影响父进程继续使用显示器文件!只有引用计数(类似硬链接数)归零才会清理数据
今天我们进行进程间通信的前提——先让不同的进程看到同一份(操作系统)资源,不就解决了吗!!!
文件的内存缓冲区不就是两个进程共享的一份资源吗!而所谓的管道文件就是这个文件缓冲区!
但是呢,管道只允许进行单向通信(父->子 或 子->父),因为管道如果允许父子进程都可以写,就会导致数据紊乱!进行通信的时候,每个进程关闭不需要的文件描述符,然后通过缓冲区来单向通信。一个进程把信息写入缓冲区,另一个进程从缓冲区读取数据,不需要刷新到硬盘,直接从内存进行操作!
有个问题:父子既然要关闭不需要的fd那为什么曾经还要打开呢?可以不关闭吗?
如果父进程只打开读写的fd,那么子进程也就只能继承读写的fd,这就坏事了,总得有人写入吧!那为什么不直接以读写方式打开一个fd呢?这样肯定不可以,子进程继承后也具有读写,也坏事了!
所以不关闭是为了让子进程可以继承下去,到时候关闭不需要的就可以了!当然也可以不关闭,只要你不乱使用,所以为了排除风险,建议直接关闭
4.2 管道通信的系统调用
了解了管道是什么,我们就来看看关于管道的系统调用是什么吧?
通过手册我们可以看到:
PIPE(2) Linux Programmer's Manual PIPE(2)
NAME
pipe, pipe2 - create pipe
SYNOPSIS
#include<unistd.h>/* On Alpha, IA-64, MIPS, SuperH, and SPARC/SPARC64; see NOTES */structfd_pair{long fd[2];};structfd_pairpipe();/* On all other architectures */intpipe(int pipefd[2]);#define_GNU_SOURCE/* See feature_test_macros(7) */#include<fcntl.h>/* Obtain O_* constant definitions */#include<unistd.h>intpipe2(int pipefd[2],int flags);
新的
pipe(int pipefd[2])
是今天的主角(Ubuntu提供了新的选择
pipe2
),其实底层就是
open
。
pipefd[2]
这是一个输出型参数,把以读方式打开的文件描述符
rfd
和以写方式打开的文件描述符
wfd
记录下来!
和
open
不同的是,这个系统调用不需要文件路径和文件名,所以才叫匿名管道!
那么如果我们想要双向通信呢???
干脆建两个管道不就行了!
那为什么要进行单向通信呢?
因为这个管道的单向通信简单,对代码的复用率很高!
4.3 小试牛刀
接下来我们就来写一个demo,来试试管道接口。
首先我们来搭建一个框架:
- 建立一个管道,得到对应的文件描述符
- 创建子进程,关闭对应文件
- 我们进行子进程写入,父进程读取
- 等待子进程退出,避免僵尸进程出现!
#include<iostream>#include<unistd.h>#include<cstring>#include<sys/wait.h>#include<cerrno>usingnamespace std;voidSubProcessWrite(int wfd){}voidFatherProcessRead(int rfd){}intmain(){//创建管道int pipefd[2];//[0] -> r | [1] -> wint n =pipe(pipefd);if(n !=0){perror("创建管道错误!\n");}
cout <<"pipefd[0] : "<< pipefd[0]<<" pipefd[1] :"<< pipefd[1]<< endl;//创建子进程//关闭对应文件
pid_t id =fork();if(id ==0){//子进程 -- writeclose(pipefd[0]);SubProcessWrite(pipefd[1]);//使用完都关闭close(pipefd[1]);exit(0);}//父进程 -- readclose(pipefd[1]);FatherProcessRead(pipefd[0]);//使用完都关闭close(pipefd[0]);
pid_t rid =waitpid(id ,nullptr,0);if(rid >0){
cout <<"wait child process done!"<< endl;}return0;}
管道本质也是文件,我们读写同样使用write和read。
我们完善一下代码:
- 子进程每隔一秒写入一次数据
- 父进程每隔一秒读取一次数据
#include<iostream>#include<unistd.h>#include<cstring>#include<string>#include<sys/wait.h>#include<cerrno>usingnamespace std;
string GetOtherMessage(){staticint cnt =0;
string messageid =to_string(cnt);
cnt++;
pid_t self_id =getpid();
string stringid = std::to_string(self_id);
string message ="messageid : ";
message += messageid;
message +="my pid :";
message += stringid;return message;}voidSubProcessWrite(int wfd){
string messages ="father,I am your soon process !";while(true){
string info = messages +GetOtherMessage();//写入管道时没有写入'\0',没有必要。在读取时添加write(wfd , info.c_str(), info.size());sleep(1);}}#definesize1024voidFatherProcessRead(int rfd){char inbuffer[size];while(true){//注意传入的参数 , 读取 rfd 内的数据到inbuffer中,返回成功读取的个数。
ssize_t n =read(rfd , inbuffer ,sizeof(inbuffer)-1);if( n >0){
inbuffer[n]='\0';//添加'\0'
cout <<"father get message: "<< inbuffer << endl;}}}intmain(){//创建管道int pipefd[2];//[0] -> r | [1] -> wint n =pipe(pipefd);if(n !=0){perror("创建管道错误!\n");}
cout <<"pipefd[0] : "<< pipefd[0]<<" pipefd[1] :"<< pipefd[1]<< endl;sleep(1);//创建子进程//关闭对应文件
pid_t id =fork();if(id ==0){
cout <<"子进程关闭不需要的fd , 准备开始发消息"<< endl;sleep(1);//子进程 -- writeclose(pipefd[0]);SubProcessWrite(pipefd[1]);//使用完都关闭close(pipefd[1]);exit(0);}
cout <<"子进程关闭不需要的fd , 准备开始接收消息"<< endl;sleep(1);//父进程 -- readclose(pipefd[1]);FatherProcessRead(pipefd[0]);//使用完都关闭close(pipefd[0]);
pid_t rid =waitpid(id ,nullptr,0);if(rid >0){
cout <<"wait child process done!"<< endl;}return0;}
运行看看:
这样验证管道通信的可行性。
5 总结
管道的4种情况
- 如果管道内部是空的 && write fd没有关闭: 读取条件不具备,读取进程会被阻塞 – wait 等待条件具备(写入了数据)
- 管道别写满 && read fd 不读且没有关闭 : 管道被写满,写进程会被阻塞,写条件不具备-- wait 等待条件具备(读取走一部分数据才能继续写)
- 管道一直在被读 && 写端关闭了wfd: 读端read的返回值会读到 0 ,表示到了文件结尾!!!所以可以在读取的时候进行一下判断,为0就直接退出读取!
- rfd 直接关闭 , 写端wfd一直在写入: 首先管道只有一对读写端,读端被关闭了,那么管道就不能称之为管道了。OS系统也不会做这样的无用功,直接把
broken pipe
坏的管道 进行杀掉!会发送对应的13号信号SIGPIPE
:
我们可以总结出管道的5 种特征:
- 匿名管道:只用来进行父子进程之间,因为他们可以看到同一资源
- 同步性:管道内部自带进程之间的同步机制!同步是多执行流代码的时候,具有明显的顺序性。父子进程的读写一定要同步进行,不然可能会出现并发读取的情况,出现错误!
- 文件的生命周期是随进程的:当一个文件没有进程调用的时候,就会释放掉!
- 管道在通信的时候,是面向字节流的:write 的次数和read的次数不是一一匹配的! 我们让子进程疯狂的写,父进程也一直读。子进程每 1 s写一次,写入时也向标准错误里进行打印(为了好观察)。父进程每5s读一次,并打印到显示器: 可以看到,右侧的子进程,左边是父进程。子进程写入好几次的数据,会被父进程一次读取一大批!!!
- 管道的通信模式,是一种特殊的半双工模式:与之对应的是全双工模式,即双方交流可以同时说话。半双工是只能一方说话,一方聆听,不能同时说(对讲机模式)。
这里提一个概念,在管道读写是"原子"的,每个"原子"是
4096 bytes
。只有小于这个大小,就不会在读写时被其他人影响。如果大于一个原子的大小,就不能保证安全了。
下一篇文章我们进行管道的实战——进程池项目!
Thanks♪(・ω・)ノ谢谢阅读!!!
下一篇文章见!!!
版权归原作者 叫我龙翔 所有, 如有侵权,请联系我们删除。