0


【Linux】解锁管道通信和共享内存通信,探索进程间通信的海洋

引言:

两个进程之间,可以进行“数据”的直接传送吗?不能!因为进程具有独立性!

进程为什么会有独立性,本质原因是:这两个进程都有自己的虚拟地址空间,但是他们的正文代码,堆,栈,共享区等被映射到了内存当中的不同的物理空间 ,所以在内存方面具有 独立性,不会互相影响

1、进程间通信基础介绍

1.1为什么需要在进程之间通信?

  • 数据传输:一个进程需要将它的数据发送给另一个进程
  • 资源共享:多个进程之间共享同样的资源。
  • 通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发生了某种事件(如进程终止时要通知父进程)。
  • 进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程),此时控制进程希望能够拦截另一个进程的所有陷入和异常,并能够及时知道它的状态改变。

总结一句话就是,在OS中,往往需要多个进程协同,共同完成一些事情。

1.2进程间通信是什么?

一个进程把自己的数据,能够交给另一个进程。

1.3我们具体如何进行进程间的通信呢?

a.一般规律:

进程间通信的本质:先让不同的进程,看到同一份资源(一般都是要有OS提供)

b.具体做法

OS提供的“空间”有不同的样式,就决定了有不同的通信的方式

  1. 管道(匿名管道和命名管道)
  2. 共享内存
  3. 消息队列
  4. 信号量

2.管道

2.1什么是管道

这里的子进程并没有将父进程的struct file拷贝下来,由此可见子进程继承父进程的方式是浅拷贝,所以父进程和子进程指向的都是同一份资源!但是子进程会继承父进程的读写段。

因此基于文件的,让不同的进程看到同一份资源的通信方式,叫做管道!管道只能被设计成为单向通信

为什么父进程最开始,就要将读写两端都开启的形式去打开同一个文件呢?

因为子进程会继承父进程的读写端,而管道的要求就是单向通信,因此父进程就需要将读写段同时打开,等子进程继承之后,会根据要求,各自关掉不用的描述符

2.2匿名管道:

匿名管道:可以(只能)进行具有血缘关系的进程之间进行进程间通信!(常用于父子)

那么匿名管道如何做到让不同的进程看到同一份资源呢?创建子进程,子进程会继承父进程的相关属性信息!

创建方法:pipe函数创建

#include <unistd.h>
功能:创建一无名管道
原型
int pipe(int fd[2]);

参数
fd:文件描述符数组,其中fd[0]表示读端, fd[1]表示写端,这是输出型参数,需要由这两个参数找到匿名管道(匿名文件)

默认fd[0]表示读端,fd[1]表示写端
返回值:成功返回0,失败返回错误代码

下面实现一个父进程读数据,然后通过管道让子进程读。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

void writer(int wfd)
{
    const char *str = "hello father, I am child";
    char buffer[128];
    int cnt = 0;
    pid_t pid = getpid();
    while(1)
    {
        snprintf(buffer, sizeof(buffer), "message: %s, pid: %d, count: %d\n", str, pid, cnt);
        write(wfd, buffer, strlen(buffer));
        cnt++;
        sleep(1);
    }
}
void reader(int rfd)
{
    char buffer[1024];
    while(1)
    {
        ssize_t n = read(rfd, buffer, sizeof(buffer)-1);
        (void)n;
        printf("father get a message: %s", buffer);
    }
}

int main()
{
    // 1. 
    int pipefd[2];
    int n = pipe(pipefd);
    if(n < 0) return 1;
    printf("pipefd[0]: %d, pipefd[1]: %d\n", pipefd[0]/*read*/, pipefd[1]/*write*/); // 3, 4

    // 2. 
    pid_t id = fork();
    if(id == 0)
    {
        //child: w
        close(pipefd[0]);

        writer(pipefd[1]);

        exit(0);
    }

    // father: r
    close(pipefd[1]);

    reader(pipefd[0]);
    wait(NULL);

    return 0;
}

2.3匿名管道的bug:

子进程继承父进程后,拷贝过父进程的文件描述表,后续子进程在创建的时候,会复制原先父进程的写端,就会导致管道有不止一个写端的BUG

比如这里的4就是子进程的4也是写端

我们的目的是让父进程和子进程之间只有一个写端一个读端,那如何修正这个问题呢?这就需要我们在子进程拷贝父进程的文件描述表的时候,将文件表的读写端口刷新!

3.匿名管道的读写规则

4种情况

  1. 管道内部没有数据&&子进程不关闭自己的写端文件fd,读端(富)就要阻塞等待,知道pipe有数据
  2. 管道内部被写满&&父进程(读端不关闭自己的fd,写端(子))写满之后,就要阻塞等待
  3. 对于写端而言:不写了&&关闭了pipe,读端会将pipe中的数据读完,最后就会读到返回值为0,表示读结束,类似读到了文件的结尾
  4. 读端不读&&关闭,写端在写,OS会直接终止写入的进程(子进程),通过信号13信号杀掉进程

5种特性:

  1. 自带同步机制
  2. 血缘关系进程进行通信,常见于父子
  3. pipe是面向字节流的
  4. 父子退出,管道自动释放,文件的声明中周期是随进程的
  5. 管道只能单向通信,数据只能向一个方向流动;需要双方通信时,需要建立起两个管道

曾经我们学习的命令行管道(匿名),本质就是我们今天学习的pipe。

在父端写,子端读的情况下子进程的读端为什么都是3?

解释:刚开始父进程3是读端,4是写端,子进程会继承父进程的读写端口。下面是父端写,子端读的情况,那么就需要将父端的读关掉,就是将3关掉,然后将子进程的写端关掉,也就是将子进程的4关掉。父进程会循环创建管道,创建子进程。

所以父进程就会分配两个端口给这个管道进行读写,此时的3就被分配给了读端,5分配给了写端

子进程会拷贝父进程的文件描述表,所以3也是子进程的读端,5就是写端。这样父亲又开始写了,所以父进程的读端3就会被丢掉,子进程要写,那么就把5丢掉了。那么以此类推,所以子进程的读端一直都是3

4.命名管道

4.1.管道的本质

让不同的进程之间可以通信,让不同的进程看到同一份资源(文件)

那么你怎么保证两个不同的进程打开的是同一个文件?如何让不同的进程看到同一份资源呢?

找到文件:文件的路径 + 文件名

匿名管道应用的一个限制就是只能在具有共同祖先(具有亲缘关系)的进程间通信。

如果我们想在不相关的进程之间交换数据,可以使用FIFO文件来做这项工作,它经常被称为命名管道。

注意命名管道是一种特殊类型的文件!

4.2创建一个命名管道

命名管道可以从命令行上创建,命令行方法是使用下面这个命令:

$ mkfifo filename

命名管道也可以从程序里创建,相关函数有

int mkfifo(const char *filename,mode_t mode);

头文件:

返回值

程序里面创建命名管道

int main(int argc, char *argv[])
{
mkfifo("p2", 0644);
return 0;
}

生成多个可执行程序的方法

4.3.匿名管道与命名管道的区别

  • 匿名管道由pipe函数创建并打开。
  • 命名管道由mkfifo函数创建,打开用open
  • FIFO(命名管道)与pipe(匿名管道)之间唯一的区别在它们创建与打开的方式不同,一但这些工作完成之后,它们具有相同的语义。
  • 命名管道和匿名管道之间的主要差异就是,命名管道可以让两个没有任何关系的进程进行通信

4.4用命名管道实现server&client通信

PipeClient.cc

#include "Comm.hpp"

int main()
{
    int wfd = open(Path, O_WRONLY);
    if (wfd < 0)
    {
        cerr << "open failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        return 1;
    }

    string inbuffer;
    while (true)
    {
        cout << "Please Enter Your Message# ";
        std::getline(cin, inbuffer);
        if(inbuffer == "quit") break;
        ssize_t n = write(wfd, inbuffer.c_str(), inbuffer.size());
        if (n < 0)
        {
            cerr << "write failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
            break;
        }
    }

    close(wfd);
    return 0;
}

Comm.hpp

#ifndef __COMM_HPP__
#define __COMM_HPP__

#include <iostream>
#include <string>
#include <cerrno>
#include <cstring>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <fcntl.h>

using namespace std;

#define Mode 0666
#define Path "./fifo"

class Fifo
{
public:
    Fifo(const string &path) : _path(path)
    {
        umask(0);
        int n = mkfifo(_path.c_str(), Mode);
        if (n == 0)
        {
            cout << "mkfifo success" << endl;
        }
        else
        {
            cerr << "mkfifo failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        }
    }
    ~Fifo()
    {
        int n = unlink(_path.c_str());
        if (n == 0)
        {
            cout << "remove fifo file " << _path << " success" << endl;
        }
        else
        {
            cerr << "remove failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        }
    }

private:
    string _path; // 文件路径+文件名
};

#endif

PipeServer.cc

#include "Comm.hpp"
#include <unistd.h>

// 基于命名管道,创建一个进程池呢???
int main()
{
    Fifo fifo(Path);

    int rfd = open(Path, O_RDONLY);
    if (rfd < 0)
    {
        cerr << "open failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        return 1;
    }
    // 如果我们的写端没打开,先读打开,open的时候就会阻塞,直到把写端打开,读open才会返回
    cout << "open success" << endl;

    char buffer[1024];
    while (true)
    {
        ssize_t n = read(rfd, buffer, sizeof(buffer) - 1);
        if (n > 0)
        {
            buffer[n] = 0;
            cout << "client say : " << buffer << endl;
        }
        else if (n == 0)
        {
            cout << "client quit, me too!!" << endl;
            break;
        }
        else
        {
            cerr << "read failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
            break;
        }
    }

    close(rfd);
    return 0;
}

5.共享内存方式通信:

上面我们讲述的是关于管道通信方式,下面我们来讲解共享内存的通信方式。

5.1共享内存如何实现让不同的进程看到同一份资源呢?

  1. 我们首先在内存中开辟一段空间,是由操作系统开辟的
  2. 接着让这份共享内存对不同的进程构建映射
  3. 移除映射
  4. 删除共享内存

共享内存在内核中同时可以存在很多个,OS必须要管理所有的共享内存。如何管理呢?先描述,再组织。系统中会存在很多共享内存!

那么我们怎么保证,两个或者多个不同的进程看到的是同一个共享内存呢?
所以我们要给共享内存提供唯一性的标识!

5.2.关于共享内存的函数

shmget函数

功能:用来创建共享内存
原型
int shmget(key_t key, size_t size, int shmflg);

参数
key:共享内存在内核中的唯一性标识
size:共享内存大小
shmflg:由九个权限标志构成,它们的用法和创建文件时使用的mode模式标志是一样的
返回值:成功返回一个非负整数,即该共享内存段的标识码;失败返回-1

shmflg标志讲解:

问题1:这个key是怎么形成的?意义是什么?

使用函数ftok来生成key,并且这个函数的参数可以随便传;key的值是多少并不重要,只要能够标识唯一性即可。

问题2:在调用shmget函数时,为什么要让用户传入key值呢?

因为当我们一个进程使用ftok函数有了唯一性的标识后,我们两个不同的进程只需要输入相同的key值就可以看见共享内存了!这个key值相当于一个桥梁,沟通了两个不同的进程去看见了同一份共享内存!!!让OS传,OS做不到!

shmctl函数删除共享内存

功能:用于控制共享内存
原型
int shmctl(int shmid, int cmd, struct shmid_ds *buf);
参数
shmid:由shmget返回的共享内存标识码
cmd:将要采取的动作(有三个可取值)
buf:指向一个保存着共享内存的模式状态和访问权限的数据结构
返回值:成功返回0;失败返回-1

shmat函数挂接共享内存

功能:将共享内存段连接到进程地址空间
原型
void *shmat(int shmid, const void *shmaddr, int shmflg);
参数
shmid: 共享内存标识
shmaddr:指定连接的地址,用户指明将shm挂接到哪里
shmflg:它的两个可能取值是SHM_RND和SHM_RDONLY
返回值:成功返回一个指针,指向共享内存第一个节;失败返回-1

shmdt函数去关联

功能:将共享内存段与当前进程脱离
原型
int shmdt(const void *shmaddr);
参数
shmaddr: 由shmat所返回的指针
返回值:成功返回0;失败返回-1
注意:将共享内存段与当前进程脱离不等于删除共享内存段

5.3共享内存的大小

在内核中,共享内存的大小是以4kb为基本单位的,即便自己想要4kb—+1内存的空间,但是内核里创建的是8kb的内存,但只给你使用4kb+1的空间,所以其余字节被浪费掉了。建议共享内存申请大小是4kb的整数倍。

5.4共享内存的原理

使用共享内存通信,一定是一个进程创建新的共享内存,另一个直接获取共享内存即可。

共享内存,如果进程结束,我们没有主动释放它,则共享内存一直存在(除非重启系统)。这也就意味着共享内存的生命周期是随系统内核的!

5.5.key和shmid到底有什么区别

我们可以使用ipcs -m指令来查看系统中指定用户创建的共享内存。

发现共享内存有以下属性:

  • key:在内核角度,区分共享内存的唯一性!
  • shmid:在用户角度,无论是指令级还是代码级,最后对共享内存进行控制,用的都是shmid!

5.6.共享内存的优缺点

优点:共享内存是所有进程间通信中速度最快的

为什么共享内存是所有进程间通信中速度最快的?

因为假如有两个进程A、B,当进程A把数据放到共享内存当中时,进程B能够直接看到,因为共享内存使用的是用户空间。

而管道通信,进程A如果需要将数据传输到进程B时,必须经过系统调用,将数据拷贝到管道中,而进程B再从管道中拷贝数据到进程B,所以管道通信经历了很多次拷贝,通信速度自然就慢了!

所以此时的系统调用函数write、read函数本质其实就是拷贝资源!

缺点:

共享内存不提供进程间协同的任何机制,所以就会造成数据不一致的情况。

所以我们怎么解决这个问题呢?我们采用信号量或者用管道进行处理(管道本身是有同步属性的)

用管道来实现两个进程的信息的协同。

6、信号量

6.1.关于信号量的理论知识

  • 临界资源:被保护起来的,任何时刻只允许一个线程执行访问的公共资源
  • 临界区:访问临界资源的代码,临界区是代码,而临界资源是代码管理的资源
  • 原子性:操作对象的时候,只有两种状态:要么还没开始,要么已经结束。
  • 对于共享资源进行保护,是一个多执行流场景下,一个比较常见和重要的话题
  • 互斥:在访问一部分共享资源的时候,任何时刻只有我一个人访问,就叫做互斥
  • 同比:访问资源在安全的前提下,具有一定的顺序性

6.2.信号量的原理

为什么信号量也属于进程间通信的范畴呢?

我们首先要明白信号量本质是一个计数器,描述临界资源数量的计数器。

在多进程场景下,int全局变量是不能实现计数器的效果呢?

不能,有两个原因:

  1. 无法在进程间共享
  2. count++,count--不是原子的!

count需要先从内存中读取数据放在CPU上,然后CPU进行加法或者减法操作,最后再将数据放在内存当中。因此就不是原子性的。

为什么多进程还要考虑原子性的问题呢?因为如果不是原子性,加减不能立刻生效,就会对别的进程的数据产生影响。

在多进程场景下,int全局变量是不能实现计数器的效果的,因为无法在进程间共享!进程之间是独立的!

因此就需要我们的信号量充当计数器,如何充当呢?让不同的进程先看到同一份资源——计数器资源!!因此信号量本质也是跟进程间通信相关的!

所有的进程,访问临界资源,都必须先申请信号量——所有的进程都能看到同一个信号量——信号量本身就是共享资源(信号量++和--操作必须是原子的!)

标签: 服务器 linux 运维

本文转载自: https://blog.csdn.net/hanwangyyds/article/details/142281571
版权归原作者 可涵不会debug 所有, 如有侵权,请联系我们删除。

“【Linux】解锁管道通信和共享内存通信,探索进程间通信的海洋”的评论:

还没有评论