【Linux】解锁管道通信和共享内存通信，探索进程间通信的海洋

引言：

两个进程之间，可以进行“数据”的直接传送吗？不能！因为进程具有独立性！

进程为什么会有独立性，本质原因是：这两个进程都有自己的虚拟地址空间，但是他们的正文代码，堆，栈，共享区等被映射到了内存当中的不同的物理空间，所以在内存方面具有独立性，不会互相影响

1、进程间通信基础介绍

1.1为什么需要在进程之间通信？

数据传输：一个进程需要将它的数据发送给另一个进程
资源共享：多个进程之间共享同样的资源。
通知事件：一个进程需要向另一个或一组进程发送消息，通知它（它们）发生了某种事件（如进程终止时要通知父进程）。
进程控制：有些进程希望完全控制另一个进程的执行（如Debug进程），此时控制进程希望能够拦截另一个进程的所有陷入和异常，并能够及时知道它的状态改变。

总结一句话就是，在OS中，往往需要多个进程协同，共同完成一些事情。

1.2进程间通信是什么？

一个进程把自己的数据，能够交给另一个进程。

1.3我们具体如何进行进程间的通信呢？

a.一般规律：

进程间通信的本质：先让不同的进程，看到同一份资源（一般都是要有OS提供）

b.具体做法

OS提供的“空间”有不同的样式，就决定了有不同的通信的方式

管道（匿名管道和命名管道）
共享内存
消息队列
信号量

2.管道

2.1什么是管道

这里的子进程并没有将父进程的struct file拷贝下来，由此可见子进程继承父进程的方式是浅拷贝，所以父进程和子进程指向的都是同一份资源！但是子进程会继承父进程的读写段。

因此基于文件的，让不同的进程看到同一份资源的通信方式，叫做管道！管道只能被设计成为单向通信。

为什么父进程最开始，就要将读写两端都开启的形式去打开同一个文件呢？

因为子进程会继承父进程的读写端，而管道的要求就是单向通信，因此父进程就需要将读写段同时打开，等子进程继承之后，会根据要求，各自关掉不用的描述符

2.2匿名管道：

匿名管道：可以（只能）进行具有血缘关系的进程之间进行进程间通信！（常用于父子）

那么匿名管道如何做到让不同的进程看到同一份资源呢？创建子进程，子进程会继承父进程的相关属性信息！

创建方法：pipe函数创建

#include <unistd.h>
功能:创建一无名管道
原型
int pipe(int fd[2]);

参数
fd：文件描述符数组,其中fd[0]表示读端, fd[1]表示写端，这是输出型参数，需要由这两个参数找到匿名管道（匿名文件）

默认fd[0]表示读端，fd[1]表示写端
返回值:成功返回0，失败返回错误代码

下面实现一个父进程读数据，然后通过管道让子进程读。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

void writer(int wfd)
{
    const char *str = "hello father, I am child";
    char buffer[128];
    int cnt = 0;
    pid_t pid = getpid();
    while(1)
    {
        snprintf(buffer, sizeof(buffer), "message: %s, pid: %d, count: %d\n", str, pid, cnt);
        write(wfd, buffer, strlen(buffer));
        cnt++;
        sleep(1);
    }
}
void reader(int rfd)
{
    char buffer[1024];
    while(1)
    {
        ssize_t n = read(rfd, buffer, sizeof(buffer)-1);
        (void)n;
        printf("father get a message: %s", buffer);
    }
}

int main()
{
    // 1. 
    int pipefd[2];
    int n = pipe(pipefd);
    if(n < 0) return 1;
    printf("pipefd[0]: %d, pipefd[1]: %d\n", pipefd[0]/*read*/, pipefd[1]/*write*/); // 3, 4

    // 2. 
    pid_t id = fork();
    if(id == 0)
    {
        //child: w
        close(pipefd[0]);

        writer(pipefd[1]);

        exit(0);
    }

    // father: r
    close(pipefd[1]);

    reader(pipefd[0]);
    wait(NULL);

    return 0;
}

2.3匿名管道的bug:

子进程继承父进程后，拷贝过父进程的文件描述表，后续子进程在创建的时候，会复制原先父进程的写端，就会导致管道有不止一个写端的BUG

比如这里的4就是子进程的4也是写端

我们的目的是让父进程和子进程之间只有一个写端一个读端，那如何修正这个问题呢？这就需要我们在子进程拷贝父进程的文件描述表的时候，将文件表的读写端口刷新！

3.匿名管道的读写规则

4种情况

管道内部没有数据&&子进程不关闭自己的写端文件fd，读端（富）就要阻塞等待，知道pipe有数据
管道内部被写满&&父进程（读端不关闭自己的fd，写端（子））写满之后，就要阻塞等待
对于写端而言：不写了&&关闭了pipe，读端会将pipe中的数据读完，最后就会读到返回值为0，表示读结束，类似读到了文件的结尾
读端不读&&关闭，写端在写，OS会直接终止写入的进程（子进程），通过信号13信号杀掉进程

5种特性：

自带同步机制
血缘关系进程进行通信，常见于父子
pipe是面向字节流的
父子退出，管道自动释放，文件的声明中周期是随进程的
管道只能单向通信，数据只能向一个方向流动；需要双方通信时，需要建立起两个管道

曾经我们学习的命令行管道（匿名），本质就是我们今天学习的pipe。

在父端写，子端读的情况下子进程的读端为什么都是3？

解释：刚开始父进程3是读端，4是写端，子进程会继承父进程的读写端口。下面是父端写，子端读的情况，那么就需要将父端的读关掉，就是将3关掉，然后将子进程的写端关掉，也就是将子进程的4关掉。父进程会循环创建管道，创建子进程。

所以父进程就会分配两个端口给这个管道进行读写，此时的3就被分配给了读端，5分配给了写端

子进程会拷贝父进程的文件描述表，所以3也是子进程的读端，5就是写端。这样父亲又开始写了，所以父进程的读端3就会被丢掉，子进程要写，那么就把5丢掉了。那么以此类推，所以子进程的读端一直都是3

4.命名管道

4.1.管道的本质

让不同的进程之间可以通信，让不同的进程看到同一份资源（文件）！

那么你怎么保证两个不同的进程打开的是同一个文件？如何让不同的进程看到同一份资源呢？

找到文件：文件的路径 + 文件名

匿名管道应用的一个限制就是只能在具有共同祖先（具有亲缘关系）的进程间通信。

如果我们想在不相关的进程之间交换数据，可以使用FIFO文件来做这项工作，它经常被称为命名管道。

注意命名管道是一种特殊类型的文件！

4.2创建一个命名管道

命名管道可以从命令行上创建，命令行方法是使用下面这个命令：

$ mkfifo filename

命名管道也可以从程序里创建，相关函数有

int mkfifo(const char *filename,mode_t mode);

头文件：

返回值

程序里面创建命名管道

int main(int argc, char *argv[])
{
mkfifo("p2", 0644);
return 0;
}

生成多个可执行程序的方法

4.3.匿名管道与命名管道的区别

匿名管道由pipe函数创建并打开。
命名管道由mkfifo函数创建，打开用open
FIFO（命名管道）与pipe（匿名管道）之间唯一的区别在它们创建与打开的方式不同，一但这些工作完成之后，它们具有相同的语义。
命名管道和匿名管道之间的主要差异就是，命名管道可以让两个没有任何关系的进程进行通信

4.4用命名管道实现server&client通信

PipeClient.cc

#include "Comm.hpp"

int main()
{
    int wfd = open(Path, O_WRONLY);
    if (wfd < 0)
    {
        cerr << "open failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        return 1;
    }

    string inbuffer;
    while (true)
    {
        cout << "Please Enter Your Message# ";
        std::getline(cin, inbuffer);
        if(inbuffer == "quit") break;
        ssize_t n = write(wfd, inbuffer.c_str(), inbuffer.size());
        if (n < 0)
        {
            cerr << "write failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
            break;
        }
    }

    close(wfd);
    return 0;
}

Comm.hpp

#ifndef __COMM_HPP__
#define __COMM_HPP__

#include <iostream>
#include <string>
#include <cerrno>
#include <cstring>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <fcntl.h>

using namespace std;

#define Mode 0666
#define Path "./fifo"

class Fifo
{
public:
    Fifo(const string &path) : _path(path)
    {
        umask(0);
        int n = mkfifo(_path.c_str(), Mode);
        if (n == 0)
        {
            cout << "mkfifo success" << endl;
        }
        else
        {
            cerr << "mkfifo failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        }
    }
    ~Fifo()
    {
        int n = unlink(_path.c_str());
        if (n == 0)
        {
            cout << "remove fifo file " << _path << " success" << endl;
        }
        else
        {
            cerr << "remove failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        }
    }

private:
    string _path; // 文件路径+文件名
};

#endif

PipeServer.cc

#include "Comm.hpp"
#include <unistd.h>

// 基于命名管道，创建一个进程池呢？？？
int main()
{
    Fifo fifo(Path);

    int rfd = open(Path, O_RDONLY);
    if (rfd < 0)
    {
        cerr << "open failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
        return 1;
    }
    // 如果我们的写端没打开，先读打开，open的时候就会阻塞，直到把写端打开，读open才会返回
    cout << "open success" << endl;

    char buffer[1024];
    while (true)
    {
        ssize_t n = read(rfd, buffer, sizeof(buffer) - 1);
        if (n > 0)
        {
            buffer[n] = 0;
            cout << "client say : " << buffer << endl;
        }
        else if (n == 0)
        {
            cout << "client quit, me too!!" << endl;
            break;
        }
        else
        {
            cerr << "read failed, errno: " << errno << ", errstring: " << strerror(errno) << endl;
            break;
        }
    }

    close(rfd);
    return 0;
}

5.共享内存方式通信：

上面我们讲述的是关于管道通信方式，下面我们来讲解共享内存的通信方式。

5.1共享内存如何实现让不同的进程看到同一份资源呢？

我们首先在内存中开辟一段空间，是由操作系统开辟的
接着让这份共享内存对不同的进程构建映射
移除映射
删除共享内存

共享内存在内核中同时可以存在很多个，OS必须要管理所有的共享内存。如何管理呢？先描述，再组织。系统中会存在很多共享内存！

那么我们怎么保证，两个或者多个不同的进程看到的是同一个共享内存呢？
所以我们要给共享内存提供唯一性的标识！

5.2.关于共享内存的函数

shmget函数

功能：用来创建共享内存
原型
int shmget(key_t key, size_t size, int shmflg);

参数
key:共享内存在内核中的唯一性标识
size:共享内存大小
shmflg:由九个权限标志构成，它们的用法和创建文件时使用的mode模式标志是一样的
返回值：成功返回一个非负整数，即该共享内存段的标识码；失败返回-1

shmflg标志讲解：

问题1：这个key是怎么形成的？意义是什么？

使用函数ftok来生成key，并且这个函数的参数可以随便传；key的值是多少并不重要，只要能够标识唯一性即可。

问题2：在调用shmget函数时，为什么要让用户传入key值呢？

因为当我们一个进程使用ftok函数有了唯一性的标识后，我们两个不同的进程只需要输入相同的key值就可以看见共享内存了！这个key值相当于一个桥梁，沟通了两个不同的进程去看见了同一份共享内存！！！让OS传，OS做不到！

shmctl函数删除共享内存

功能：用于控制共享内存
原型
int shmctl(int shmid, int cmd, struct shmid_ds *buf);
参数
shmid:由shmget返回的共享内存标识码
cmd:将要采取的动作（有三个可取值）
buf:指向一个保存着共享内存的模式状态和访问权限的数据结构
返回值：成功返回0；失败返回-1

shmat函数挂接共享内存

功能：将共享内存段连接到进程地址空间
原型
void *shmat(int shmid, const void *shmaddr, int shmflg);
参数
shmid: 共享内存标识
shmaddr:指定连接的地址，用户指明将shm挂接到哪里
shmflg:它的两个可能取值是SHM_RND和SHM_RDONLY
返回值：成功返回一个指针，指向共享内存第一个节；失败返回-1

shmdt函数去关联

功能：将共享内存段与当前进程脱离
原型
int shmdt(const void *shmaddr);
参数
shmaddr: 由shmat所返回的指针
返回值：成功返回0；失败返回-1
注意：将共享内存段与当前进程脱离不等于删除共享内存段

5.3共享内存的大小

在内核中，共享内存的大小是以4kb为基本单位的，即便自己想要4kb—+1内存的空间，但是内核里创建的是8kb的内存，但只给你使用4kb+1的空间，所以其余字节被浪费掉了。建议共享内存申请大小是4kb的整数倍。

5.4共享内存的原理

使用共享内存通信，一定是一个进程创建新的共享内存，另一个直接获取共享内存即可。

共享内存，如果进程结束，我们没有主动释放它，则共享内存一直存在（除非重启系统）。这也就意味着共享内存的生命周期是随系统内核的！

5.5.key和shmid到底有什么区别

我们可以使用ipcs -m指令来查看系统中指定用户创建的共享内存。

发现共享内存有以下属性：

key：在内核角度，区分共享内存的唯一性！
shmid：在用户角度，无论是指令级还是代码级，最后对共享内存进行控制，用的都是shmid！

5.6.共享内存的优缺点

优点：共享内存是所有进程间通信中速度最快的

为什么共享内存是所有进程间通信中速度最快的？

因为假如有两个进程A、B，当进程A把数据放到共享内存当中时，进程B能够直接看到，因为共享内存使用的是用户空间。

而管道通信，进程A如果需要将数据传输到进程B时，必须经过系统调用，将数据拷贝到管道中，而进程B再从管道中拷贝数据到进程B，所以管道通信经历了很多次拷贝，通信速度自然就慢了！

所以此时的系统调用函数write、read函数本质其实就是拷贝资源！

缺点：

共享内存不提供进程间协同的任何机制，所以就会造成数据不一致的情况。

所以我们怎么解决这个问题呢？我们采用信号量或者用管道进行处理（管道本身是有同步属性的）

用管道来实现两个进程的信息的协同。

6、信号量

6.1.关于信号量的理论知识

临界资源：被保护起来的，任何时刻只允许一个线程执行访问的公共资源
临界区：访问临界资源的代码，临界区是代码，而临界资源是代码管理的资源
原子性：操作对象的时候，只有两种状态：要么还没开始，要么已经结束。
对于共享资源进行保护，是一个多执行流场景下，一个比较常见和重要的话题
互斥：在访问一部分共享资源的时候，任何时刻只有我一个人访问，就叫做互斥
同比：访问资源在安全的前提下，具有一定的顺序性

6.2.信号量的原理

为什么信号量也属于进程间通信的范畴呢？

我们首先要明白信号量本质是一个计数器，描述临界资源数量的计数器。

在多进程场景下，int全局变量是不能实现计数器的效果呢？

不能，有两个原因：

无法在进程间共享
count++，count--不是原子的！

count需要先从内存中读取数据放在CPU上，然后CPU进行加法或者减法操作，最后再将数据放在内存当中。因此就不是原子性的。

为什么多进程还要考虑原子性的问题呢？因为如果不是原子性，加减不能立刻生效，就会对别的进程的数据产生影响。

在多进程场景下，int全局变量是不能实现计数器的效果的，因为无法在进程间共享！进程之间是独立的！

因此就需要我们的信号量充当计数器，如何充当呢？让不同的进程先看到同一份资源——计数器资源！！因此信号量本质也是跟进程间通信相关的！

所有的进程，访问临界资源，都必须先申请信号量——所有的进程都能看到同一个信号量——信号量本身就是共享资源（信号量++和--操作必须是原子的！）

标签：服务器 linux 运维

本文转载自: https://blog.csdn.net/hanwangyyds/article/details/142281571
版权归原作者 可涵不会debug 所有，如有侵权，请联系我们删除。