【Linux】基础IO—1

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

世上有两种耀眼的光芒，一种是正在升起的太阳，一种是正在努力学习编程的你!一个爱学编程的人。各位看官，我衷心的希望这篇博客能对你们有所帮助，同时也希望各位看官能对我的文章给与点评，希望我们能够携手共同促进进步，在编程的道路上越走越远！

提示：以下是本篇文章正文内容，下面案例可供参考

先来段代码回顾C文件接口

"w"写文件

#include <stdio.h>
#include <string.h>

int main()
{
    FILE* fp = fopen("myfile", "w");
    if (!fp) {
        printf("fopen error!\n");
    }

    const char* msg = "hello bit!\n";
    int count = 5;
    while (count--) {
        fwrite(msg, strlen(msg), 1, fp);
    }

    fclose(fp);

    return 0;
}

我们要进行文件操作，前提是我们的程序跑起来。文件的打开和关闭，是CPU在执行我们的代码。

以“w”的方式打开文件：

1、如果文件不存在，就在当前路径下，新建指定的文件；

2、默认打开文件的时候，就会先把目标文件清空。

echo "hello bite" > log.txt

(输出重定向)：

1、文件不存在，就新建文件；

2、打开文件，先清空，再写入

(追加重定向)：

不会清空文件，会在文件内容后面添加内容

"a"追加文件

#include <stdio.h>
int main()
{
    // 系统怎么知道当前创建的log.txt文件在这个路径下呢？
    // 因为我们在运行文件操作的时候，执行我们所写的代码，执行的时候，就已经变成了一个进程了，
    // 所以，我们建立log.txt文件时，默认会结合我们当前进程所在路径，拼上我们的log.txt，创建log.txt文件。
    // 我们进程在启动时，所处的路径，叫做当前进程的当前工作路径。
    FILE* fp = fopen("log.txt", "a");
    if (NULL == fp)
    {
        perror("fopen");
        return 1;
    }

    fprintf(fp, "helloworld, %d, %s, %lf\n", 10, "whb", 3.14);

    fclose(fp);
    return 0;
}

"r"读文件

#include <stdio.h>
#include <string.h>

int main()
{
    FILE* fp = fopen("myfile", "r");
    if (!fp) {
        printf("fopen error!\n");
    }

    char buf[1024];
    const char* msg = "hello bit!\n";
    while (1)
    {
        //注意返回值和参数，此处有坑，仔细查看man手册关于该函数的说明
        ssize_t s = fread(buf, 1, strlen(msg), fp);
        if (s > 0) {
            buf[s] = 0;
            printf("%s", buf);
        }
        if (feof(fp)) {
            break;
        }
    }

    fclose(fp);
    return 0;
}

输出信息到显示器，你有哪些方法

#include <stdio.h>
#include <string.h>

int main()
{
    const char* msg = "hello fwrite\n";
    fwrite(msg, strlen(msg), 1, stdout);

    printf("hello printf\n");
    fprintf(stdout, "hello fprintf\n");
    return 0;
}

int fprintf(FILE *stream,const char *format,...)
// 向显示器当中进行打印，把指定的内容按照指定的格式，写到特定的文件当中

stdin & stdout & stderr

C默认会打开三个输入输出流，分别是stdin(键盘), stdout(显示器), stderr(显示器)
仔细观察发现，这三个流的类型都是FILE*, fopen返回值类型，文件指针

文件操作详解

提炼一下对文件的理解(第一阶段)

打开文件：本质其实是进程(struct task_struct)打开文件(struct file)！！！

文件没有被打开的时候，在哪里？在磁盘当中。

进程能打开很多文件吗？可以。

系统当中可不可以存在很多进程呢？可以。

很多清空下，OS内部，一定存在大量的被打开的文件。

那么OS要不要把这些被打开的文件进行管理呢？答案是要的。先描述，再组织！所以每一个被打开的文件，在OS内部，一定要存在对应的描述文件属性的结构体。类似PCB。

每一个语言对文件的操作方法都是不一样的。

理解文件并采用系统调用接口来访问文件

a、操作文件，本质：进程在操作文件。进程的文件的关系。

b、文件 -> 磁盘 -> 外设 -> 硬件 -> 向文件中写入，本质是向硬件中写入 -> 用户没有权利直接在硬件内写入 -> OS是硬件的管理者 -> 通过OS写入 -> OS必须给我们提供系统调用接口(OS不相信任何人) -> 我们用的C／C++／...中操作文件的方法，都是对系统调用接口的封装！

操作文件，除了上述C接口（当然，C++也有接口，其他语言也有），我们还可以采用系统接口来进行文件访问，先来直接以代码的形式，实现和上面一模一样的代码：

 系统调用的文件操作
 man 2 open  2号手册，系统调用 open()函数：打开文件
 #include <sys/types.h>
 #include <sys/stat.h>
 #include <fcntl.h>
 
 int open(const char *pathname,int flags);  // 一般是操作已经存在的文件
 int open(const char *pathname,int flags,mode_t mode);
 第一个参数：打开的文件是谁，可以带路径，也可以直接写文件名；如果只有文件名，就在当前的路径下创建文件；
 第二个参数：想要怎么创建这个文件，flags是一个整数，但是flags可以传递很多标记位；
 第二个参数：flags是一个整数，是32个比特位。用比特位来进行标记位的传递。 ---- OS设计很多系统调用接口的常见方法  本质：位图
 第三个参数：文件的起始权限
 返回值：是一个整数，文件描述符；失败：返回-1，错误码被设置

 man 2 close
 #include <unistd.h>
 int close(int fd); 参数：open()函数返回的整数

 man 2 write  向文件当中写入
 #include <unistd.h>
 ssize_t write(int fd,const void *buf,size_t count);// 把指定的缓冲区写入指定的文件里
 第二个参数：指定一个缓冲区，缓冲区的起始地址
 第三个参数：缓冲区的大小

操作系统为每一个被打开的文件，都创建了内核数据结构(struct file)，用于文件的描述，包含了文件的属性;struct file内部中会包含了两个个指针，一个指针会指向我们在系统当中对应的一段与该文件所对应的，叫做文件内核级的缓存(其实就是OS给我们申请的一块内存)；另一个指针，指向的是操作底层方法的指针表(比如：一些硬件设备的操作方法)。

文件 = 属性 + 内容

属性初始化 struct file

文件内容写到缓存里：日后读、写就在缓存里进行，然后再把数据刷新到磁盘里。

所以，每一个文件都要有一个：文件内核级的缓存。
最终我们对OS内的文件的管理，转化成了对 struct file的内核数据结构的管理。
进程task_struct里有一个指针：struct files_struct *files，这个指针指向的是struct files_struct空间，空间里有一个指针数组(struct file *fd array[N])，这个指针数组中的每一个元素都是被打开文件的地址，而指针数组的下标是fd(文件描述符)。

操作系统只认文件描述符fd，只要拿到了fd就可以对文件进行操作。

无论读写，都必须在合适的时候，让OS把文件的内容读到文件缓存区中。write、read函数，本质都是在拷贝数据。

open()在干什么呢？

1、创建file；

2、开辟文件缓冲区的空间，加载文件数据(延后)；

3、查进程的文件描述符表；

4、file地址，填入对应的文件描述符表下标中；

5、返回下标。

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int main()
{
    const char* message = "hello Linux file!\n";
    // 可以直接向“1”里面打印内容，“1”就是标准输出流
    write(1, message, strlen(message));

    // C语言的方式向标准输出流里打印内容
    fprintf(stdout, "hello: %d\n", 10);// 第一个参数是stdout的话，和printf()函数的结果一样
    fflush(stdout);// 刷新数据

    // 0：标准输入(键盘)  1：标准输出(显示器)  2：标准输出(显示器) 
    // 0、1、2已经被占用了，所以open()函数的返回值从3开始
    int fda = open("loga.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fda: %d\n", fda);// 3
    int fdb = open("logb.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdb: %d\n", fdb);// 4
    int fdc = open("logc.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdc: %d\n", fdc);// 5
    int fdd = open("logd.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdd: %d\n", fdd);// 6

    umask(0);// 权限掩码设置为0  就近原则：有设置的掩码，就用设置的；没有，就用系统的
    // system call
    // O_WRONLY:以只写的方式打开    O：代表open的意思
    // O_CREAT：如果文件不存在，创建这个文件
    // O_TRUNC：清空文件内容
    // O_APPEND：打开文件，用追加模式
    // 0666：文件的起始权限，起始权限也会和umask权限掩码处理，所以，不一定是0666的权限
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);
    // open()系统调用接口，以写的方式打开，默认不清空文件内容，下次写入文件是以覆盖式的写入内容

    if(fd < 0)
    {
        perror("open");
        return 1;
    }

    const char *message = "hello Linux file!\n";
    //const char *message = "abcdefg\n";
    //const char *message = "123";
    write(fd, message, strlen(message));// C语言中有'\0'，而Linux中没有'\0'的规则

    close(fd);
    return 0;
}

O_RDONLY: 只读打开

O_WRONLY: 只写打开

O_RDWR : 读，写打开这三个常量，必须指定一个且只能指定一个

O_CREAT : 若文件不存在，则创建它。需要使用mode选项，来指明新文件的访问权限 O_APPEND: 追加写

怎么理解write(1, message, strlen(message))向一个整数里写，就相当于在一个文件里写呢？
文件描述符fd，fd的本质是：内核的进程和文件映射关系的数组的下标。

 man 2 umask  //2号手册的权限掩码

 #include <sys/types.h>
 #include <sys/stat.h>
 mode_t umask(mode_t mask);//在程序运行时，动态的设置权限的掩码

我们这样讲可能还会有些抽象，我们直接找到原码来看一下这些结构体之间的关系：

而现在知道，文件描述符就是从0开始的小整数。当我们打开文件时，操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用，所以必须让进程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组，每个元素都是一个指向打开文件的指针！所以，本质上，文件描述符就是该数组的下标。所以，只要拿着文件描述符，就可以找到对应的文件。

我们要对文件进行操作，我们可以用系统调用，也可以用语言提供的文件方法，但是最好还是用语言提供的文件方法。为什么呢？

因为系统不同，系统调用接口可能不一样，系统调用的方法不具有跨平台性。

语言为什么具有跨平台性？
比如：C语言文件的操作函数，底层都是用系统调用接口实现的，而不同的操作平台，系统调用接口可能不一样，就比如：C语言中的fopen()函数就使用不同的OS(windows、maxos、Linux)的系统调用接口实现fopen()函数，那么在编译的时候，不同的OS会生成不同的标准库，当然这些标准库，也都是C标准库，我们每再一个平台下，都需要下载对应平台的标准库，它们标准库中实现的函数都叫fopen()，所以C语言具有跨平台性。

我有一个显示器，但是可以有很多终端。

ls /lib64/libc.so 
//C语言的动态库(文件)

文件描述符的分配规则：在files_struct数组当中，找到当前没有被使用的最小的一个下标，作为新的文件描述符。

总结

好了，本篇博客到这里就结束了，如果有更好的观点，请及时留言，我会认真观看并学习。
不积硅步，无以至千里；不积小流，无以成江海。

标签： linux 运维服务器

本文转载自: https://blog.csdn.net/2301_79585944/article/details/137126647
版权归原作者 2301_79585944 所有，如有侵权，请联系我们删除。

【Linux】基础IO—1

前言

先来段代码回顾C文件接口

"w"写文件

"a"追加文件

"r"读文件

输出信息到显示器，你有哪些方法

stdin & stdout & stderr

提炼一下对文件的理解(第一阶段)

理解文件并采用系统调用接口来访问文件

总结

发表评论

“【Linux】基础IO—1”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航