0


【Linux】基础IO—1

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

世上有两种耀眼的光芒,一种是正在升起的太阳,一种是正在努力学习编程的你!一个爱学编程的人。各位看官,我衷心的希望这篇博客能对你们有所帮助,同时也希望各位看官能对我的文章给与点评,希望我们能够携手共同促进进步,在编程的道路上越走越远!

提示:以下是本篇文章正文内容,下面案例可供参考

先来段代码回顾C文件接口

"w"写文件

#include <stdio.h>
#include <string.h>

int main()
{
    FILE* fp = fopen("myfile", "w");
    if (!fp) {
        printf("fopen error!\n");
    }

    const char* msg = "hello bit!\n";
    int count = 5;
    while (count--) {
        fwrite(msg, strlen(msg), 1, fp);
    }

    fclose(fp);

    return 0;
}

我们要进行文件操作,前提是我们的程序跑起来。文件的打开和关闭,是CPU在执行我们的代码。

以“w”的方式打开文件:

1、如果文件不存在,就在当前路径下,新建指定的文件;

2、默认打开文件的时候,就会先把目标文件清空。

echo "hello bite" > log.txt

(输出重定向):

1、文件不存在,就新建文件;

2、打开文件,先清空,再写入

(追加重定向):

不会清空文件,会在文件内容后面添加内容

"a"追加文件

#include <stdio.h>
int main()
{
    // 系统怎么知道当前创建的log.txt文件在这个路径下呢?
    // 因为我们在运行文件操作的时候,执行我们所写的代码,执行的时候,就已经变成了一个进程了,
    // 所以,我们建立log.txt文件时,默认会结合我们当前进程所在路径,拼上我们的log.txt,创建log.txt文件。
    // 我们进程在启动时,所处的路径,叫做当前进程的当前工作路径。
    FILE* fp = fopen("log.txt", "a");
    if (NULL == fp)
    {
        perror("fopen");
        return 1;
    }

    fprintf(fp, "helloworld, %d, %s, %lf\n", 10, "whb", 3.14);

    fclose(fp);
    return 0;
}

"r"读文件

#include <stdio.h>
#include <string.h>

int main()
{
    FILE* fp = fopen("myfile", "r");
    if (!fp) {
        printf("fopen error!\n");
    }

    char buf[1024];
    const char* msg = "hello bit!\n";
    while (1)
    {
        //注意返回值和参数,此处有坑,仔细查看man手册关于该函数的说明
        ssize_t s = fread(buf, 1, strlen(msg), fp);
        if (s > 0) {
            buf[s] = 0;
            printf("%s", buf);
        }
        if (feof(fp)) {
            break;
        }
    }

    fclose(fp);
    return 0;
}

输出信息到显示器,你有哪些方法

#include <stdio.h>
#include <string.h>

int main()
{
    const char* msg = "hello fwrite\n";
    fwrite(msg, strlen(msg), 1, stdout);

    printf("hello printf\n");
    fprintf(stdout, "hello fprintf\n");
    return 0;
}
int fprintf(FILE *stream,const char *format,...)
// 向显示器当中进行打印,把指定的内容按照指定的格式,写到特定的文件当中

stdin & stdout & stderr

  • C默认会打开三个输入输出流,分别是stdin(键盘), stdout(显示器), stderr(显示器)
  • 仔细观察发现,这三个流的类型都是FILE*, fopen返回值类型,文件指针

文件操作详解

提炼一下对文件的理解(第一阶段)

打开文件:本质其实是进程(struct task_struct)打开文件(struct file)!!!

文件没有被打开的时候,在哪里?在磁盘当中。

进程能打开很多文件吗?可以。

系统当中可不可以存在很多进程呢?可以。

很多清空下,OS内部,一定存在大量的被打开的文件。

那么OS要不要把这些被打开的文件进行管理呢?答案是要的。先描述,再组织!所以每一个被打开的文件,在OS内部,一定要存在对应的描述文件属性的结构体。类似PCB。

每一个语言对文件的操作方法都是不一样的。

理解文件并采用系统调用接口来访问文件

a、操作文件,本质:进程在操作文件。进程的文件的关系。

b、文件 -> 磁盘 -> 外设 -> 硬件 -> 向文件中写入,本质是向硬件中写入 -> 用户没有权利直接在硬件内写入 -> OS是硬件的管理者 -> 通过OS写入 -> OS必须给我们提供系统调用接口(OS不相信任何人) -> 我们用的C/C++/...中操作文件的方法,都是对系统调用接口的封装!

操作文件,除了上述C接口(当然,C++也有接口,其他语言也有),我们还可以采用系统接口来进行文件访问, 先来直接以代码的形式,实现和上面一模一样的代码:

 系统调用的文件操作
 man 2 open  2号手册,系统调用 open()函数:打开文件
 #include <sys/types.h>
 #include <sys/stat.h>
 #include <fcntl.h>
 
 int open(const char *pathname,int flags);  // 一般是操作已经存在的文件
 int open(const char *pathname,int flags,mode_t mode);
 第一个参数:打开的文件是谁,可以带路径,也可以直接写文件名;如果只有文件名,就在当前的路径下创建文件;
 第二个参数:想要怎么创建这个文件,flags是一个整数,但是flags可以传递很多标记位;
 第二个参数:flags是一个整数,是32个比特位。用比特位来进行标记位的传递。 ---- OS设计很多系统调用接口的常见方法  本质:位图
 第三个参数:文件的起始权限
 返回值:是一个整数,文件描述符;失败:返回-1,错误码被设置
 man 2 close
 #include <unistd.h>
 int close(int fd); 参数:open()函数返回的整数
 man 2 write  向文件当中写入
 #include <unistd.h>
 ssize_t write(int fd,const void *buf,size_t count);// 把指定的缓冲区写入指定的文件里
 第二个参数:指定一个缓冲区,缓冲区的起始地址
 第三个参数:缓冲区的大小

操作系统为每一个被打开的文件,都创建了内核数据结构(struct file),用于文件的描述,包含了文件的属性;struct file内部中会包含了两个个指针,一个指针会指向我们在系统当中对应的一段与该文件所对应的,叫做文件内核级的缓存(其实就是OS给我们申请的一块内存);另一个指针,指向的是操作底层方法的指针表(比如:一些硬件设备的操作方法)。

文件 = 属性 + 内容

  • 属性初始化 struct file
  • 文件内容写到缓存里:日后读、写就在缓存里进行,然后再把数据刷新到磁盘里。

所以,每一个文件都要有一个:文件内核级的缓存
最终我们对OS内的文件的管理,转化成了对 struct file的内核数据结构的管理。
进程task_struct里有一个指针:struct files_struct *files,这个指针指向的是struct files_struct空间,空间里有一个指针数组(struct file *fd array[N]),这个指针数组中的每一个元素都是被打开文件的地址,而指针数组的下标是fd(文件描述符)。

操作系统只认文件描述符fd,只要拿到了fd就可以对文件进行操作。

无论读写,都必须在合适的时候,让OS把文件的内容读到文件缓存区中。write、read函数,本质都是在拷贝数据。

open()在干什么呢?

1、创建file;

2、开辟文件缓冲区的空间,加载文件数据(延后);

3、查进程的文件描述符表;

4、file地址,填入对应的文件描述符表下标中;

5、返回下标。

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int main()
{
    const char* message = "hello Linux file!\n";
    // 可以直接向“1”里面打印内容,“1”就是标准输出流
    write(1, message, strlen(message));

    // C语言的方式向标准输出流里打印内容
    fprintf(stdout, "hello: %d\n", 10);// 第一个参数是stdout的话,和printf()函数的结果一样
    fflush(stdout);// 刷新数据

    // 0:标准输入(键盘)  1:标准输出(显示器)  2:标准输出(显示器) 
    // 0、1、2已经被占用了,所以open()函数的返回值从3开始
    int fda = open("loga.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fda: %d\n", fda);// 3
    int fdb = open("logb.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdb: %d\n", fdb);// 4
    int fdc = open("logc.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdc: %d\n", fdc);// 5
    int fdd = open("logd.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fdd: %d\n", fdd);// 6

    umask(0);// 权限掩码设置为0  就近原则:有设置的掩码,就用设置的;没有,就用系统的
    // system call
    // O_WRONLY:以只写的方式打开    O:代表open的意思
    // O_CREAT:如果文件不存在,创建这个文件
    // O_TRUNC:清空文件内容
    // O_APPEND:打开文件,用追加模式
    // 0666:文件的起始权限,起始权限也会和umask权限掩码处理,所以,不一定是0666的权限
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);
    // open()系统调用接口,以写的方式打开,默认不清空文件内容,下次写入文件是以覆盖式的写入内容

    if(fd < 0)
    {
        perror("open");
        return 1;
    }

    const char *message = "hello Linux file!\n";
    //const char *message = "abcdefg\n";
    //const char *message = "123";
    write(fd, message, strlen(message));// C语言中有'\0',而Linux中没有'\0'的规则

    close(fd);
    return 0;
}

O_RDONLY: 只读打开

O_WRONLY: 只写打开

O_RDWR : 读,写打开 这三个常量,必须指定一个且只能指定一个

O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限 O_APPEND: 追加写

怎么理解write(1, message, strlen(message))向一个整数里写,就相当于在一个文件里写呢?
文件描述符fd,fd的本质是:内核的进程和文件映射关系的数组的下标。

 man 2 umask  //2号手册的权限掩码

 #include <sys/types.h>
 #include <sys/stat.h>
 mode_t umask(mode_t mask);//在程序运行时,动态的设置权限的掩码

我们这样讲可能还会有些抽象,我们直接找到原码来看一下这些结构体之间的关系:

而现在知道,文件描述符就是从0开始的小整数。当我们打开文件时,操作系统在内存中要创建相应的数据结构来 描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进 程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数 组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。所以,只要拿着文件 描述符,就可以找到对应的文件。

我们要对文件进行操作,我们可以用系统调用,也可以用语言提供的文件方法,但是最好还是用语言提供的文件方法。为什么呢?

因为系统不同,系统调用接口可能不一样,系统调用的方法不具有跨平台性。

语言为什么具有跨平台性?
比如:C语言文件的操作函数,底层都是用系统调用接口实现的,而不同的操作平台,系统调用接口可能不一样,就比如:C语言中的fopen()函数就使用不同的OS(windows、maxos、Linux)的系统调用接口实现fopen()函数,那么在编译的时候,不同的OS会生成不同的标准库,当然这些标准库,也都是C标准库,我们每再一个平台下,都需要下载对应平台的标准库,它们标准库中实现的函数都叫fopen(),所以C语言具有跨平台性。

我有一个显示器,但是可以有很多终端。

ls /lib64/libc.so 
//C语言的动态库(文件)

文件描述符的分配规则:在files_struct数组当中,找到当前没有被使用的 最小的一个下标,作为新的文件描述符。


总结

好了,本篇博客到这里就结束了,如果有更好的观点,请及时留言,我会认真观看并学习。
不积硅步,无以至千里;不积小流,无以成江海。

标签: linux 运维 服务器

本文转载自: https://blog.csdn.net/2301_79585944/article/details/137126647
版权归原作者 2301_79585944 所有, 如有侵权,请联系我们删除。

“【Linux】基础IO—1”的评论:

还没有评论