说明

这是一个完善了但又不完善的笔记,或许以后会更新

可以参考但请务必超越

源文件


Tools

VS2019
VScode
Typora
PicGo

C语言文件操作

工作中文件操作其实很少。但是呢,不学感觉C语言也不完整。

1.为什么使用文件

之前有写过通讯录。

每一次打开通讯录的时候,我们输入信息。按下5就可以查看信息。

但是当我们退出又打开后,通讯录里的信息就没了。

想象如果我们用手机通讯录存下的信息,再打开就没了,那有什么意义,还不如脑子里记下。

那么有个问题,通讯录的数据,能不能也放在文件中,存储在磁盘上,使他持久化。

文件,把信息写在文件中。

注意,当我们写信息的时候,他是存放在内存里的,我们如果想永久保存,那就存在文件中。电脑关机重启后她也会一直保存着。

2.什么是文件

磁盘上的文件,就是文件。(废话)

在程序设置中,我们一般谈到的文件有两种:程序文件、数据文件。

程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

把我们之前写的程序文件写进数据文件中,从数据文件中读取我们所写的程序文件。

这篇文件讨论的就是数据文件。

在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。

其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。

文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。

文件名包含3部分:文件路径+文件名主干+文件后缀

例如: c:codetest.txt

其中c:code就是文件路径,test就是文件名主干,.txt是文件后缀。

为了方便起见,文件标识常被称为文件名

注意这里的文件后缀.txt。一般来说新装的win10系统他会默认隐藏文件扩展名。

作为一个程序猿,或者作为一个正常使用电脑工作学习的人,我们应当且应该养成良好习惯点开这个选项。

3.文件的打开和关闭

首先了解一下文件的读和写,以及文件指针。

读和写

其实就很简单,程序把内存中的数据输出到文件,就是写,反过来就是读。

文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。

每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.

在VS2013编译环境提供的stdio.h头文件中有以下文件类型声明:

struct _iobuf {
    char* _ptr;
    int   _cnt;
    char* _base;
    int   _flag;
    int   _file;
    int   _charbuf;
    int   _bufsiz;
    char* _tmpfname;
};
typedef struct _iobuf FILE;

在VS2019下FILE的封装更加深了。不好观察具体细节。

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。

每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。

一般都是通过一个FILE*的指针来维护这个FILE结构的变量,这样使用起来更加方便。

下面我们可以创建一个FILE*的指针变量:

FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。

比如:

操作文件的动作

1.打开文件

2.读/写文件

3.关闭文件

在打开文件的同时,会创建一个文件信息区。假设打开data.txt就会创建一个FILE的结构体,假设是f。他们就会强关联。

当我们操作的时候,每一个打开的文件都会创建一个和他强关联匹配的struct结构体变量,也就是文件信息区。然后返回这个文件信息区的起始地址。

文件的打开和关闭

那么,到底是如何打开关闭文件的呢。如何和FILE*指针关联呢。

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件

在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。

FILE * fopen ( const char * filename, const char * mode );//打开
int fclose ( FILE * stream );//关闭,把指针传给fclose就可以了。和free一样,还需要给指针赋值NULL,否则就会变成野指针。

打开方式如下:

文件使用方式含义如果指定文件不存在
r(只读)为了输入数据,打开一个已经存在的文本文件出错
w(只写)为了输出数据,打开一个文本文件建立一个新的文件
a(追加)向文本文件尾添加数据出错
rb(只读)为了输入数据,打开一个二进制文件出错
wb(只写)为了输出数据,打开一个二进制文件建立一个新的文件
ab(追加)向一个二进制文件尾添加数据出错
r+(读写)为了读和写,打开一个文本文件出错
w+(读写)为了读和写,建议一个新的文件建立一个新的文件
a+(读写)打开一个文件,在文件尾进行读写建立一个新的文件
rb+(读写)为了读和写打开一个二进制文件出错
wb+(读写)为了读和写,新建一个新的二进制文件建立一个新的文件
ab+(读写)打开一个二进制文件,在文件尾进行读和写建立一个新的文件

举个栗子

int main()
{    
    //1.打开文件
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        //如果打开文件失败,返回错误信息。
        return -1;
    }
    //2.顺序读写/随机读写
    //3.关闭文件
    fclose(pf);
    pf = NULL;
       return 0;
}

如果没有文件会返回错误信息

注意,文件的地址需要完整的绝对路径。

例如桌面:

FILE* pf = fopen("C:\\Users\\kirito\\Desktop\\data.txt", "r");//注意转义字符

新建一个文件

如果指定文件不存在,或者指定文件存在而且里面有内容。

这时如果使用w(只写)

FILE* pf = fopen("C:\\Users\\kirito\\Desktop\\data.txt", "w");

就会新建一个或者把原本的文件变成一个新的空文件。具体可以参看上上面的打开方式表格。

<video src="https://mywifeasuna-1302798233.cos.ap-shanghai.myqcloud.com/picgo/2021-10-02%2018-08-49.mp4";></video>

绝对路径和相对路径

绝对路径就很简单,像上面的桌面。

相对路径其实也很简单,如果什么都不写的话,就会在当前项目目录下去找。

4.文件的顺序读写

功能函数名适用于
字符输入函数fgetc所有输入流
字符输出函数fputc所有输出流
文本行输入函数fgets所有输入流
文本行输出函数fputs所有输出流
格式化输入函数fscanf所有输入流
格式化输出函数fprintf所有输出流
二进制输入fread文件
二进制输出fwrite文件

流是一种高度抽象的概念

我们可以把各种数据写到外部设备上,可是外部设备太多了,程序猿要如何管理上传呢。这时就抽象出来一种叫流的概念。程序猿只要关注流就可以了,只要考虑如何把数据放到流上就可以了。

C语言的程序

只要运行起来,就默认打开了3个流

标准输出流 - stdout

标准输入流 - stdin

标准错误流 - stderr

他们都是FILE*。

具体一点

int main()
{
    fputc('t', stdout);//stdout标准输出流就是屏幕嘛,fputc就等价于putchar printf("%c", ch);
    fputc('e', stdout);
    fputc('s', stdout);
    fputc('t', stdout);
    return 0;
}

这就是fputc适用于所有输出流的情况

那么fgetc在所有输入流的情况呢?

int main()
{
       int ch = fgetc(stdin);//stdin就是键盘输入,假设输入test,读3次。fgetc就等价于getchar scanf("%c", ch);
    printf("%c\n", ch);
    ch = fgetc(stdin);
    printf("%c\n", ch);
    ch = fgetc(stdin);
    printf("%c\n", ch);
    return 0;
}

可以看到输入了test读了3次就是tes

读写一个

写一个数据fputc,读一个数据fgetc

int fputc ( int character, FILE * stream );int fgetc ( FILE * stream );

int main()
{
    FILE* pf = fopen("data.txt", "w");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //写文件
    fputc('m', pf);
    fputc('y', pf);
    fputc('w', pf);
    fputc('i', pf);
    fputc('f', pf);
    fputc('e', pf);
    fputc('a', pf);
    fputc('s', pf);
    fputc('u', pf);
    fputc('n', pf);
    fputc('a', pf);
    fputc(' ', pf);
    fputc('t', pf);
    fputc('e', pf);
    fputc('s', pf);
    fputc('t', pf);
    //关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

注意!

printf这个函数,他是倒着打印的。所以我们需要使用一个变量来顺着打印。

int main()
{
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //读
    //printf("%c\n%c\n%c\n%c\n%c\n", fgetc(pf), fgetc(pf), fgetc(pf), fgetc(pf), fgetc(pf));
    //注意,printf是倒着打印的。我们需要使用一个变量来顺着打印
    int ch = fgetc(pf);
    printf("%c\n", ch);
    ch = fgetc(pf);
    printf("%c\n", ch);
    ch = fgetc(pf);
    printf("%c\n", ch);
    ch = fgetc(pf);
    printf("%c\n", ch);
    ch = fgetc(pf);
    printf("%c\n", ch);
    //关闭文件
    fclose(pf);
    pf = NULL; 
       return 0;
}

时刻注意,这个指针指向的是当前的位置

读写多个

fgets - 直接读一行

fputs - 直接写一行

char * fgets ( char * str, int num, FILE * stream );
int fputs ( const char * str, FILE * stream );

int main()
{
    FILE* pf = fopen("data.txt", "w");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //写一行数据
    fputs("mywifeasuna\n", pf);
    fputs("test\n", pf);
    //关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

int main()
{
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    char arr[20] = { 0 };//创建一个数组
    fgets(arr, 5, pf);//使用pf指针读取arr数组中的最多5个字符
    //实际上只读了4个,放了一个\0在末尾,因为设定最多就5个字符的空间
    printf("%s\n", arr);
    fgets(arr, 5, pf);
    printf("%s\n", arr);
    //关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

格式化读写

相对标printf和scanf,其实就是多了一个文件指针

fprintf - 格式化输出

fscanf - 格式化输入

int fprintf ( FILE * stream, const char * format, ... );
int fscanf ( FILE * stream, const char * format, ... );

struct S
{
    int n;
    double d;
};

int main()
{
       struct S s = { 100,3.14 };
    FILE* pf = fopen("data.txt", "w");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    fprintf(pf, "%d %lf", s.n, s.d);
    //指针,打印类型,打印内容
    //关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

可以看到把结构体中初始化的数据写了进去

相比较读就简单了

struct S
{
    int n;
    double d;
};

int main()
{
       struct S s = { 0 };
    //结构体现在没有数据
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    fscanf(pf, "%d %lf", &(s.n), &(s.d));
    //把文件中的数据读出来写到结构体中
    printf("%d %lf\n", s.n, s.d);
    //打印结构体看一下
    //关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

二进制读写

fread - 二进制输入

fwrite - 二进制输出

size_t fread ( void * ptr, size_t size, size_t count, FILE * stream );
size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );

前面直接写100,3.14。这次直接用二进制读写。

FILE * stream是流我们知道,前面3个参数都是什么呢?

void * ptr是指针指向要被写的数据

size_t size是一个数据元素的字节,大小

size_t count是写几个数据

struct S
{
    int n;
    double d;
    char name[10];
};

int main()
{
    struct S s = { 100,3.14,"kirito"};
    FILE* pf = fopen("data.txt", "wb");
    //注意是wb
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //写文件 - 二进制
    fwrite(&s, sizeof(s), 1, pf);
    //关闭文件
    fclose(pf);
    pf = NULL;
       return 0;
}

可以看一下结果

wtf?哦,因为是二进制的形式写进去,和文本的写法不一样。可以看到kirito是写进去的。

那么我们用二进制读就可以了。

struct S
{
    int n;
    double d;
    char name[10];
};

int main()
{
    struct S s = { 100,3.14,"kirito"};
    FILE* pf = fopen("data.txt", "rb");
    //注意是rb
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //读文件 - 二进制
    fread(&s, sizeof(struct S), 1, pf);
    //打印看看
    printf("%d %lf %s\n", s.n, s.d, s.name);
    //关闭文件
    fclose(pf);
    pf = NULL;
       return 0;
}

可以看到文本中的二进制信息使用二进制的形式读取就正常打印了

对比一组函数

scanf/fscanf/sscanf

printf/fprintf/sprintf

scanf - 从标准输入(键盘)读取格式化的数据

fscanf - 从所有的输入流读取格式化的数据

sscanf - 从字符串中提取出一个格式化的数据

int sscanf ( const char * s, const char * format, ...);

printf - 把格式化的数据到输出到标准输出流(屏幕)上

fprintf - 把格式化的数据输出到所有输出流(屏幕/文件)上

sprintf - 把一个格式化的数据转换成字符串

int sprintf ( char * str, const char * format, ... );

举个栗子

对于sscanf和sprintf

struct S
{
    int n;
    double d;
    char name[10];
};

int main()
{
    char arr[100] = { 0 };
    struct S tmp = { 0 };
    struct S s = { 100,3.14,"kirito"};
    //把一个格式化的数据转换成字符串
    sprintf(arr, "%d %lf %s", s.n, s.d, s.name);
    //打印
    printf("%s\n", arr);
    //从arr中的字符串中提取出一个格式化的数据
    sscanf(arr, "%d %lf %s", &(tmp.n), &(tmp.d), tmp.name);
    //打印
    printf("%d %lf %s\n", tmp.n, tmp.d, tmp.name);
    return 0;
}

上面这一行是以字符串的形式打印的

下面这一行是以格式化的形式打印的

5.文件的随机读写

fseek

int fseek ( FILE * stream, long int offset, int origin );

定位文件指针,偏移量,起始位置

ftell

long int ftell ( FILE * stream );

计算文件指针相对于起始位置的偏移量

rewind

void rewind ( FILE * stream );

让文件指针的位置回到文件的起始位置

举个栗子

随机读写要比顺序读写少一点内容,因为就直接随机就行了,当然还会涉及到偏移量。

int main()
{
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    //顺序读写
    //int ch = fgetc(pf);
    //printf("%c\n", ch);
    
    //随机读写
    //定位文件指针 - fseek
    /*如果第一次就要读取'c'*/
    fseek(pf, 2, SEEK_SET);
    int ch = fgetc(pf);
    printf("%c\n", ch);

    fseek(pf, -2, SEEK_CUR);
    ch = fgetc(pf);
    printf("%c\n", ch);
    //计算文件指针相对于起始位置的偏移量 - ftell
    int ret = ftell(pf);
    printf("%d\n", ret);
    
    //让文件指针的位置回到文件的起始位置 - rewind
    rewind(pf);
    ch = fgetc(pf);
    printf("%c\n", ch);
    
    //关闭文件
    fclose(pf);
    pf = NULL;
       return 0;
}

注意,读取完c后,指针停留在了d上,那么再次偏移-2读取,指针就移动到b了。读完了b,指针又停留在了c上,然后查看相对起始位置偏移量,把指针传给ftell就行了。自然就是2。最后把指针传给rewind,就返回了起始位置。

6.文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件。

一个数据在内存中是怎么存储的呢?

字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。

如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

举个栗子测试一下

就以10000为例,我们直接写到data.txt中。

int main()
{
    //1.打开文件
    FILE* pf = fopen("data.txt", "wb");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    int a = 10000;
    //2.以2进制的形式写文件
    fwrite(&a, 4, 1, pf);
    
    //3.关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

运行,可以看到10000已经写入了文件中,只不过是二进制看不懂。

那么,注意。此时我们可以使用VS无论哪个版本,将data.txt添加进源文件中,使用二进制编辑器打开。

注意,这时看到的内容,就是小端二进制形式存储下的10000

7.文件读取结束的判定

结束判定。

其实函数的文档中就有写,只不过是英文。

就比如fgetc,fgetc会返回一个int。另外:

当遇到错误读取失败,或者文件结束的时候,他会返回一个EOF。

int main()
{
    //1.打开文件
    FILE* pf = fopen("data.txt", "r");
    if (NULL == pf)
    {
        perror("fopen");
        return -1;
    }
    
    //2.读
    //int ch = fgetc(pf);
    //porintf("%c\n", ch);
    int ch = 0;
    while ((ch = fgetc(pf)) != EOF)
    {
        printf("%c ", ch);
    }
    
    //3.关闭文件
    fclose(pf);
    pf = NULL;
    return 0;
}

如果使用fgetc读取文件,可以判断fgetc的返回值是否是EOF,来判定文件是否读取结束!

其他的结束判定,以及遇到错误或者文件结束的返回值:

fgets - 返回空指针NULL

fread - 当返回值比设定值小,就肯定结束了

fscanf - 当读到失败的字段,就结束了

被错误使用的feof

牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。

而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。

这一点很重要!

  1. 文本文件读取是否结束,判断返回值是否为EOF (fgetc),或者NULL(fgets)

例如:

fgetc判断是否为EOF.

fgets判断返回值是否为NULL.

  1. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。

例如:

fread判断返回值是否小于实际要读的个数。

举个栗子(文本文件的例子:

int main()
{
    int c; 
    // 注意:int,非char,要求处理EOF
    FILE* fp = fopen("test.txt", "r");
    if (!fp) 
    {
        perror("File opening failed");
        return EXIT_FAILURE;
    }
    //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
    while ((c = fgetc(fp)) != EOF)
    // 标准C I/O读取文件循环
    {
        putchar(c);
    }
    //判断是什么原因结束的
    if (ferror(fp))
    {
        puts("I/O error when reading");
    }
    else if (feof(fp))
    {
        puts("End of file reached successfully");
    }
    
    fclose(fp);
    return 0;
}
  • feof的用途:是文件读取结束了,判断是不是遇到文件末尾而结束的。
  • ferror的用途:文件读取结束了,判断是不是遇到错误后读取结束的。

8.文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。

什么意思呢?

我们以通讯录来说明:

我们通讯中1000个人的信息,先会放到内存的输出缓冲区中。充满后就会写入到硬盘中。

反过来也一样,先读进内存的输入缓冲区中,再读进程序里。

之前有学过getchar和scanf。键盘输入内容,先放到输入缓冲区,他们也都是先从输入缓冲区中拿取数据。

为什么要这样做呢?

假设问老师问题,没有几分钟你就问一次,肯定是不如攒够了问题直接问完的好。

举个栗子验证一下

int main()
{
    FILE* pf = fopen("test.txt", "w");
    fputs("abcdef", pf);//先将代码放在输出缓冲区
    printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
    Sleep(10000);
    printf("刷新缓冲区\n");
    fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
    //注:fflush在高版本的vs上不能使用了 - 虽然不知道为什么vs2019还能用
    printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
    Sleep(10000);
    fclose(pf);
    //注:fclose在关闭文件的时候,也会刷新缓冲区
    pf = NULL;
    return 0;
}

小头图版权:《香菱》by QuAn_ 2021年10月5日凌晨1点07分 pid:93233124

广告位招租
最后修改:2021 年 10 月 06 日 06 : 39 PM
如果觉得我的文章对你有用,请喂饱我!(理直气壮)