当前位置: 首页 > article >正文

笔记四:C语言中的文件和文件操作

Faye:只要有正确的伴奏,什么都能变成好旋律。

                                                                                        ---------《寻找天堂》

目录

一、文件介绍

        1.1程序文件

       1.2 数据文件

       1.3 文件名

二、文件的打开和关闭

2.1 文件指针

2.2.文件的打开和关闭

2.3 文件读取结束的判定

三、 文件的顺序读写

 3.1 顺序读写函数介绍

四、文件的随机读写

        4.1  fseek

        whence表示偏移量的基准位置

        4.2  ftell

         4.3 rewind

 五、文本文件和二进制文件


一、文件介绍

        首先,外面先来了解什么是文件,如下是文件的定义:

        磁盘上的文件是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。             

        1.1程序文件

        包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境 后缀为.exe)。

       1.2 数据文件

       文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

        本文讨论的是数据文件。有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。

       1.3 文件名

        一个文件要有一个唯一的文件标识,以便用户识别和引用。 文件名包含3部分:文件路径+文件名主干+文件后缀,例如: c:\code\test.txt

         为了方便起见,文件标识常被称为文件名

二、文件的打开和关闭

2.1 文件指针

        缓冲文件系统中,关键的概念是“ 文件类型指针 ,简称 文件指针
        ANSIC 标准采用 缓冲文件系统 处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块“ 文件缓冲区 。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根 据C 编译系统决定的。
        每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统 声明的,取名FILE.
        例如,VS2013 编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf {char *_ptr;int   _cnt;char *_base;int   _flag;int   _file;int   _charbuf;int   _bufsiz;char *_tmpfname;};
typedef struct _iobuf FILE;
        不同的C 编译器的 FILE 类型包含的内容不完全相同,但是大同小异。 每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE 结构的变量,并填充其中的信息, 使用者不必关心细节。 一般都是通过一个FILE 的指针来维护这个 FILE 结构的变量,这样使用起来更加方便。
        下面我们可以创建一个FILE* 的指针变量
FILE* pf;//文件指针变量
        定义pf 是一个指向 FILE 类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联 的文件
        比如:

2.2.文件的打开和关闭

        文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。 在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。 ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。

        打开方式如下:

//打开文件
FILE * fopen ( const char * filename, const char * mode );
//关闭文件
int fclose ( FILE * stream );

        下面是各种文件的打开方式列表:

  文件使用式
含义
如果指定文件不存在
“r” (只读)
为了输入数据,打开一个已经存在的文本文件
出错
“w” (只写)
为了输出数据,打开一个文本文件
建立一个新的文件
“a” (追加)
向文本文件尾添加数据
建立一个新的文件
“rb” (只读)
为了输入数据,打开一个二进制文件
出错
“wb” (只写)
为了输出数据,打开一个二进制文件
建立一个新的文件
“ab” (追加)
向一个二进制文件尾添加数据
建立一个新的文件
“r+” (读写)
为了读和写,打开一个文本文件
出错
“w+” (读写)
为了读和写,建议一个新的文件
建立一个新的文件
“a+” (读写)
打开一个文件,在文件尾进行读写
建立一个新的文件
“rb+” (读写)
为了读和写打开一个二进制文件
出错
“wb+” (读写)
为了读和写,新建一个新的二进制文件
建立一个新的文件
“ab+” (读写)
打开一个二进制文件,在文件尾进行读和写
建立一个新的文件

        通过下面一个例子演示一下:

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>int main() {FILE* pf = fopen("data4.txt","r");  //以只读的方式打开data.txtif (pf == NULL) {perror("fopen");  //若文件不存在则打印错误信息,退出return 1 ;}fclose(pf);  //打开文件,完成操作后,关闭文件pf = NULL;  //使用完后释放文件指针,避免野指针return 0;
}

        在当前文件夹下不存在data4.txt 文本文件,所以会执行if语句,打印错误信息,运行结果如下:

2.3 文件读取结束的判定

        在文件读取过程中,不能用feof 函数的返回值直接来判断文件的是否结束。
         feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾结束。
1. 文本文件读取是否结束,判断返回值是否为 EOF fgetc ),或者 NULL fgets ) 例如:
  •         fgetc 判断是否为 EOF .
  •         fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。 例如:
  • fread判断返回值是否小于实际要读的个数。

三、 文件的顺序读写

 3.1 顺序读写函数介绍

功能
函数名
适用于
字符输入函数
fgetc
所有输入流
字符输出函数
fputc
所有输入流
文本行输入函数
fgets
所有输入流
文本行输出函数
fputs
所有输入流
格式化输入函数
fscanf
所有输入流
格式化输出函数
fprintf
所有输入流
二进制输入
fread
文件
二进制输出
fwrite
文件

         这里介绍流的概念:
流:
        我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
        一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。

标准流:
        那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢 ?
        因为C语言程序在启动的时候,默认打开了3个流 :
stdin - 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。
stdout - 标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
stderr - 标准错误流,大多数环境中输出到显示器界面。
        这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。stdin、stdout、stderr 三个流的类型是 : FILE * ,通常称为文件指针。C语言中,就是通过 FILE * 的文件指针来维护流的各种操作的。

         下面通过三个示例,练习部分的顺序写入文件、顺序读取文件

 示例1:顺序写入文件
int main() {//打开文件FILE*pf=fopen("data1.txt", "w");  //以只写的方式打开data1.txt.txt,如果文件不存在则创建新的文件if (pf == NULL) {perror("fopen");return 1;}//顺序写入字符fputc('h', pf);fputc('e', pf);fputc('l', pf);fputc('l', pf);fputc('o', pf);fputc('w', pf);fputc('\n', pf);//关闭文件fclose(pf);pf = NULL;return 0;
}

        此时文件夹中不存在data1.txt,会创建一个新的文件,并向里面写入“hello",运行结果如下:

         下面是另外一个例子:

//示例2:顺序读取文件
int main() {//打开文件FILE*pf=fopen("data1.txt", "r");if (pf == NULL) {perror("fopen");return 1;}//..读取入文件   //fgetc函数声明: int fgetc(FILE*steam);char ch;while ((ch = fgetc(pf)) != EOF) {printf("%c\n", ch);}//关闭文件fclose(pf);pf = NULL;return 0;
}

         此时文件夹中存在data1.txt,读取里面的“hello"并进行打印,运行结果如下:

        示例三:

//示例三:行写入/读取
int main() {FILE* pf = fopen("data2.txt", "w");if (pf == NULL) {perror("fopen");return 1;}//写入一行,,不会自动换行,需手动加入fputs("abcdef\n", pf);fputs("abcdef\n", pf);fputs("abcdef\n", pf);//键盘输入fgets(arr, 10, stdin); //stdin(标准输入流)是一个默认打开的数据流,用于从键盘接收输入fputs(arr, stdout);   //stdout(标准输出流)是一个默认打开的数据流,用于将数据输出到屏幕上fclose(pf);pf = NULL;return 0;
}

四、文件的随机读写

        4.1  fseek

         根据文件指针的位置和偏移量来定位文件指针

int fseek ( FILE *stream, long offset, int whence );

        stream表示文件指针,offset表示文件指针的偏移量,whence表示偏移量的基准位置。 

        whence表示偏移量的基准位置
  • 当whence为SEEK_SET时,offset表示距离文件开头的偏移量;
  • 当whence为SEEK_CUR时,offset表示距离文件当前位置的偏移量;
  • 当whence为SEEK_END时,offset表示距离文件末尾的偏移量。
/* fseek example */
#include <stdio.h>
int main()
{FILE* pFile;pFile = fopen("example.txt", "wb");fputs("This is an apple.", pFile);fseek(pFile, 9, SEEK_SET);   //这里文件指针的位置为起始位置fputs(" sam", pFile);fclose(pFile);return 0;
}

        4.2  ftell

返回文件指针相对于起始位置的偏移量

 long int ftell ( FILE * stream );

/* ftell example : getting size of a file */
#include <stdio.h>
int main()
{FILE* pFile;long size;pFile = fopen("data1.txt", "rb");if (pFile == NULL) perror("Error opening file");else{fseek(pFile, 0, SEEK_END); //光标定位到文件末尾size = ftell(pFile);//计算文件字符个数fclose(pFile);printf("Size of myfile.txt: %ld bytes.\n", size);}return 0;
}

         4.3 rewind

让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );
/* rewind example */
#include <stdio.h>
int main()
{int n;FILE* pFile;char buffer[27];pFile = fopen("myfile.txt", "w+");for (n = 'A'; n <= 'Z'; n++)fputc(n, pFile);          //往myfile.txt 写入A~Zrewind(pFile);                //让文件指针的位置回到文件的起始位置fread(buffer, 1, 26, pFile);  //将读入的数据写入bufferfclose(pFile);		//关闭文件buffer[26] = '\0';puts(buffer);      //打印return 0;
}

 五、文本文件和二进制文件

        根据数据的组织形式,数据文件被称为文本文件 或者 二进制文件
        数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件
        如果要求在外存上以ASCII 码的形式存储,则需要在存储前转换。以 ASCII 字符的形式存储的文件就是 本文件 。 一个数据在内存中是怎么存储的呢?
        字符一律以ASCII 形式存储,数值型数据既可以用 ASCII 形式存储,也可以使用二进制形式存储。 如有整数10000 ,如果以 ASCII 码的形式输出到磁盘,则磁盘中占用 5 个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4 个字节
#include <stdio.h>
int main()
{int a = 10000;FILE* pf = fopen("test.txt", "wb");fwrite(&a, 4, 1, pf);//二进制的形式写到文件中fclose(pf);pf = NULL;return 0;
}

       如何将文件以二进制的形式显示:

相关文章:

笔记四:C语言中的文件和文件操作

Faye&#xff1a;只要有正确的伴奏&#xff0c;什么都能变成好旋律。 ---------《寻找天堂》 目录 一、文件介绍 1.1程序文件 1.2 数据文件 1.3 文件名 二、文件的打开和关闭 2.1 文件指针 2.2.文件的打开和关闭 2.3 文件读取结束的判定 三、 文件的顺序读写 3.1 顺序读写…...

Zabbix+Deepseek实现AI告警分析(非本地部署大模型版)

目录 前言技术架构DeepSeek API获取1. 注册账号2. 申请API-Key Zabbix告警AI分析 实现1. 创建Scripts2. Scripts关键参数说明3. 需要注意 测试参考链接 前言 最近手伤了&#xff0c;更新频率下降…… 近期在Zabbix社区看到了一篇文章&#xff1a;张世宏老师分享的《Zabbix告警分…...

基于Celery+Supervisord的异步任务管理方案

一、架构设计背景 1.1 需求场景分析 在Web应用中&#xff0c;当遇到以下场景时需要异步任务处理方案&#xff1a; 高延迟操作&#xff08;大文件解析/邮件发送/复杂计算&#xff09;请求响应解耦&#xff08;客户端快速响应&#xff09;任务队列管理&#xff08;任务优先级/…...

国产NAS系统飞牛云fnOS深度体验:从运维面板到博客生态全打通

文章目录 前言1. 飞牛云本地部署1Panel2. 1Panel功能介绍3. 公网访问1Panel控制面板4. 固定1Panel公网地址5. 1Panel搭建Halo博客6. 公网访问Halo个人博客 前言 嘿&#xff0c;小伙伴们&#xff01;是不是厌倦了服务器管理的繁琐和搭建个人网站的复杂&#xff1f;今天就来一场…...

使用QT + 文件IO + 鼠标拖拽事件 + 线程 ,实现大文件的传输

第一题、使用qss&#xff0c;通过线程&#xff0c;使进度条自己动起来 mythread.h #ifndef MYTHREAD_H #define MYTHREAD_H#include <QObject> #include <QThread> #include <QDebug>class mythread : public QThread {Q_OBJECT public:mythread(QObject* …...

【LeetCode 热题 100】438. 找到字符串中所有字母异位词 | python 【中等】

继续学&#xff01;嗨起来&#xff01;&#xff01;&#xff01;&#xff08;正确率已经下30%了&#xff0c;我在干什么&#xff09; 题目&#xff1a; 438. 找到字符串中所有字母异位词 给定两个字符串 s 和 p&#xff0c;找到 s 中所有 p 的子串&#xff0c;返回这些子串的…...

博查搜索API日调用量突破3000万次,达到Bing API的1/3。

根据第三方机构统计&#xff0c;2024年Bing Search API 全球日均调用量为1.1亿次。截至2025年3月&#xff0c;博查 Search API日均调用量已达到3000万次&#xff08;约为Bing的1/3&#xff09;&#xff0c;承接着国内AI应用60%的联网搜索请求。...

【蓝桥杯集训·每日一题2025】 AcWing 5539. 牛奶交换 python

AcWing 5539. 牛奶交换 Week 3 3月6日 题目描述 农夫约翰的 N N N 头奶牛排成一圈&#xff0c;使得对于 1 , 2 , … , N − 1 1,2,…,N−1 1,2,…,N−1 中的每个 i i i&#xff0c;奶牛 i i i 右边的奶牛是奶牛 i 1 i1 i1&#xff0c;而奶牛 N N N 右边的奶牛是奶牛 …...

[内网安全] Windows 本地认证 — NTLM 哈希和 LM 哈希

关注这个专栏的其他相关笔记&#xff1a;[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01&#xff1a;SAM 文件 & Windows 本地认证流程 0x0101&#xff1a;SAM 文件简介 Windows 本地账户的登录密码是存储在系统本地的 SAM 文件中的&#xff0c;在登录 Windows 的时候&am…...

输电线路杆塔倾斜智能监测:守护电网安全的智慧之眼

​ ​2023年夏&#xff0c;某超高压输电线路突发倒塔事故&#xff0c;导致三省市大面积停电&#xff0c;直接经济损失超2.3亿元。事后调查显示&#xff0c;杆塔倾斜角度早已超出安全阈值&#xff0c;但传统巡检未能及时发现。这个刺痛行业的案例&#xff0c;揭开了电力设施监…...

FastGPT 引申:奥运选手知识图谱构建与混合检索应用

目录 FastGPT 引申&#xff1a;奥运选手知识图谱构建与混合检索应用第一部分&#xff1a;数据构建流程1. 数据抽取与预处理2. 向量化处理3. 知识图谱构建4. 数据持久化 第二部分&#xff1a;混合检索应用1. 用户查询处理2. 混合检索技术细节3. 返回结果示例4. 性能指标 FastGPT…...

GitHub CI流水线

GitHub CI流水线 build.yml 路径&#xff1a;.github/workflows/build.yml name: Docker Image CIon:workflow_dispatch:jobs:build:runs-on: ubuntu-lateststeps:- uses: actions/checkoutv4- name: Set up JDK 8uses: actions/setup-javav4with:java-version: 8distributi…...

探索.NET 10 的新特性,开发效率再升级!

前言 最近&#xff0c;.NET 10 发布啦&#xff0c;作为长期支持&#xff08;LTS&#xff09;版本&#xff0c;接下来的 3 年里它会给开发者们稳稳的幸福。今天咱就来唠唠它都带来了哪些超实用的新特性。可在指定链接下载。 新特性 下面将介绍了.NET 10的新特性&#xff0c;其…...

算法·搜索

搜索问题 搜索问题本质也是暴力枚举&#xff0c;一般想到暴力也要想到利用回溯枚举。 排序和组合问题 回溯法 去重问题&#xff1a;定义全局变量visited还是局部变量visited实现去重&#xff1f; 回溯问题 图论中的搜索问题 与一般的搜索问题一致&#xff0c;只不过要多…...

【图像处理与OpenCV:技术栈、应用和实现】

引言 图像处理作为计算机视觉领域的重要分支&#xff0c;在各个行业中扮演着越来越重要的角色。从医疗诊断、自动驾驶、安防监控到人工智能领域的图像识别&#xff0c;图像处理无处不在。随着计算机硬件性能的提升和深度学习的快速发展&#xff0c;图像处理技术也在不断演进&a…...

《水利水电安全员考试各题型对比分析及应对攻略》

《水利水电安全员考试各题型对比分析及应对攻略》 单选题&#xff1a; 特点&#xff1a;四个选项中只有一个正确答案&#xff0c;相对难度较小。主要考查对基础知识的掌握程度。 应对攻略&#xff1a;认真审题&#xff0c;看清题目要求。对于熟悉的知识点&#xff0c;直接选择…...

鸿蒙HarmonyOS-Navagation基本用法

Navagation基本用法 Navigation组件是路由导航的根视图容器&#xff0c;一般作为Page页面的根容器使用&#xff0c;其内部默认包含了标题栏&#xff0c;内容栏和公工具栏&#xff0c;其中内容区默认首页显示导航内容&#xff08;Navigation的子组件&#xff09;或非首页显示&am…...

第16章 直接定址表

目录 16.1 描述了单元长度的标号16.2 在其它段中使用数据标号16.3 直接定址表16.4 程序入口地址的直接定址表实验16 编写包含多个功能子程序的中断例程 16.1 描述了单元长度的标号 assume cs:code code segment a db 1,2,3,4,5,6,7,8 b dw 0 start: mov si,0      mov cx…...

【AI深度学习网络】卷积神经网络(CNN)入门指南:从生物启发的原理到现代架构演进

深度神经网络系列文章 【AI深度学习网络】卷积神经网络&#xff08;CNN&#xff09;入门指南&#xff1a;从生物启发的原理到现代架构演进【AI实践】基于TensorFlow/Keras的CNN&#xff08;卷积神经网络&#xff09;简单实现&#xff1a;手写数字识别的工程实践 引言 在当今…...

江科大51单片机笔记【10】蜂鸣器播放提示器音乐(下)

一、蜂鸣器播放提示器 这里我们要用Key&#xff0c;Delay&#xff0c;Nixie模块 并且把Nixie.c函数里的这两句注释&#xff0c;因为之前是动态显示&#xff0c;延时后马上清零&#xff0c;现在是静态显示&#xff0c;所以需要把他注释掉 // Delay(1); // P00x00; 先验…...

Milvus JSON数据存储优化方案

无论是json数据还是string/varchar 类型数据,其长度都不能超过65536,这是根本,不像ES的text类型数据一样,可以无限长。 总结 数据类型适用场景最大长度STRINGMilvus <2.2.x 的短文本(<65KB)隐式 ≈65,535 字节VARCHAR(N)Milvus ≥2.2.x 的文本显式 N≤65,535 字符…...

MySQL 数据库连接池爆满问题排查与解决

目录 MySQL 数据库连接池爆满问题排查与解决 一、问题影响 二、问题确认 三、收集信息 四、SQL 语句分析 五、应用层代码分析 六、连接池配置检查 七、监控工具使用 八、案例分析 在实际的应用开发中&#xff0c;我们可能会遇到 MySQL 数据库连接池爆满的情况。这种情…...

PyTorch深度学习的梯度消失和梯度爆炸的识别、解决和最佳实践

通过结合梯度监控、网络架构改进和优化策略&#xff0c;可以有效应对梯度消失/爆炸问题。建议在模型开发初期就加入梯度监控机制&#xff0c;这有助于快速定位问题层。对于超深网络&#xff08;>50层&#xff09;&#xff0c;建议优先考虑使用预激活残差结构&#xff08;Res…...

Nginx1.19.2不适配OPENSSL3.0问题

Nginx 1.19.2 是较老的版本&#xff0c;而 Nginx 1.21 版本已经适配 OpenSSL 3.0&#xff0c;所以建议 升级 Nginx 到 1.25.0 或更高版本&#xff1a; wget http://nginx.org/download/nginx-1.25.0.tar.gz tar -xzf nginx-1.25.0.tar.gz cd nginx-1.25.0 ./configure --prefix…...

蓝桥杯 Excel地址

Excel地址 题目描述 Excel 单元格的地址表示很有趣&#xff0c;它使用字母来表示列号。 比如&#xff0c; A 表示第 1 列&#xff0c; B 表示第 2 列&#xff0c; Z 表示第 26 列&#xff0c; AA 表示第 27 列&#xff0c; AB 表示第 28 列&#xff0c; BA 表示第 53 列&#x…...

免费pdf格式转换工具

基本功能 - 支持单文件转换和批量转换两种模式 - 内置PDF文件预览功能 - 支持8种常见格式转换&#xff1a;Word、Excel、JPG/PNG图片、HTML、文本、PowerPoint和ePub 单文件转换功能 - 文件选择&#xff1a;支持浏览和选择单个PDF文件 - 输出位置&#xff1a;可自定义设置输出…...

I²C总线应用场景及1.8V与3.3V电压选择

以下是关于IC总线应用场景及1.8V与3.3V电压选择的详细分析: 一、IC总线的典型应用场景 1. 板内通信(主要场景) 描述:IC 最初设计是为电路板(PCB)上的芯片间短距离通信,尤其适用于集成度高的系统。典型器件: 传感器模块(如温湿度传感器BME280)。存储芯片(如EEPROM 2…...

css错峰布局/瀑布流样式(类似于快手样式)

当样式一侧比较高的时候会自动换行&#xff0c;尽量保持高度大概一致&#xff0c; 例&#xff1a; 一侧元素为5&#xff0c;另一侧元素为6 当为5的一侧过于高的时候&#xff0c;可能会变为4/7分部dom节点 如果不需要这样的话删除样式 flex-flow:column wrap; 设置父级dom样…...

Deepseek中的MoE架构的改造:动态可变参数激活的MoE混合专家架构(DVPA-MoE)的考虑

大家好,我是微学AI,今天给大家介绍一下动态可变参数激活MoE架构(Dynamic Variable Parameter-Activated MoE, DVPA-MoE)的架构与实际应用,本架构支持从7B到32B的等多档参数动态激活。该架构通过细粒度难度评估和分层专家路由,实现“小问题用小参数,大问题用大参数”的精…...

docker-compose Install reranker(fastgpt支持) GPU模式

前言BGE-重新排名器 与 embedding 模型不同&#xff0c;reranker 或 cross-encoder 使用 question 和 document 作为输入&#xff0c;直接输出相似性而不是 embedding。 为了平衡准确性和时间成本&#xff0c;cross-encoder 被广泛用于对其他简单模型检索到的前 k 个文档进行重…...