当前位置：首页 > news >正文

用Nest 实现大文件分片上传，加速工作效率神器

news 2026/2/10 22:23:26

文件上传是常见需求，只要指定 content-type 为 multipart/form-data，内容就会以这种格式被传递到服务端：

服务端再按照 multipart/form-data 的格式提取数据，就能拿到其中的文件。

但当文件很大的时候，事情就变得不一样了。

假设传一个 100M 的文件需要 3 分钟，那传一个 1G 的文件就需要 30 分钟。

这样是能完成功能，但是产品的体验会很不好。

所以大文件上传的场景，需要做专门的优化。

把 1G 的大文件分割成 10 个 100M 的小文件，然后这些文件并行上传，不就快了？

然后等 10 个小文件都传完之后，再发一个请求把这 10 个小文件合并成原来的大文件。

这就是大文件分片上传的方案。

那如何拆分和合并呢？

浏览器里 Blob 有 slice 方法，可以截取某个范围的数据，而 File 就是一种 Blob：

所以可以在 input 里选择了 file 之后，通过 slice 对 File 分片。

那合并呢？

fs 的 createWriteStream 方法支持指定 start，也就是从什么位置开始写入。

这样把每个分片按照不同位置写入文件里，不就完成合并了么。

思路理清了，接下来我们实现一下。

创建个 Nest 项目：

npm install -g @nestjs/clinest new large-file-sharding-upload

在 AppController 添加一个路由：

@Post('upload')
@UseInterceptors(FilesInterceptor('files', 20, {dest: 'uploads'
}))
uploadFiles(@UploadedFiles() files: Array<Express.Multer.File>, @Body() body) {console.log('body', body);console.log('files', files);
}

这是一个 post 接口，会读取请求体里的 files 文件字段传入该方法。

这里还需要安装用到的 multer 包的类型：

npm install -D @types/multer

然后我们在网页里试一下：

首先在 main.ts 里开启跨域支持：

然后添加一个 index.html：

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><script src="https://unpkg.com/axios@0.24.0/dist/axios.min.js"></script>
</head>
<body><input id="fileInput" type="file" multiple/><script>const fileInput = document.querySelector('#fileInput');fileInput.onchange =  async function () {const data = new FormData();data.set('name','光');data.set('age', 20);[...fileInput.files].forEach(item => {data.append('files', item)})const res = await axios.post('http://localhost:3000/upload', data);console.log(res);}</script>
</body>
</html>

input 指定 multiple，可以选择多个文件。

选择文件之后，通过 post 请求 upload 接口，携带 FormData。FormData 里保存着 files 和其它字段。

起个静态服务：

npx http-server .

浏览器访问下：

选择几个文件：

这时候，Nest 服务端就接收到了上传的文件和其他字段：

当然，我们并不是想上传多个文件，而是一个大文件的多个分片。

所以是这样写：

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><script src="https://unpkg.com/axios@0.24.0/dist/axios.min.js"></script>
</head>
<body><input id="fileInput" type="file"/><script>const fileInput = document.querySelector('#fileInput');const chunkSize = 20 * 1024;fileInput.onchange =  async function () {const file = fileInput.files[0];console.log(file);const chunks = [];let startPos = 0;while(startPos < file.size) {chunks.push(file.slice(startPos, startPos + chunkSize));startPos += chunkSize;}chunks.map((chunk, index) => {const data = new FormData();data.set('name', file.name + '-' + index)data.append('files', chunk);axios.post('http://localhost:3000/upload', data);})}</script>
</body>
</html>

对拿到的文件进行分片，然后单独上传每个分片，分片名字为文件名 + index。

这里我们测试用的图片是 80k：

所以每 20k 一个分片，一共是 4 个分片。

测试下：

服务端接收到了这 4 个分片:

然后我们把它们移动到单独的目录：

@Post('upload')
@UseInterceptors(FilesInterceptor('files', 20, {dest: 'uploads'
}))
uploadFiles(@UploadedFiles() files: Array<Express.Multer.File>, @Body() body: { name: string }) {console.log('body', body);console.log('files', files);const fileName = body.name.match(/(.+)\-\d+$/)[1];const chunkDir = 'uploads/chunks_'+ fileName;if(!fs.existsSync(chunkDir)){fs.mkdirSync(chunkDir);}fs.cpSync(files[0].path, chunkDir + '/' + body.name);fs.rmSync(files[0].path);
}

用正则匹配出文件名：

在 uploads 下创建 chunks_文件名的目录，把文件复制过去，然后删掉原始文件。

测试下：

分片文件移动成功了。

不过直接以 chunks_文件名做为目录名，太容易冲突了。

我们可以在上传文件的时候给文件名加一个随机的字符串。

这样就不会冲突了：

接下来，就是在全部分片上传完之后，发送合并分片的请求。

添加一个 merge 的接口：

@Get('merge')
merge(@Query('name') name: string) {const chunkDir = 'uploads/chunks_'+ name;const files = fs.readdirSync(chunkDir);let startPos = 0;files.map(file => {const filePath = chunkDir + '/' + file;const stream = fs.createReadStream(filePath);stream.pipe(fs.createWriteStream('uploads/' + name, {start: startPos}))startPos += fs.statSync(filePath).size;})
}

接收文件名，然后查找对应的 chunks 目录，把下面的文件读取出来，按照不同的 start 位置写入到同一个文件里。

浏览器访问下这个接口：

可以看到，合并成功了：

再测试一个：

也没啥问题。

然后我们在合并完成之后把 chunks 目录删掉。

@Get('merge')
merge(@Query('name') name: string) {const chunkDir = 'uploads/chunks_'+ name;const files = fs.readdirSync(chunkDir);let count = 0;let startPos = 0;files.map(file => {const filePath = chunkDir + '/' + file;const stream = fs.createReadStream(filePath);stream.pipe(fs.createWriteStream('uploads/' + name, {start: startPos})).on('finish', () => {count ++;if(count === files.length) {fs.rm(chunkDir, {recursive: true}, () =>{});}})startPos += fs.statSync(filePath).size;});
}

然后在前端代码里，当分片全部上传完之后，调用 merge 接口：

const tasks = [];
chunks.map((chunk, index) => {const data = new FormData();data.set('name', randomStr + '_' + file.name + '-' + index)data.append('files', chunk);tasks.push(axios.post('http://localhost:3000/upload', data));
})
await Promise.all(tasks);
axios.get('http://localhost:3000/merge?name=' + randomStr + '_' + file.name);

连起来测试下：

因为文件比较小，开启 network 的 slow 3g 网速来测。

可以看到，分片上传和最后的合并都没问题。

当然，你还可以加一个进度条，这个用 axios 很容易实现：

至此，大文件分片上传就完成了。

总结

当文件比较大的时候，文件上传会很慢，这时候一般我们会通过分片的方式来优化。

原理就是浏览器里通过 slice 来把文件分成多个分片，并发上传。

服务端把这些分片文件保存在一个目录下。

当所有分片传输完成时，发送一个合并请求，服务端通过 fs.createWriteStream 指定 start 位置，来把这些分片文件写入到同一个文件里，完成合并。

这样，我们就实现了大文件分片上传。

Nest 实现大文件分片上传
原文链接：https://juejin.cn/post/7315591545741197349

用Nest 实现大文件分片上传，加速工作效率神器

文件上传是常见需求，只要指定 content-type 为 multipart/form-data，内容就会以这种格式被传递到服务端： 服务端再按照 multipart/form-data 的格式提取数据，就能拿到其中的文件。但当文件很大的时候，事情就变得不一样…...

编程日记 2023/12/25 21:16:29

将ncnn及opencv的mat存储成bin文件的方法

利用fstream，将ncnn及opencv的mat存储成bin文件。 ncnn::Mat to bin std::ios::binary标志指示文件以二进制模式进行读写， std::ofstream file("output_x86.bin", std::ios::binary); 将input_mat中的宽、高和通道数分别赋值给width、heig…...

编程日记 2023/12/25 21:15:27

dpdk原理概述及核心源码剖析

dpdk原理 1、操作系统、计算机网络诞生已经几十年了，部分功能不再能满足现在的业务需求。如果对操作系统做更改，成本非常高，所以部分问题是在应用层想办法解决的，比如前面介绍的协程、quic等，都是在应用层重新开发的框…...

编程日记 2023/12/25 21:13:26

VTK+QT配置(VS)

先根据vtk配置这个博客配置基本环境然后把这个dll文件从VTK的designer目录复制到qt的对应目录里记得这里是debug版本，你也可以配置release都一样的步骤，然后建立一个qt项目，接着配置包含目录，库目录，链接输入&…...

编程日记 2023/12/25 21:11:24

5G边缘计算：解密边缘计算的魔力

引言你是否曾想过，网络可以更贴心、更智能地为我们提供服务？5G边缘计算就像是网络的小助手，时刻待命在你身边，让数字生活变得更加便捷。什么是5G边缘计算？ 想象一下，边缘计算就像是在离你最近的一层“云…...

编程日记 2023/12/25 21:10:23

Sentinel 流量治理组件教程

前言官网首页：home | Sentinel (sentinelguard.io) 随着微服务的流行，服务和服务之间的稳定性变得越来越重要。Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件，主要以流量为切入点，从流量路由、流量控制、流量整形…...

编程日记 2023/12/25 21:08:22

C语言第五十九弹---介绍说明内存函数memcmp

使用C语言介绍说明内存函数memcmp memcmp是C语言标准库中的一个函数，用于比较两个内存区域的内容是否相同。源代码： int memcmp(const void* ptr1, const void* ptr2, size_t num);ptr1和ptr2分别是要比较的两个内存区域的指针，num是要比较…...

编程日记 2023/12/25 21:07:21

jar混淆，防止反编译，Allatori工具混淆jar包

文章目录 Allatori工具简介下载解压配置config.xml注意事项 Allatori工具简介官网地址：https://allatori.com/ Allatori不仅混淆了代码，还最大限度地减小了应用程序的大小，提高了速度，同时除了你和你的团队之外，任何人…...

编程日记 2023/12/25 21:05:19

linux中批量将HEIC转jpg

苹果目前已大量使用HEIC格式的照片，虽然上传到Windows系统的时候是会自动转为jpg的，但也经常会在很多场景中保留了HEIC格式，前两天就收到了一大堆HEIC文件，window10里都打不开，照片的插件是需要付费下载的，…...

编程日记 2023/12/25 21:03:16

File: rust/src/tools/clippy/clippy_lints/src/methods/suspicious_command_arg_space.rs 在Rust源代码中，suspicious_command_arg_space.rs文件位于clippy_lints工具包的methods目录下，用于实现Clippy lint SUSPICIOUS_COMMAND_ARG_SPACE。 Clippy是Ru…...

编程日记 2023/12/25 21:01:14

一款C++编写的数据可视化库Matplot++

它是基于著名的 Matplotlib 库（Python 中广泛使用的绘图库）构建的，旨在提供类似于 Matplotlib 的功能，但专门为 C 设计。Matplot 支持多种图表类型，包括线图、散点图、条形图、直方图、误差线图等，使数据可…...

编程日记 2023/12/25 21:00:13

paddle 56 将图像分类模型嵌入到目标检测中并实现端到端的部署（用图像分类模型进行目标检测切片分类）

目标检测在功能上一直是涵盖了图像分类的，其包含目标切片检测，目标切片分类。由于某些原因，需要将目标检测的功能退化为检测，忽略其切片分类，使用外部的分类模型。然而这样操作会使得其与原始的部署代码不兼容，为此博主实现将图像分类模型嵌入到目标检测中，并实现端到端…...

编程日记 2023/12/25 20:59:12

SQL手工注入漏洞测试(MySQL数据库)

一、实验平台 https://www.mozhe.cn/bug/detail/elRHc1BCd2VIckQxbjduMG9BVCtkZz09bW96aGUmozhe 二、实验目标获取到网站的KEY，并提交完成靶场。三、实验步骤 ①、启动靶机，进行访问查找可能存在注入的页面 ②、通过测试判断注入点的位置(id) (1)…...

编程日记 2023/12/25 20:56:10

JAVA WEB用POI导出EXECL多个Sheet

前端方法：调用exportInfoPid这个方法并传入要查询的id即可，也可以用其他参数看个人需求 function exportInfoPid(id){window.location.href 服务地址"/exportMdsRoutePid/"id; } 后端控制层代码 Controller Scope("prototype") R…...

编程日记 2023/12/25 20:55:08

@RequestBody详解：用于获取请求体中的Json格式参数

获取请求体中的Json格式参数 （RequestBody） 当前端将一些比较复杂的参数转换成Json字符串通过请求体传递过来给后端，这种时候就可以使用RequestBody注解获取请求体中的数据。而json字符串是包含在请求体中的，使用请求体传参通常…...

编程日记 2023/12/25 20:54:07

AI日报：2024年人工智能对各行业初创企业的影响

欢迎订阅专栏《AI日报》获取人工智能邻域最新资讯文章目录 2024年人工智能对初创企业的影响具体行业医疗金融服务运输与物流等新趋势 2024年人工智能对初创企业的影响 2023年见证了人工智能在各个行业的快速采用和创新。随着我们步入2024年，人工智能初创公司正…...

编程日记 2023/12/25 20:53:06

QAM 归一化因子

文章目录前言一、归一化1、作用2、OFDM 归一化因子二、归一化因子公式前言在做通信系统仿真时，遇到了 QAM 归一化因子的求解，对这里不是很清楚，因此本文对 QAM（正交振幅调制）归一化因子学习做了一下记录。一、归…...

编程日记 2023/12/25 20:46:00

PoE交换机传输距离是多少？100米？250米？

你们好，我的网工朋友。今天和你聊聊PoE交换机，之前有系统地给你讲解过一篇，可以先回顾一下哈：《啥样的交换机才叫高级交换机？这张图告诉你》为什么都说PoE交换机好？它最显著的特点就是： 可…...

编程日记 2023/12/25 20:44:59

Jenkins Pipeline脚本优化：为Kubernetes应用部署增加状态检测

引言在软件部署的世界中，Jenkins已经成为自动化流程的代名词。不断变化的技术环境要求我们持续改进部署流程以满足现代应用部署的需要。在本篇博客中，作为一位资深运维工程师，我将分享如何将Jenkins Pipeline进化至不仅能支持部署应用直至R…...

编程日记 2023/12/25 20:43:58

R语言基础 | 安徽某高校《统计建模与R软件》期末复习

第一节数字、字符与向量 1.1 向量的赋值 c<-(1,2,3,4,5) 1.2 向量的运算对于向量，我们可以直接对其作加（），减（-），乘（*），除（/&#xff09…...

编程日记 2023/12/25 20:42:58

【杂谈】-递归进化：人工智能的自我改进与监管挑战

递归进化：人工智能的自我改进与监管挑战文章目录递归进化：人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管？3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

编程新知 2025/12/9 0:22:01

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

SCAU期末笔记 - 数据分析与数据挖掘题库解析

这门怎么题库答案不全啊日来简单学一下子来一、选择题（可多选） 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B.分类和预测 C.数据预处理 D.数据流挖掘 A. 频繁模式挖掘：专注于发现数据中…...

编程新知 2026/1/24 14:15:43

从深圳崛起的“机器之眼”：赴港乐动机器人的万亿赛道赶考路

进入2025年以来，尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断，但全球市场热度依然高涨，入局者持续增加。以国内市场为例，天眼查专业版数据显示，截至5月底，我国现存在业、存续状态的机器人相关企…...

编程新知 2026/2/8 7:23:45

（二）原型模式

原型的功能是将一个已经存在的对象作为源目标，其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。一、源型模式的定义原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现，忽略对象创建过程中的其它细节。 📌 核心特点：避免重复初…...

编程新知 2026/2/10 15:49:06

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备工具安装： 下载安装DevEco Studio 4.0（支持HarmonyOS 5）配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化： ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

编程新知 2026/2/1 4:17:33

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2026/2/4 17:31:44

稳定币的深度剖析与展望

一、引言在当今数字化浪潮席卷全球的时代，加密货币作为一种新兴的金融现象，正以前所未有的速度改变着我们对传统货币和金融体系的认知。然而，加密货币市场的高度波动性却成为了其广泛应用和普及的一大障碍。在这样的背景下，稳定…...

编程新知 2025/10/24 12:31:26

招商蛇口 | 执笔CID，启幕低密生活新境

作为中国城市生长的力量，招商蛇口以“美好生活承载者”为使命，深耕全球111座城市，以央企担当匠造时代理想人居。从深圳湾的开拓基因到西安高新CID的战略落子，招商蛇口始终与城市发展同频共振，以建筑诠释对土地与生活的…...

编程新知 2026/1/26 8:13:33

Leetcode33（搜索旋转排序数组）

题目表述整数数组 nums 按升序排列，数组中的值互不相同。在传递给函数之前，nums 在预先未知的某个下标 k（0 < k < nums.length）上进行了旋转，使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...

编程新知 2026/1/17 19:18:25

用Nest 实现大文件分片上传，加速工作效率神器

总结

相关文章：

用Nest 实现大文件分片上传，加速工作效率神器

将ncnn及opencv的mat存储成bin文件的方法

dpdk原理概述及核心源码剖析

VTK+QT配置(VS)

5G边缘计算：解密边缘计算的魔力

Sentinel 流量治理组件教程

C语言第五十九弹---介绍说明内存函数memcmp

jar混淆，防止反编译，Allatori工具混淆jar包

linux中批量将HEIC转jpg

听GPT 讲Rust源代码--src/tools(25)

一款C++编写的数据可视化库Matplot++

paddle 56 将图像分类模型嵌入到目标检测中并实现端到端的部署（用图像分类模型进行目标检测切片分类）

SQL手工注入漏洞测试(MySQL数据库)

JAVA WEB用POI导出EXECL多个Sheet

@RequestBody详解：用于获取请求体中的Json格式参数

AI日报：2024年人工智能对各行业初创企业的影响

QAM 归一化因子

PoE交换机传输距离是多少？100米？250米？

Jenkins Pipeline脚本优化：为Kubernetes应用部署增加状态检测

R语言基础 | 安徽某高校《统计建模与R软件》期末复习

【杂谈】-递归进化：人工智能的自我改进与监管挑战

阿里云ACP云计算备考笔记 (5)——弹性伸缩

SCAU期末笔记 - 数据分析与数据挖掘题库解析

从深圳崛起的“机器之眼”：赴港乐动机器人的万亿赛道赶考路

（二）原型模式

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

网络编程（UDP编程）

稳定币的深度剖析与展望

招商蛇口 | 执笔CID，启幕低密生活新境

Leetcode33（搜索旋转排序数组）