Rollup入门与进阶:为现代Web应用构建超小的打包文件
我们常常面临Webpack复杂配置或是Babel转译后的冗余代码,结果导致最终的包体积居高不下加载速度也变得异常缓慢,而在众多打包工具中Rollup作为一个轻量且高效的选择,正悄然改变着这一切,本文将带你深入了解这个令人惊艳的打包工具
目录
入门Rollup
配置Rollup
Babel转换代码
打包多入口代码
加载三方依赖模块
使用TS模块
压缩JS代码
模板生成html页面
启动开发服务器
处理vue组件
压缩CSS代码
设置环境变量
配置css预处理器
排除第三方库
打包文件拆分
生成sourcemap
配置路径别名
入门Rollup
初识Rollup:是一个现代js的打包工具,主要用于将多个js文件打包成一个或多个最终的输出文件,它特别适用于构建库和模块化的应用程序,与Webpack等其他打包工具相比,Rollup 的一个显著优势是它能生成非常精简的代码,因为它能够进行更好的tree-shaking(去除未使用的代码)和模块优化,其使用特点如下所示:
1)打包后的代码体积小,性能优异
2)支持 ES 模块(ESM)格式
3)插件丰富,能够进行高度自定义
4)支持 tree shaking(去除无用代码)
所以说如果想构建库和小型应用,尤其是需要发布成npm包时,选择Rollup是一个不错的选择,如果想了解更为详细的内容,参考:官网 :
项目初始化:接下来我们开始对项目进行一个初始化,首先终端执行如下命令直接全局安装rollup,如下所示:
npm install --global rollup
接下来我们创建一个项目文件夹,然后终端自行pnpm init初始化一个package.json文件,然后执行如下命令来安装一下rollup,安装完成之后,我们在项目根目录创建一个src文件夹,里面新建一个index.js文件,来展示一下要打包的代码:
pnpm i rollup -D
function random() {return Math.random().toString(16).slice(2);
}
console.log(random(), '变化1')
console.log(random(), '变化2')
然后我们根据官网给的入门提示,配置如下的打包命令:
可以看到打包出来的文件,基本上也是能够看懂的
配置Rollup
Rollup作为一个强大的js打包工具,在构建高效优化的模块化代码时展现了其独特的优势,然而Rollup的配置可以有很多细节,本文将带你逐步了解Rollup的配置过程,探讨如何通过Rollup配置优化打包提升代码的加载速度和运行效率,如下所示:
Babel转换代码
现代JavaScript特性(如箭头函数、模板字符串、类、模块化等)并不是所有浏览器都支持,特别是一些旧版浏览器(例如 Internet Explorer),Babel可以将这些新特性转换为旧版浏览器可以理解的代码以确保不同环境下的兼容性,接下来我们需要终端安装如下依赖:
// @babel/core babel的核心包
// @babel/preset-env 预设
// @rollup/plugin-babel babel插件
// @babel/runtime 减小最终构建文件的体积
// @babel/plugin-transform-runtime 减少转换过程中出现的重复代码
pnpm i @rollup/plugin-babel @babel/core @babel/preset-env @babel/runtime @babel/plugin-transform-runtime -D
安装完插件之后,我们在根目录创建一个 .babelrc 的babel配置文件,然后进行如下配置:
{"presets": [["@babel/preset-env",{"modules": false}]],"plugins": ["@babel/plugin-transform-runtime"]
}
配置完成之后我们来到config文件中进行如下babel插件的设置:
然后我们在入口文件写一个ES6模块的箭头函数,打包之后就会变成普通的function函数,兼容了低版本浏览器不支持ES6高级语法的情况:
打包多入口代码
上面我们配置的都是打包单入口的代码,如果想配置打包多入口的代码需要通过如下操作进行:
打包代码之前,我们需要先将打包文件中原本的文件先删除掉,这里需要借助如下插件:
pnpm i rollup-plugin-clear -D
然后我们引入插件之后进行如下插件的注册即可:
如下我们在dist文件下随便建一些文件,当我们执行打包之后,这些无关的文件都会被清除掉:
加载三方依赖模块
如果想rollup支持三方依赖插件的打包,这里我们需要安装如下插件然后进行一些配置:
pnpm i @rollup/plugin-node-resolve @rollup/plugin-commonjs -D
安装完成之后,我们仍然需要在配置文件当中进行如下插件的设置:
设置完成之后,我们可以安装一个三方依赖尝试一下,如下:
pnpm i lodash -s
如下当我们执行打包的时候就会把三方插件的依赖全部打包到文件当中:
当然可能还会有一些情况,比如说我们引入的第三方依赖当中含有的node语法,浏览器是无法识别的,这里我们需要替换一下打包结果中的关键字,终端执行如下命令:
pnpm i @rollup/plugin-replace -D
安装完成之后,在rollup配置文件当中进行如下配置即可:
replace({ // 替换打包结果中在浏览器中不兼容的代码,例如process.env.NODE_ENV'process.env.NODE_ENV': JSON.stringify('production'), // 替换代码中的环境变量preventAssignment: true // 防止替换赋值表达式,例如process.env.NODE_ENV = 'production'
}),
使用TS模块
如果想编译TS文件为js代码的话,需要终端安装如下插件:
pnpm i @rollup/plugin-typescript tslib -D
然后在配置文件中注册插件即可:
如下当执行打包的时候,TS文件编译成JS文件:
然后如果想对我们的ts编译进行一些操作的话,直接执行tsc --init生产ts配置文件,然后在里面调整即可,如下所示:
然后我们可以根据自身情况进行一个配置,例如如下所示:
{"compilerOptions": {"target": "ES6", // 编译目标为ES6 "module": "ESNext", // 模块系统为ESNext "strict": false, // 启用所有严格类型检查选项 "skipLibCheck": true, // 跳过所有声明文件的类型检查 "esModuleInterop": true, // 允许从默认导出导入模块 "forceConsistentCasingInFileNames": false, // 禁止对同一个文件的不一致的引用 }
}
压缩JS代码
如果我们想对JS代码进行一个压缩,这里我们可以终端执行如下命令安装插件:
pnpm i @rollup/plugin-terser -D
安装完插件之后,还是对插件进行一个导入并使用:
然后我们执行打包,可以看到我们的代码已经真正被压缩了:
模板生成html页面
如果我们想根据模板html生成html单页面,这里我们可以终端执行如下命令安装插件:
pnpm i rollup-plugin-generate-html-template -D
安装完成之后,这里我们仍然需要在rollup配置文件当中,设置该模板插件,如下所示:
添加完成之后我们在src目录下新建一个index.html文件,这里可以演示作为vue的根节点:
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title>
</head>
<body><!-- vue的挂载点 --><div id="app"></div>
</body>
</html>
当我们执行打包命令之后,html页面就会自动被打包到dist文件下,并且会自动注入js代码,注入js代码的类型也是我们设置的module,当我们执行html之后,浏览器也会执行js中的代码逻辑:
启动开发服务器
上面我们通过模板生成index.htm文件之后,如果想方便的运行项目的话,这里我们可以安装如下插件来帮助我们快捷的实现服务器的运行:
pnpm i rollup-plugin-serve -D
安装完插件之后,我们就可以在rollup配置文件当中进行如下配置:
然后我们可以在package.json文件当中针对不同的环境执行不同的文件,这里本地环境就执行dev命令即可,生产环境就执行build命令即可,然后针对不同的环境也可执行不同的配置文件:
比如说生产的配置文件中,不需要执行启动开发服务器的插件,本地环境不需要执行压缩代码的插件,然后不同的环境替换关键字的命令也不同,如下所示:
然后我们运行pnpm run dev命令,打开本地环境,如下可以看到会自动打开浏览器,查看f12可以看到我们打包的命令被执行了:
如果想设置完开发服务器之后,后期对代码修改浏览器能够自动更新,可以终端执行如下命令:
pnpm i rollup-plugin-live-server -D
安装完插件之后,我们在配置文件中进行一个导入,然后我们修改页面代码之后,页面可以实时更新了,如下所示:
import { liveServer } from 'rollup-plugin-live-server'liveServer({port: 3000, // 设置端口号host: 'localhost', // 设置主机名root: 'dist', // 设置根目录file: 'index.html', // 设置默认打开的文件open: true, // 自动打开浏览器
})
当然我们还可以安装下面的插件,进行插件之间的配合操作,如下所示:
pnpm i rollup-plugin-livereload -D
import serve from 'rollup-plugin-serve'
import livereload from 'rollup-plugin-livereload';// 开发服务器:使用 serve 和 livereload 组合
serve({open: true, // 只在首次启动时打开浏览器verbose: true,contentBase: ['dist'],port: 3000,host: 'localhost',onListening(server) {const address = server.address();const host = address.address === '::1' ? 'localhost' : address.address;const port = address.port;console.log(`Server running at http://${host}:${port}/`);}
}),
// 监听 dist 目录变化并自动刷新页面
livereload({watch: 'dist',verbose: false, // 关闭过多的日志输出delay: 1000, // 延迟时间,防止频繁刷新
}),
处理vue组件
如果我们想基于vue来开发一些功能的话,这里需要终端执行如下命令安装插件:
pnpm i vue -s
pnpm i rollup-plugin-vue -D
安装完插件之后,我们需要引入该插件,然后把vue编译放在插件列表的第一个:
然后我们开始编写vue模板并在入口文件中进行引入即可:
这里顺便为vue文件添加类型声明,如下所示:
终端执行打包命令之后,可以看到我们的浏览器已经打印了我们定义的内容:
压缩CSS代码
如果相对我们CSS代码进行一个压缩,这里我们可以终端执行如下命令安装插件,后面两个插件分别是对压缩和浏览器版本进行的控制:
pnpm i rollup-plugin-postcss cssnano autoprefixer -D
完整完插件之后,我们来到配置文件当中,进行如下配置:
import postcss from 'rollup-plugin-postcss';
import cssnano from 'cssnano';
import autoprefixer from 'autoprefixer'// 处理 CSS
postcss({extract: 'bundle.css', // 提取CSS到单独的文件modules: false, // 禁用 CSS Modulesminimize: true, // 开启压缩plugins: [autoprefixer, cssnano], // 使用 cssnano 插件进行压缩
}),
这里我们还需要来到package.json文件当中,设置browserslist指定项目所支持的浏览器范围的配置,如下所示:
"browserslist": ["defaults","not ie < 8","last 2 versions","> 1%","iOS 7","last 3 iOS versions"
]
执行打包命令之后,可以看到我们的css文件已经被压缩,并且浏览器的样式也成功生成,并且也兼容了其他浏览器的版本:
设置环境变量
如果想实现环境变量的配置以及实现跨平台等操作,可以安装如下插件:
pnpm i cross-env -D
然后我们在配置文件当中打印一下当前的环境变量,如下所示:
当我们在package包中配置好执行脚本命令之后,打包生产可以看到控制台打印了当前的环境变量为生产,与我们设置的是一样的:
然后我们根据打印的环境变量来控制台当前的rollup的一些配置,后期打包的话就会根据打包环境变量的不同来控制不同配置的生效:
const isPro = process.env.NODE_ENV === 'production'// 处理 CSS
postcss({extract: 'bundle.css', // 提取CSS到单独的文件modules: false, // 禁用 CSS Modulesminimize: true, // 开启压缩plugins: [autoprefixer, // 使用 autoprefixer 插件添加浏览器前缀isPro && cssnano // 使用 cssnano 插件进行压缩],
}),// 替换打包结果中在浏览器中不兼容的代码,例如process.env.NODE_ENV
replace({ 'process.env.NODE_ENV': JSON.stringify(process.env.NODE_ENV), // 替换代码中的环境变量preventAssignment: true // 防止替换赋值表达式,例如process.env.NODE_ENV = 'production'
}),// 压缩打包后的文件
isPro && terser(), // 生产环境才压缩代码
配置css预处理器
如果想使用一些css预处理器如scss的话,可以终端执行如下命令安装:
pnpm i sass -D
// 或
pnpm i less -D
安装完预处理器之后,我们可以直接使用这种css方式,如下所示:
然后浏览器的样式依然生效:
排除第三方库
正常我们编写完vue项目之后打包项目,打包的文件里面就会把vue的项目全部打印到文件当中,可以看到打包后的文件为236kb,还是蛮大的,有什么办法能够减少打包体积呢?
这里我们可以排除第三方库的引入,通过第三方cdn方式引入来减少打包提交,如下我们可以在我们的index.html中引入vue对应版本的第三方cdn链接:
引入完之后我们可以在rollup的配置文件当中排除第三方vue的引入, 这里需要排除项配置和输出文件配置中的globals进行搭配使用,如下所示:
接下来当我们再次运行打包之后可以看到我们的打包体积已经大幅度被压缩了,有原本的200多kb的体积压缩到了只有1kb:
可以看到我们打包后的js文件是只有我们代码中真正写的内容,像vue的一些配置都被抽离出去通过cdn方式来引入使用了:
再比如当我们使用vue-router插件之后,配置完路由内容之后,如下所示:
虽然我们的项目被成功运行了,但是我们打包后的配置文件仍然还是比较大:
这里我们仍然可以通过排除第三方库的方式来减少打包体积,这里引入对应版本的vue-router文件
然后再配置文件当中,对路由依赖进行一个排除,如下所示:
可以看到我们的项目最终的打包体积被压缩到了3kb左右:
打包文件拆分
除了上面我们排除第三方库能够压缩打包体积操作,我们还可以对我们大体积的文件进行一个拆分操作,如果想对打包文件进行拆分,这里我们设置的打包模式就不能是iife,因为该模式不支持打包文件拆分,所有这里我们还是需要将其设置为esm模式,也就是es6里面所提供的浏览端标准的模块化解决方案,如下所示:
然后导入路由的方式我们采用异步方式导入,打包后的文件就会拆分成对应的路由文件,后面跟着一个随机的字符串避免浏览器缓存:
当然我们还可以对第三方库进行一个拆分,如下所示:
生成sourcemap
如果想我们压缩后的代码运行浏览器后,发生报错之后想精准定位报错文件,这里我们可以开启sourcemap操作,如下我们设置sourcemap为true的情况下,打包文件就会生成对应的map文件:
这些map文件就会被浏览器所识别并解析成我们项目真正的源代码,当然也可以设置如下选项,将这些map文件内嵌到对应的文件当中:
配置路径别名
如果想配置路径别名操作,可以终端执行如下命令安装插件:
pnpm i @rollup/plugin-alias -D
安装完插件之后,我们就需要在配置文件中进行一些设置,因为rollup配置文件中采用的是ES模块的写法,所有绝对路径我们需要改成ES写法:
import path from 'path'
import { fileURLToPath } from 'url';
import { dirname } from 'path';// 获取 __dirname 的 ES 模块写法
const __filename = fileURLToPath(import.meta.url);
const __dirname = dirname(__filename);
接下来我们在插件列表中进行如下配置:
// 配置别名路径
alias({entries: [{ find: '@', replacement: path.resolve(__dirname, 'src') }, // 将@替换为/src],
}),
然后路由代码中我们使用别名操作:
最终浏览器运行,没有问题,别名配置成功:
最后总结:Rollup作为一款专注于 ES 模块的打包工具,凭借其简洁的配置和强大的插件生态,为现代前端项目提供了高效、灵活的构建解决方案。通过本文的探讨,我们不仅掌握了从基础配置到高级优化的全流程技巧,还深入理解了如何根据项目需求选择合适的插件组合,解决实际开发中的各种挑战。无论是处理 Vue 组件、TypeScript 代码,还是实现热更新和代码分割,Rollup 都能以优雅的方式应对。掌握 Rollup 的配置艺术,不仅能提升项目的构建效率和运行性能,更能让开发者在模块化开发的道路上走得更加从容。未来,随着前端技术的不断演进,Rollup 也将持续为我们的开发工作注入新的活力,成为构建高质量JS应用不可或缺的利器。
相关文章:

Rollup入门与进阶:为现代Web应用构建超小的打包文件
我们常常面临Webpack复杂配置或是Babel转译后的冗余代码,结果导致最终的包体积居高不下加载速度也变得异常缓慢,而在众多打包工具中Rollup作为一个轻量且高效的选择,正悄然改变着这一切,本文将带你深入了解这个令人惊艳的打包工具…...
pdf url 转 图片
背景:vue2.0需要把pdf转成图片,显示在url里面,使用pdfjs-dist来解决 步骤: 1、安装依赖包(我的项目是node12,安装太高版本会报错) npm i pdfjs-dist2.16.105 2、vue代码 <template><div class"main…...

专题四:综合练习( 找出所有子集的异或总和再求和)
以leetcode1863题为例 题目分析: 找到每个子集,然后子集中的元素异或之后全部相加 算法原理分析: 画决策树:第一层为这个子集有一个元素 第二层这个子集有两个元素 从上往下罗列,把所有子集都罗列出来…...

STM32 修炼手册
第一章 计算机体系结构(了解) 后续在板子上开发的时候,需要考虑是否有操作系统 方式一:有操作系统,通过c库通过os api操作硬件方式二:无操作系统, 通过c库通过固件库操作硬件 第二章 STM32开发板概述 板子/开发板&…...

缓存(2):数据一致性
概述 一致性就是数据保持一致,在分布式系统中,可以理解为多个节点中数据的值是一致的。 强一致性:这种一致性级别是最符合用户直觉的,它要求系统写入什么,读出来的也会是什么,用户体验好,但实现起来往往对系统的性能影响大弱一致性:这种一致性级别约束了系统在写入成功…...
什么是原码和补码
补码的本质确实是模运算(Modular Arithmetic),这是理解补码为何能统一加减法的核心数学原理。下面用最通俗的语言和例子解释清楚: —### 1. 先理解什么是“模运算”- 模运算就是“周期性计数”,比如钟表: -…...

ppy/osu构建
下载 .NET (Linux、macOS 和 Windows) | .NET dotnet还行 构建:f5 运行:dotnet run --project osu.Desktop -c Debug...

基于几何布朗运动的股价预测模型构建与分析
基于几何布朗运动的股价预测模型构建与分析 摘要 本文建立基于几何布朗运动的股价预测模型,结合极大似然估计与蒙特卡洛模拟,推导股价条件概率密度函数并构建动态预测区间。实证分析显示模型在标普500指数预测中取得89%的覆盖概率,波动率估…...
使用交互式半自动化标注工具制作语义分割数据集
参考的初始资源: GitHub项目文档 B站视频 1.安装工具 打开Anaconda Prompt 1.创建虚拟环境 conda create -n isat_env python3.8 conda activate isat_env2.安装GPU版本pytorch 4070 Ti CUDN12.5 pip install torch torchvision torchaudio --index-url https:/…...
deepseek梳理java高级开发工程师微服务面试题
Java微服务高级面试题与答案 一、微服务架构设计 1. 服务拆分原则 Q1:微服务拆分时有哪些核心原则?如何解决拆分后的分布式事务问题? 答案: 服务拆分五大原则: 1. 单一职责原则(SRP)- 每个…...
二分查找算法的思路
二分查找思路总结 明确目标与单调性特点: 核心目标:寻找满足某种条件的答案(如最小/最大值)。单调性要求:需要证明你的判断函数具有单调性——即如果某个答案 T 可行,那么大于 T 的答案通常也是可行的&…...
(1)python开发经验
文章目录 1 安装包格式说明2 PySide支持Windows7 更多精彩内容👉内容导航 👈👉Qt开发 👈👉python开发 👈 1 安装包格式说明 PySide下载地址 进入下载地址后有多种安装包,怎么选择: …...
DAY05:深入解析生命周期与钩子函数
引言 在 Vue 开发中,生命周期和钩子函数是理解组件行为的关键。无论是初始化数据、操作 DOM,还是清理资源,生命周期钩子都提供了精确的控制点。本文将从基础理论出发,结合项目实战,详细剖析 Vue 3 的生命周期机制、组…...

python如何提取Chrome中的保存的网站登录用户名密码?
很多浏览器都贴心地提供了保存用户密码功能,用户一旦开启,就不需要每次都输入用户名、密码,非常方便。作为python脚本,能否拿到用户提前保存在浏览器中的用户名密码,用以自动登录呢?必须有,小爬…...

Redis实现分布式获取全局唯一自增ID的案例。
【1】简易自增版本(从 1 开始 1,2,3,...) 项目结构 下面是一个基于 RedisTemplate 实现的分布式全局唯一自增 ID 生成器的案例。适用于 Java Spring Boot 环境,利用 Redis 的原子操作 INCR 指令。 ✅ 原理说明 Redis 提供的 INCR 命令是原子性的&…...

人脸识别备案:筑牢人脸信息 “安全墙”
人脸识别备案制度主要依据《人脸识别技术应用安全管理办法》建立,人脸识别技术广泛应用于安防、金融、门禁、交通等领域,带来便利高效的同时,人脸信息安全问题也引发担忧。为规范技术应用、保护个人信息权益,人脸识别备案制度应运…...

基于RT-Thread的STM32F4开发第三讲——DAC
文章目录 前言一、DAC是什么?二、RT-Thread工程创建三、DAC函数编写1.DAC.c2.DAC.h3.main.c 四、结果测试五、工程分享 前言 本章利用RT-Thread最新的驱动5.1.0开发DAC模块,使用的开发板是正点原子的STM32F4探索者。很多配置和上文重复,本文…...
UE5通过C++实现TcpSocket连接
在 Unreal Engine 5 的 C 项目中,实现一个具备消息监听、心跳检测和断线重连功能的 TCP 客户端,可以参考以下完整示例。 准备工作 1、模块依赖 在 YourModule.Build.cs 文件中,添加对 Sockets 和 Networking 模块的依赖: Publ…...

网络状态可以通过hutool.HttpStatus获取
网络状态可以通过hutool.HttpStatus获取 全部都是静态int类型...

Gemini 2.5 推动视频理解进入新时代
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...

谈谈各种IO模型
目前的IO模型有5种:BIO(阻塞IO)、NIO(非阻塞IO)、IO多路复用、信号驱动IO、异步IO(AIO) 了解这些模型之前,我们需要先知道IO模型中的几个概念:阻塞&非阻塞、同步&am…...
基于STM32、HAL库的ADAU1701JSTZ音频接口芯片驱动程序设计
一、简介: ADAU1701JSTZ 是 Analog Devices 公司推出的一款高性能、低功耗音频编解码器 (CODEC) 芯片。它专为便携式音频设备设计,集成了麦克风前置放大器、ADC、DAC、耳机放大器等功能模块,支持多种音频接口和采样率,非常适合与 STM32 微控制器配合使用。 主要特性: 24…...

Linux系统管理与编程20:Apache
兰生幽谷,不为莫服而不芳; 君子行义,不为莫知而止休。 做好网络和yum配置,用前面dns规划的www的IP进行。 #!/bin/bash #----------------------------------------------------------- # File Name: myWeb.sh # Version: 1.0 # …...

BFS算法篇——打开智慧之门,BFS算法在拓扑排序中的诗意探索(下)
文章目录 引言一、课程表1.1 题目链接:https://leetcode.cn/problems/course-schedule/description/1.2 题目分析:1.3 思路讲解:1.4 代码实现: 二、课程表||2.1 题目链接:https://leetcode.cn/problems/course-schedul…...

【入门】纸盒的最大体积是多少?
描述 在一张尺寸为 n * n 厘米的正方形硬纸板的四个角上,分别裁剪掉一个 m * m 厘米的小正方形,就可以做成一个无盖纸盒,请问这个无盖纸盒的最大体积是多少? 立方体的体积 v 底面积 * 高) 比如: n 5 &am…...
什么是Vim
Vim可是Linux中最强大、最受欢迎的文本编辑器之一,很多程序员、系统管理员都离不开它。要说清楚Vim的各种功能和用法,似乎有点长,但我会尽量用简单通俗的方式,把Vim的核心知识讲清楚,让你能一步一步开始使用它。 一、…...

QT5.14安装以及新建基础项目
进入qt中文网站:Qt | 软件开发全周期的各阶段工具 额,考虑新手可能还是找不到,我就分享一下我下载的的吧 通过网盘分享的文件:qt-opensource-windows-x86-5.14.2.exe 链接:https://pan.baidu.com/s/1yQTRp-b_ISje5B3UWb7Apw?pw…...
Java Spring MVC -01
SpringMVC 是一种基于 的实现 MVC 设计模式的请求驱动类型的轻量级 Web 框架,属于 Spring FrameWork 的后续产品,已经融合在 Spring Web Flow 中。 First:SpringMVC-01-SpringMVC 概述 SpringMVC 是 Spring 框架的一个模块,用于构建 Web 应…...

KV cache 缓存与量化:加速大型语言模型推理的关键技术
引言 在大型语言模型(LLM)的推理过程中,KV 缓存(Key-Value Cache) 是一项至关重要的优化技术。自回归生成(如逐 token 生成文本)的特性决定了模型需要反复利用历史token的注意力计算结果&#…...
视频编解码学习十一之视频原始数据
一、视频未编码前的原始数据是怎样的? 视频在未编码前的原始数据被称为 原始视频数据(Raw Video Data),主要是按照帧(Frame)来组织的图像序列。每一帧本质上就是一张图片,通常采用某种颜色格式…...