大模型架构全景解析:从Transformer到未来计算范式
1. Transformer 架构
核心模型
- GPT-4、BERT、T5、LLaMA、通义千问、文心ERNIE
关键技术
- 多头注意力:GPT-4 使用 96 头注意力
- 位置编码创新:LLaMA 采用 RoPE(旋转位置编码),Claude 3 引入 ALiBi
- 归一化优化:LLaMA 使用 RMSNorm 替代 LayerNorm
2. RetNet(微软挑战者架构)
模型
- 微软 RetNet-7B(11)
技术突破
- 保留机制(Retention):通过指数衰减保留历史信息,支持 O(1) 推理复杂度
- 分块递归:混合并行与递归处理,8k 上下文推理速度提升 8.4 倍
主流架构类型及代表模型
1. Decoder-Only架构(自回归生成)
| 模型 | 参数量 | 核心技术 | 应用场景 |
|---|---|---|---|
| GPT-4 | 1.8T | MoE 架构(16专家)、GQA 分组查询注意力 | 多模态对话、代码生成 |
| Grok-1 | 314B | Sandwich Normalization、MoE 稀疏路由 | 实时问答、推理 |
| Claude 3 | 未公开 | 状态空间模型(SSM)+ Transformer 混合架构 | 长文本生成、逻辑推理 |
| 通义千问 | 720B | 多模态 Qformer 对齐、128k 上下文窗口 | 企业级知识处理 |
2. Encoder-Decoder架构(序列到序列)
| 模型 | 核心技术 | 应用场景 |
|---|---|---|
| T5 | Text-to-Text 统一框架、多任务预训练 | 翻译、摘要、问答 |
| GLM-130B | Prefix-LM 统一编码解码、DeepNorm | 中英双语生成、推理 |
| Pegasus-X | 非对称浅编码+深解码结构 | 长文本摘要、内容改写 |
3. MoE混合专家架构
| 模型 | 专家数 | 核心技术 | 优势场景 |
|---|---|---|---|
| Mixtral 8x7B | 8 | 动态路由负载均衡、稀疏激活(仅13B激活) | 多语言混合任务处理 |
| Switch-XL | 2048 | 万亿参数、动态专家分片 | 超大规模预训练 |
| 字节COMET | 64 | GPU 负载均衡优化、专家利用率达92% | 企业级高效训练 |
4. 多模态融合架构
| 模型 | 模态支持 | 核心技术 | 应用案例 |
|---|---|---|---|
| GPT-4V | 文本+图像+视频 | CLIP 对齐、视觉-语言联合微调 | 图像描述、跨模态搜索 |
| 商汤日日新 | 文本+3D+语音 | 多任务统一框架、知识图谱增强 | 数字人、元宇宙生成 |
| 星火V3 | 文本+工业传感 | 64专家 MoE、昇腾910B 国产适配 | 智能制造、物联网分析 |
关键技术组件演进
1. 注意力机制变种
- GQA(分组查询):LLaMA-2 平衡 MHA 质量与 MQA 效率
- 滑动窗口注意力:Longformer 支持 4k 窗口局部计算
- 随机稀疏注意力:SparseBERT 减少 80% 计算量,精度保留 98%
2. 位置编码对比
| 类型 | 代表模型 | 公式特点 | 优势场景 |
|---|---|---|---|
| RoPE | LLaMA、通义 | 复数域旋转保持相对位置不变性 | 长文本生成 |
| ALiBi | Claude、Qwen | 线性偏置惩罚(Attention Score -= m·i-j) | 短文本理解 |
| 可学习 | BERT | 随机初始化向量训练 | 短文本理解 |
3. 国内架构特色
- 文心ERNIE 4.0:知识增强(百亿实体图谱)+ 多任务预训练
- 星火认知:MoE 动态路由响应 < 0.3ms,千卡并行效率 82%
- 书生2.5:商汤开源多模态模型,COCO 检测 65.0 mAP
架构演进趋势
- 超长上下文:通义千问支持 128k tokens,Claude 突破 200k 窗口
- 硬件协同设计:光子芯片(Lightmatter)提升 Attention 能效 100 倍
- 轻量化部署:GPTQ 4bit 量化使 7B 模型显存降至 3.5GB
- 智能体融合:LangChain+RAG 实现实时知识库检索
30+模型架构全景图
| 架构类型 | 代表模型(国内) | 代表模型(国外) |
|---|---|---|
| Decoder-Only | 通义千问、讯飞星火、智谱 | GPT-4、Claude、LLaMA |
| Encoder-Decoder | 文心ERNIE、紫东太初 | T5、BART、Pegasus |
| MoE | 字节豆包、华为盘古 | Mixtral、Grok-1、Switch |
| 多模态 | 商汤日日新、百度文心一格 | GPT-4V、Gemini、Flamingo |
通过以上架构创新,大模型在生成质量、推理效率和跨任务泛化能力上持续突破,未来将形成“基础架构统一化(如 RetNet)+ 应用架构场景化”的生态格局。
相关文章:
大模型架构全景解析:从Transformer到未来计算范式
1. Transformer 架构 核心模型 GPT-4、BERT、T5、LLaMA、通义千问、文心ERNIE 关键技术 多头注意力:GPT-4 使用 96 头注意力位置编码创新:LLaMA 采用 RoPE(旋转位置编码),Claude 3 引入 ALiBi归一化优化࿱…...
【linux篇】--linux常见指令
文章目录 一、Linux基本概念 二、Linux入门 1.目录结构 2.Linux命令 *Linux基础命令 ls命令的选项: 3.目录切换相关命令(cd & pwd) 4.相对&绝对路径和特殊路径符 4.1相对路径 4.2绝对路径 4.3 你特殊路径符 5.创建目录命令(mkdir) 6.…...
Kubernetes的组成和架构
Kubernetes(K8s)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。它由多个组件组成,这些组件可以分为两类:控制平面(Control Plane)组件和节点(Node࿰…...
ElementUI 表格中插入图片缩略图,鼠标悬停显示大图
如何在 ElementUI 的表格组件 Table 中插入图片缩略图,通过鼠标悬停显示大图?介绍以下2种方式: 方法1:直接在模板元素中插入 <template><el-table :data"tableData"><el-table-column label"图片…...
【实战ES】实战 Elasticsearch:快速上手与深度实践-附录-1-常用命令速查表-集群健康检查、索引生命周期管理、故障诊断命令
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 附录-常用命令速查表 1-Elasticsearch 运维命令速查表(集群健康检查、ILM管理、故障诊断)一、集群健康检查与监控1.1 集群健康状态核心命令1.2 节点级健康诊断…...
PlainUSR|LIA: 追求更快的卷积网络实现高效的超分辨率重建
PlainUSR|LIA: 追求更快的卷积网络实现高效的超分辨率重建 引言 在深度学习领域,图像处理始终是一个热门话题。而超分辨率重建(Super-Resolution Reconstruction, SR)作为其中一个重要的研究方向,旨在通过算法将低分辨率图像恢复…...
Linux 命令学习记录
Linux 命令详解与进阶指南 Linux 是一种广泛使用的开源操作系统,掌握 Linux 命令是开发者和系统管理员的必备技能。本文将详细介绍 Linux 的常用命令,并涵盖一些高级进阶技巧,帮助你更高效地使用 Linux。 目录 基础命令 文件与目录操作文本…...
Android之RecyclerView列表拖动排序
文章目录 前言一、效果图二、实现步骤1.xml布局2.activity代码3.adapter 总结 前言 随着需求的变化,很多地方需要加拖动改变顺序的需求,用RecyclerView就可以实现列表拖动排序,列如像朋友圈图片拖动排序,或者音乐播放器列表拖动排…...
C# WPF 基础知识学习(一)
一、WPF 简介 Windows Presentation Foundation(WPF)是微软推出的一款用于构建用户界面的框架,它为开发 Windows 桌面应用程序提供了统一的编程模型、语言和框架。WPF 将用户界面的设计与业务逻辑分离开来,采用了 XAML࿰…...
MATLAB基于ResNet18的交通标志识别系统
1. 数据准备 数据集:该数据集包含了大量标注好的交通标志图片,每类标志都有不同的样本。数据预处理:图像需要进行一些基本的预处理,如调整大小、归一化等,以适应ResNet18的输入要求。 2. 网络设计 使用MATLAB自带的…...
CSS3-流星雨
1. 绘制标签 <div class"container"><span></span> </div>2. 设置div背景 在百度上搜索一幅星空的图片 <style>* {/* 初始化 */margin: 0;padding: 0;}body {/* 高度100% */height: 100vh;/* 溢出隐藏 */overflow: hidden;}.contai…...
数学建模 第一节
目录 前言 一 优化模型的类型 二 线性规划1 线性规划2 三 0-1规划 总结 前言 数学建模主要是将问题转化为模型,然后再以编程的形式输出出来 算法都知道,数学建模也需要用到算法,但是不是主要以编程形式展示,而是…...
平方矩阵问题
Ⅰ 回字形二维数组 #include <iostream> #include <iomanip> using namespace std; int main(){int n;while(cin>>n,n){for(int i0; i<n;i){for(int j0; j<n; j){int upi, downn-i1, leftj, rightn-j1;cout<<min(min(up,down),min(left,right)…...
自动化立体仓库堆垛机HMI屏幕程序施耐德HMIGXU系列 Vijeo Designer功能设计
堆垛机HMI屏幕功能概况 在自动化立体仓库堆垛机的HMI屏幕程序里,有着施耐德HMIGXU系列Vijeo Designer功能设计。此HMI程序运用标准的工程组织结构,凭借拖拽方式迅速构建人机交互界面。 其主要功能涵盖:设备参数、设备状态、手动/自动操作控制、报警显示、IO信息监控等模块…...
孤儿进程与僵尸进程:Linux进程管理中的“隐形杀手”与“无主孤儿”
在Linux系统中,进程的生命周期管理是系统稳定运行的关键。其中,孤儿进程和僵尸进程是两种特殊状态,它们看似相似却暗藏玄门。本文将从定义、区别到处理方法,揭开它们的神秘面纱。 一、孤儿进程:被“遗弃”的孩子&…...
信息系统运行管理员教程6--信息系统安全
信息系统运行管理员教程6–信息系统安全 第1节 信息系统安全概述 1.信息系统安全的概念 信息系统安全是指保障计算机及其相关设备、设施(含网络)的安全,运行环境的安全,信息的安全,实现信息系统的正常运行。信息系统…...
实验- 分片上传 VS 直接上传
分片上传和直接上传是两种常见的文件上传方式。分片上传将文件分成多个小块,每次上传一个小块,可以并行处理多个分片,适用于大文件上传,减少了单个请求的大小,能有效避免因网络波动或上传中断导致的失败,并…...
训练数据重复采样,让正负样本比例1:1
详细解释 resample 函数: resample 函数来自 sklearn.utils,用于从数据集中重新抽样。replaceTrue 表示允许重复抽样,即同一个样本可以被多次选中。n_samples 指定抽样的数量。 确保训练集数量相同: 通过 resample 函数ÿ…...
生活中的可靠性小案例12:类肤材质老化发粘问题
我一直觉得我买的某品牌车载吸尘器很好用,用了几年,目前性能也是杠杠的。然而它现在有个最大的问题,就是表面发粘了,用起来粘手,非常不舒服。 这一类问题在生活中不少见,尤其是一些用了类肤材质涂层的物件。…...
qt 自带虚拟键盘的编译使用记录
一、windows 下编译 使用vs 命令窗口,分别执行: qmake CONFIG"lang-en_GB lang-zh_CN" nmake nmake install 如果事先没有 指定需要使用的输入法语言就进行过编译,则需要先 执行 nmake distclean 清理后执行 qmake 才能生效。 …...
python中print函数的flush如何使用
在 Python 中,print 函数的 flush 参数是一个布尔值,默认值为 False。当设置为 True 时,它会强制将输出缓冲区的内容立即刷新到目标设备(通常是控制台),而不是等待缓冲区满或者程序结束时才输出。 要注意fl…...
k8s集群-kubeadm init
为了使用阿里云的镜像源加速 kubeadm init 初始化 Kubernetes 集群的过程,你需要修改 kubeadm 的配置文件以指向阿里云提供的镜像仓库。以下是具体步骤: 1. 创建或编辑 kubeadm 配置文件 首先,创建一个 kubeadm 的配置文件(如果还…...
【软考-架构】5.2、传输介质-通信方式-IP地址-子网划分
✨资料&文章更新✨ GitHub地址:https://github.com/tyronczt/system_architect 文章目录 传输介质网线光纤无线信道 通信方式和交换方式会考:交换方式 💯考试真题第一题第二题 IP地址表示子网划分💯考试真题第一题第二题 传输…...
记一次OOM异常问题排查
背景 最近,有运维同事收到告警,提示服务器出现CPU占用100%的情况出现,并且严重影响服务性能,甚至导致一些功能不可用。接到上述情况反馈后,随即展开对问题的排查。 排查 CPU占用100%排查 定位进程:使用 t…...
websocket学习手册及python实现简单的聊天室
概述 WebSocket 是一种网络通信协议,允许在单个 TCP 连接上进行全双工通信。它最核心的优势就在于实现了持久连接,实现了实时的数据传输。HTTP 协议有一个很大的缺点,通信只能由客户端发起,服务器返回响应后连接就会关闭…...
SpringMVC (二)请求处理
目录 章节简介 一 请求处理(初级) eg:请求头 二 请求处理(进阶) eg:请求体 三 获取请求头 四 获取Cookie 五 级联封装 六 使用RequestBoby封装JSON对象 七 文件的上传 八 获取整个请求 HttpEntity 九 原生请求 Spring…...
Android (Kotlin) 高版本 DownloadManager 封装工具类,支持 APK 断点续传与自动安装
以下是一个针对 Android 高版本的 DownloadManager 封装工具类,支持 断点续传 和 自动安装 APK 功能。该工具类兼容 Android 10 及以上版本的文件存储策略,并适配了 FileProvider 和未知来源应用安装权限。 工具类:DownloadUtils import and…...
深入探索Android Bitmap:从原理到实战
一、Bitmap 是什么 在 Android 开发中,Bitmap 是极为重要的基石。简单来说,Bitmap 代表位图,是图片在内存里的具体呈现形式 ,任何诸如 JPEG、PNG、WEBP 等格式的图片,一旦被加载到内存中,就会以 Bitmap 对象的形式存在。从原理上看,Bitmap 本质是像素点的集合,若其宽度…...
详细介绍 SetWindowPos() 函数
书籍:《Visual C 2017从入门到精通》的2.3.8 Win32控件编程 环境:visual studio 2022 内容:【例2.29】模态对话框 说明:以下内容大部分来自腾讯元宝。 1. 函数功能与用途 SetWindowPos() 是 Windows API 中用于动态调整窗口…...
1.6、Java继承、构造方法、数组
子类可以增加字段、增加方法或覆盖父类方法,但继承不会删除任何字段和方法不恰当认为super 同 this 引用是类似的概念,其实super不是一个对象的引用,不能将值super赋给另一个对象变量,super只是一个指示 编译器调用父类方法的特殊…...
