当前位置: 首页 > news >正文

[AI概念域] AI 大模型是如何被训练出来的?(通俗解读)

说明:这里使用 学生成长五部曲 比喻带你理解大模型如何从零开始学会思考。

AI大模型的训练过程可分为四个核心阶段:

  1. 首先进行海量数据收集与清洗,如同为“学生”准备涵盖各领域知识的教材库;
  2. 接着通过预训练让模型完成“填空题”,使其掌握基础语言规律和常识(例如学习“春天常与花开关联”),这相当于基础教育阶段;
  3. 随后进入专项微调,用人工编写的问答范例教会模型理解指令与执行任务(如区分写诗与写代码的需求),类似大学生选择专业深造;
  4. 最后通过强化学习引入人类反馈,像导师批改作业般优化回答质量,确保答案准确且符合伦理。

整个过程需消耗巨大算力(数千块GPU运行数月)和电力(相当于数万家庭年用电量),最终模型虽能流畅对话却缺乏真实理解,可能编造错误信息或放大数据偏见,这种基于统计规律而非认知能力的特性,既是AI的魔力所在,也是技术应用的潜在风险边界。


1 AI大模型的训练过程形象解读(学生成长五部曲)

1.1 预备阶段(建立知识库)

就像学生开学前准备教材和文具

  1. 数据收集买课本:从互联网收集数万亿字的文本(书籍、网页、论文等),相当于读完全球图书馆所有藏书的100倍,例如ChatGPT的训练数据包含:维基百科全文+290万篇学术论文+400亿网页内容。
  2. 数据清洗划重点做笔记:删除重复内容(如转载文章),过滤低质量信息(如广告、错别字),标注关键特征(如标记"春天"属于季节类词汇)。

1.2 训练阶段

1.2.1 基础教育阶段(预训练

像学生从幼儿园到高中系统学习

  1. 学习方式:做填空题练习:把句子挖空让模型预测缺失词:"西安电子科技大学的___季樱花非常著名" → 填"春"。每次答对获得奖励,答错调整思路。

  2. 核心能力培养

    • 语言逻辑:掌握主谓宾等语法结构
    • 常识积累:记住"水在0℃结冰"等知识点
    • 知识关联:建立"春天→花开→赏樱"的联想链
  3. 成果输出

    • 获得基础大模型(如GPT-3)
    • 能续写简单文本,但不会回答问题

1.2.2 专项提升阶段(微调训练)

像大学生选择专业进行深度学习

  1. 监督学习(SFT)做题家模式

    • 人工编写50万组问答范例:问:"西电的樱花何时开?" → 答:"三月下旬至四月初"
    • 模型通过模仿学习掌握任务解决能力
  2. 核心突破

    • 指令理解:区分"写诗"和"写代码"的需求
    • 场景适配:对医疗/法律等专业问题给出规范回答
    • 道德约束:拒绝回答如何制作危险物品
  3. 典型成果

    • 模型升级为Instruct版本(如GPT-3.5)
    • 能够理解并执行复杂指令

1.2.3 实战优化阶段(强化学习)

像研究生在导师指导下改进论文

  1. 人类反馈(RLHF)模拟答辩

    • 生成多个答案让人类评分:
      A答案:"西电樱花四月开"(3星)
      B答案:"西安电子科技大学樱花季为3-4月,最佳观赏期在清明前后"(5星)
    • 建立奖励模型,让高分答案获得更大权重
  2. 迭代优化

    • 质量提升:答案更准确详细
    • 风格优化:语气更自然友好
    • 安全加固:过滤99.7%的违规内容
  3. 最终成果

    • 产出对话优化版模型(如ChatGPT)
    • 具备多轮对话和上下文理解能力

1.3 评估阶段(领域适配)

像职场新人接受岗前培训,不合格继续训练,直到合格。

  1. 垂直训练考专业证书

    • 医疗领域:用300万份病历+医学文献训练
    • 法律领域:学习5000部法律法规+判例
  2. 混合训练培养通才

    • 同时输入文本+图片+音频数据
    • 实现多模态能力(如描述图片内容)
  3. 终身学习定期进修

    • 每月更新知识库(如新增2024年大事件)
    • 增量训练保持信息时效性

以上就是AI整个训练的一个完整描述了,对比了人类幼仔到工作上岗的整个过程,是不是更好理解了。接下来我们对训练过程中的其他部分内容进行总结。

2 总结 & 说明

2.1 技术本质总结

训练阶段人类类比技术本质耗时占比
预训练基础教育无监督语言模式学习80%
微调训练专业教育有监督任务适配15%
强化学习社会实践人类偏好对齐5%

2.2 训练成本揭秘说明

  • 硬件投入:需要数千块顶级GPU组成计算集群,相当于同时运行50万台高性能电脑
  • 能源消耗:训练GPT-4耗电1.3亿度,相当于1.5万个家庭全年用电量。
  • 时间成本:基础训练需3-6个月,全程优化迭代可能长达2年。

2.3 局限性说明

  1. 知识幻觉:可能编造看似合理但错误的内容(如虚构历史事件)
  2. 道德风险:训练数据中的偏见可能被放大(如性别歧视表述)
  3. 理解局限:不懂"樱花香气"的实际感受,仅描述文本特征

2.4 未来发展方向说明

  • 降低门槛:模型压缩技术让手机也能运行大模型,自动化训练工具让企业可定制专属AI。
  • 突破瓶颈:液态神经网络实现动态结构调整,量子计算加速千倍训练速度。
  • 认知跃迁:世界模型理解物理规律(如重力作用),神经符号系统实现逻辑推理。

通过这个训练流程,AI大模型最终成为一个基于统计规律的超级语言艺术家——它能写出媲美人类的诗句,却不知樱花飘落的美感;能解答复杂数学题,却不理解数字的真实意义。这种特性既是当前AI的魔力所在,也是人类需要谨慎对待的技术边界 。

相关文章:

[AI概念域] AI 大模型是如何被训练出来的?(通俗解读)

说明:这里使用 学生成长五部曲 比喻带你理解大模型如何从零开始学会思考。 AI大模型的训练过程可分为四个核心阶段: 首先进行海量数据收集与清洗,如同为“学生”准备涵盖各领域知识的教材库;接着通过预训练让模型完成“填空题”…...

Mellanox的LAG全称是什么?网卡的创建机制如何?(Link Aggregation Group 链路聚合组)

背景 对于双端口的网卡,有时候有将链路聚合的需求。在Mellanox网卡上通过LAG提供。对于RoCE的报文在Mellanox上也可以通过LAG来完成报文收发,叫做RoCE over LAG。但是仅仅适用于双端口卡。 关键点 LAG: Link Aggregation Group (LAG) 链路…...

【最大通过数——二分】

题目 代码 #include<bits/stdc.h> using namespace std; using ll long long;const int N 2e510;int n, m, k; ll a[N], b[N];bool check(int mid) {for(int i 0; i < mid; i){if(i > n) break;if(mid-i > m) continue;if(a[i] b[mid-i] < k) return tr…...

Liunx系统中FTP与NFS

目录 一、FTP文件传输协议 1.1、FTP工作原理 1.2、FTP状态码 1.3、FTP用户类型 1.4、FTP软件vsftpd 1.4.1、安装vsftpd 1.4.2、vsftpd配置文件 二、NFS网络文件系统 2.1、NFS工作原理 2.2、NFS软件 2.3、NFS共享配置文件格式 2.4、NFS相关命令 2.4.1、exportfs 2.…...

uniapp 测试 IPA 包安装到测试 iPhone

将uniapp测试IPA包安装到测试iPhone有以下几种方法&#xff1a; 使用Xcode安装 确保计算机上安装了Xcode&#xff0c;并将iOS设备通过数据线连接到计算机。打开Xcode&#xff0c;在菜单栏中选择Window->Devices and Simulators&#xff0c;在设备列表中找到要安装的iPhone…...

结构体指针传递给函数注意事项

在 C 语言中&#xff0c;传递结构体指针给函数是一种常见且高效的编程方式。不过&#xff0c;在实际操作时&#xff0c;有一些重要的注意事项需要留意&#xff0c;下面为你详细介绍&#xff1a; 1. 避免空指针引用 在函数内部使用结构体指针前&#xff0c;要先检查该指针是否为…...

mfy学习笔记

创建表并导入数据 CREATE TABLE sales (id INT,salesperson STRING,region STRING,sales_amount INT,sale_date DATE );INSERT INTO sales (id, salesperson, region, sales_amount, sale_date) VALUES (1, Alice, North, 1000, 2023-01-01), (2, Bob, South, 1500, 2023-01-0…...

C语言--文件操作

第16讲&#xff1a;文件操作 1. 为什么使用文件&#xff1f; 如果没有文件&#xff0c;我们写的程序的数据是存储在电脑的内存中&#xff0c;如果程序退出&#xff0c;内存回收&#xff0c;数据就丢失了&#xff0c;等再次运行程序&#xff0c;是看不到上次程序的数据的&…...

网络安全内参

在我的IT职业生涯的早期&#xff0c;Sun Microsystems被认为是一个计算机梦想家。Sun很早就创造了一个有趣的公司口号:“The network is the computer.”这是什么意思&#xff1f;这意味着IT基础设施以松散耦合的体系结构连接在一起&#xff0c;通过以太网电缆和TCP/IP协议等网…...

C++大整数类的设计与实现

1. 简介 我们知道现代的计算机大多数都是64位的&#xff0c;因此能处理最大整数为 2 64 − 1 2^{64}-1 264−1。那如果是超过了这个数怎么办呢&#xff0c;那就需要我们自己手动模拟数的加减乘除了。 2. 思路 我们可以用一个数组来存储大数&#xff0c;数组中的每一个位置表…...

在 macOS 系统上安装 kubectl

在 macOS 系统上安装 kubectl 官网&#xff1a;https://kubernetes.io/zh-cn/docs/tasks/tools/install-kubectl-macos/ 用 Homebrew 在 macOS 系统上安装 如果你是 macOS 系统&#xff0c;且用的是 Homebrew 包管理工具&#xff0c; 则可以用 Homebrew 安装 kubectl。 运行…...

【人工智能】蓝耘智算平台盛大发布DeepSeek满血版:开创AI推理体验新纪元

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀ 蓝耘智算平台 蓝耘智算平台核心技术与突破元生代推理引擎快速入门&#xff1a;三步调用大模型接口&#xff0c;OpenAI SDK无缝兼容实战用例文…...

构建数据治理闭环:DAMA视角下的全流程实践与价值变现

随着数字经济的迅速发展&#xff0c;数据已成为企业核心资产&#xff0c;高效的数据治理体系正变得至关重要。本文基于DAMA理论&#xff0c;从数据资产入表、分类分级、确权登记到元数据管理、数据质量监控&#xff0c;再到数据集成、互操作及主数据管理&#xff0c;全流程构建…...

《深度剖析:AI与姿态估计技术在元宇宙VR交互中的应用困境》

在元宇宙的宏大版图里&#xff0c;虚拟现实&#xff08;VR&#xff09;交互是构建沉浸式体验的关键支柱&#xff0c;而人工智能&#xff08;AI&#xff09;与姿态估计技术的融合&#xff0c;本应成为提升交互体验的强大引擎。但在实际应用中&#xff0c;它们面临着诸多复杂且棘…...

【Python LeetCode】面试经典 150 题

数组 / 字符串快慢指针&#xff08;双指针&#xff09;总结88. 合并两个有序数组27. 移除元素26. 删除有序数组中的重复项80. 删除有序数组中的重复项 II Boyer-Moore 投票算法169. 多数元素扩展&#xff1a;寻找 n/3 多数元素 翻转法189. 轮转数组 贪心121. 买卖股票的最佳时机…...

2011-2019年各省乡镇综合文化站机构数数据

2011-2019年各省乡镇综合文化站机构数数据 1、时间&#xff1a;2011-2019年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;行政区划代码、地区、年份、乡镇综合文化站机构数 4、范围&#xff1a;31省 5、指标解释&#xff1a;乡镇综合文化站是中国基层文化…...

LeetCode 热题100 226. 翻转二叉树

LeetCode 热题100 | 226. 翻转二叉树 大家好&#xff0c;今天我们来解决一道经典的算法题——翻转二叉树。这道题在 LeetCode 上被标记为简单难度&#xff0c;要求我们翻转一棵二叉树&#xff0c;并返回其根节点。下面我将详细讲解解题思路&#xff0c;并附上 Python 代码实现…...

mysql 拼接多行合并为一行

如图所示&#xff0c;在variety相同的前提下拼接rating为ratingList&#xff0c;year_term为yearTermList sql如下&#xff1a; SELECT variety,GROUP_CONCAT(rating ORDER BY rating SEPARATOR ,) AS ratingList,GROUP_CONCAT(year_term ORDER BY year_term SEPARATOR…...

【Java项目】基于Spring Boot的论坛管理系统

【Java项目】基于Spring Boot的论坛管理系统 技术简介&#xff1a;采用Java技术、Spring Boot框架、MySQL数据库等实现。 系统简介&#xff1a;论坛管理系统是一个基于Web的在线平台&#xff0c;主要分为前台和后台两大功能模块。前台功能模块包括&#xff08;1&#xff09;首…...

unity学习54:图片+精灵+遮罩mask,旧版文本 text 和新的TMP文本

目录 1 图片 image 1.1 如果直接导入image 1.2 图片 image 和精灵 sprite 1.2.1 继续修改上面的格式 texture type 是default 1.2.2 再次关联到UI的 image 物体上就可以了 1.3 图片和遮罩 mask 1.3.1 创建1个父物体和1个子物体&#xff0c;分别都是image 1.3.2 如果父…...

DockerHub与私有镜像仓库在容器化中的应用与管理

哈喽&#xff0c;大家好&#xff0c;我是左手python&#xff01; Docker Hub的应用与管理 Docker Hub的基本概念与使用方法 Docker Hub是Docker官方提供的一个公共镜像仓库&#xff0c;用户可以在其中找到各种操作系统、软件和应用的镜像。开发者可以通过Docker Hub轻松获取所…...

Opencv中的addweighted函数

一.addweighted函数作用 addweighted&#xff08;&#xff09;是OpenCV库中用于图像处理的函数&#xff0c;主要功能是将两个输入图像&#xff08;尺寸和类型相同&#xff09;按照指定的权重进行加权叠加&#xff08;图像融合&#xff09;&#xff0c;并添加一个标量值&#x…...

Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务

通过akshare库&#xff0c;获取股票数据&#xff0c;并生成TabPFN这个模型 可以识别、处理的格式&#xff0c;写一个完整的预处理示例&#xff0c;并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务&#xff0c;进行预测并输…...

什么是库存周转?如何用进销存系统提高库存周转率?

你可能听说过这样一句话&#xff1a; “利润不是赚出来的&#xff0c;是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业&#xff0c;很多企业看着销售不错&#xff0c;账上却没钱、利润也不见了&#xff0c;一翻库存才发现&#xff1a; 一堆卖不动的旧货…...

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现&#xff0c;这取决于你是想在组件内部直接设置&#xff0c;还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法&#xff1a; 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

镜像里切换为普通用户

如果你登录远程虚拟机默认就是 root 用户&#xff0c;但你不希望用 root 权限运行 ns-3&#xff08;这是对的&#xff0c;ns3 工具会拒绝 root&#xff09;&#xff0c;你可以按以下方法创建一个 非 root 用户账号 并切换到它运行 ns-3。 一次性解决方案&#xff1a;创建非 roo…...

【学习笔记】深入理解Java虚拟机学习笔记——第4章 虚拟机性能监控,故障处理工具

第2章 虚拟机性能监控&#xff0c;故障处理工具 4.1 概述 略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具 命令&#xff1a;jps [options] [hostid] 功能&#xff1a;本地虚拟机进程显示进程ID&#xff08;与ps相同&#xff09;&#xff0c;可同时显示主类&#x…...

使用Spring AI和MCP协议构建图片搜索服务

目录 使用Spring AI和MCP协议构建图片搜索服务 引言 技术栈概览 项目架构设计 架构图 服务端开发 1. 创建Spring Boot项目 2. 实现图片搜索工具 3. 配置传输模式 Stdio模式&#xff08;本地调用&#xff09; SSE模式&#xff08;远程调用&#xff09; 4. 注册工具提…...

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南&#xff1a;从入门到实战 一、Grunt 是什么&#xff1f; Grunt是一个基于 Node.js 的前端自动化任务运行器&#xff0c;主要用于自动化执行项目开发中重复性高的任务&#xff0c;例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

tomcat指定使用的jdk版本

说明 有时候需要对tomcat配置指定的jdk版本号&#xff0c;此时&#xff0c;我们可以通过以下方式进行配置 设置方式 找到tomcat的bin目录中的setclasspath.bat。如果是linux系统则是setclasspath.sh set JAVA_HOMEC:\Program Files\Java\jdk8 set JRE_HOMEC:\Program Files…...