当前位置: 首页 > article >正文

AI大模型科普:从零开始理解AI的“超级大脑“,以及如何用好提示词?

大家好,小机又来分享AI了。

今天分享一些新奇的东西,

你有没有试过和ChatGPT聊天时,心里偷偷犯嘀咕:"这AI怎么跟真人一样对答如流?它真的会思考吗?" 或者刷到技术文章里满屏的"Token""微调""LoRA"时,瞬间感觉在看火星文?

别慌!这感觉就像第一次看到智能手机——明明知道它厉害,但那些专业术语让人望而却步。

其实大模型的秘密,用大白话就能讲明白! 

准备好了吗?咱们这就开始剥开大模型的"洋葱皮"!


一、大模型基础概念拆解

1. 什么是Token?

Token可以看作是语言的“积木块”,每个Token都是语言的最小单元,类似于我们在玩乐高积木时的一块小积木。

想象你在玩乐高,每一块小积木都代表了一个元素,拼接起来才构成完整的模型。语言也是如此,当你输入一个句子时,计算机将其拆分成一个个Token,便于进行分析和处理。

比如在中文中,"深度学习"这个词会被拆分成【深】【度】【学】【习】四个Token;而在英文中,"This is a input text."则通常拆成【This】和【is】,【a】,【input】,【.】多个Token。

图片

这个拆分过程可以帮助计算机更好地理解每个词的意思和它们之间的关系。

一个实用的小技巧是,当你在ChatGPT里输入长句时,注意它可能会根据不同的规则来拆分句子中的词语,这种拆分方式可能和你自己理解的有些不同。

所以,了解Token的概念能够帮助你更好地理解计算机是如何处理语言的,也能帮助你更精准地与AI进行互动。

2. 模型通信三兄弟

大模型的训练就像在经营一个物流公司,它需要合理的运输方案来处理海量的数据。

为了让训练过程更高效,大模型使用了三种不同的“运输方案”,分别是DP(数据并行)、PP(流水线并行)和TP(张量并行)。

这些方案帮助将训练任务分配给多个计算节点(类似于卡车、工人或快递员),提高效率并减少时间和资源消耗。

DP(数据并行)

就像是将100箱货物分给10辆卡车同时送。每辆卡车负责运送相同数量的货物,但每辆卡车装载的内容是不同的。

对于大模型来说,数据并行意味着把训练数据分成多个小批次,并将这些批次同时送到多个计算设备上处理。

这样可以加速处理过程,尤其是在数据量非常大的时候,能够有效提高训练效率。

PP(流水线并行)

类似于工厂流水线的工作方式,不同的车间处理不同的工序。每个计算设备负责模型训练的一个特定阶段,类似于流水线的各个环节。

通过流水线并行,可以最大化设备的利用率,减少等待时间,让每个阶段的计算任务都能高效地完成。

TP(张量并行)

则像是把一个超大的箱子拆成多个小件,分别交给多个快递员来搬运。对于一些超大模型,单个设备无法处理那么庞大的数据量。

张量并行通过将模型拆分成多个小部分,分别交给不同的计算单元来处理,最终再将结果组合起来。

这个方法特别适用于“巨无霸”模型,可以有效解决计算资源不足的问题。

DP适合于大规模的数据处理,PP优化了计算流程中的时效性,而TP则专门解决了超大模型的训练问题。

这三种方法在不同的场景下各有优势,共同帮助大模型在训练过程中更加高效和精确。

3. 关键术语闪电战

微调可以理解为给AI上补习班,目的是让它掌握特定的技能或领域知识。

就像一个学生在上完通识课程后,如果他想成为法律专家,就需要进行针对性的学习和训练。通过微调,AI在预先训练好的基础上,使用新的专业数据进一步训练,使得它能够专门应对某些领域的任务,比如法律咨询、医学诊断等。

例如,我们可以把一个通用的ChatGPT模型,通过微调,让它变成一个“法律咨询专家”,使得它在法律领域能够回答更为准确和专业的问题。

LoRA(Low-Rank Adaptation)则是另一种优化方法,它就像是给AI戴上了一副“知识增强眼镜”。

与传统的微调方法不同,LoRA通过只调整模型的一部分参数,而不是对整个模型进行训练,来实现对新知识的学习。

这样一来,AI能够在保持原有知识的同时,迅速吸收新领域的知识。LoRA的优势非常明显:训练速度可以提升3倍,显存占用减少了70%。

这一点对于大规模模型尤其重要,因为它能够大大降低硬件资源的需求,同时提升训练的效率。

微调是通过系统的再训练让AI更专业,LoRA则是通过更高效的方式来让AI快速掌握新知识,而两者都能帮助提升AI在特定任务中的表现。

1. 四大核心能力
  • 文本生成:输入“写首关于春天的诗”,AI秒变文艺青年

示例输出:

樱花纷落键盘轻,代码如泉涌不停

春风不解程序员,偏把Bug藏绿荫

  • 多模态处理:CLIP模型看一眼猫咪图片,就能匹配“毛茸茸的捕鼠高手”文字

  • 代码生成:对Code Llama说“用Python画个爱心”,直接生成可运行代码

  • 涌现能力:当模型参数超过1000亿,突然会解微积分题——就像小孩突然会骑自行车

2. 商业应用雷达图
  • 智能客服
    → 黄金话术:“请用不超过20字解释5G套餐”
    → 避坑指南:一定要设置“转人工”触发词

  • 内容创作
    → 爆款标题公式:“3个{领域}技巧,让你{收获}翻倍”
    → 案例:输入“生成小红书风格的美妆文案”,获得带emoji的种草文

  • 数据分析
    → 神奇指令:“帮我把这份销售数据总结成3点结论”
    → 防翻车口诀:数据描述越具体,输出结果越靠谱


三、小白实践指南

1. 零代码体验路径
  • 3个免费用大模型的平台

  1. ChatGPT(网页直接聊)

图片

  1. 文心一言(中文场景特化)

图片

  • 新手提示词模板
    "假设你是{角色},请用{风格}帮我{任务},要求{具体条件}" 示例: "假设你是旅行达人,请用幽默语气帮我规划杭州三日游,要求包含小众景点"


结语

看完这篇,你已经完成了大模型学习的关键三步
1️⃣ 看懂了专业术语的“人话版”
2️⃣ 见识了AI的十八般武艺
3️⃣ 掌握了立刻能用的实战技巧

 小机的愿景是成为 AI 提示词与AI大模型的布道者,带领 更多 小白入门 AI,让更多的人在已经到来的 AI 时代不掉队,不被 AI 淘汰。

我也期望能遇到更多优秀的自媒体创作者,期待与大家一起进步!

如果您对AI大模型充满好奇,想要了解更多关于它的信息,不妨联系我进行交流,我将为你带来更多的大模型相关知识。我是小机学AI大模型,一个专注于输出 AI+ 提示词和AI + 大模型,AI编程内容的学者,关注我一起进步。

@小机

对了,如果您有AI方面的问题,或者有对AI其他方面感兴趣的地方,也欢迎通过下面的链接加我好友一起交流,我会送您一份领价值499元的AI资料,帮助您入门AI。

原文链接:

AI大模型科普:从零开始理解AI的"超级大脑",以及如何用好提示词?(附赠书活动)大模型到底是如何工作的?https://mp.weixin.qq.com/s/QmNUFb6rJXzsJzswhF8sTQ

相关文章:

AI大模型科普:从零开始理解AI的“超级大脑“,以及如何用好提示词?

大家好,小机又来分享AI了。 今天分享一些新奇的东西, 你有没有试过和ChatGPT聊天时,心里偷偷犯嘀咕:"这AI怎么跟真人一样对答如流?它真的会思考吗?" 或者刷到技术文章里满屏的"Token"…...

STM32单片机入门学习——第40节: [11-5] 硬件SPI读写W25Q64

写这个文章是用来学习的,记录一下我的学习过程。希望我能一直坚持下去,我只是一个小白,只是想好好学习,我知道这会很难,但我还是想去做! 本文写于:2025.04.18 STM32开发板学习——第一节: [1-1]课程简介第40节: [11-5] 硬件SPI读…...

【Java学习笔记】关键字汇总

Java 关键字汇总 用于定义数据类型的关键字: classinterfaceenumbyteshortintlongfloatdoublecharbooleanvoid 用于定义数据值的关键字: truefalsenull 用于定义流程控制的关键字: ifelseswitchcasedefaultwhiledoforbreakcontinueretu…...

langgraph框架之初识

1.什么是langgraph? LangGraph 是一个用于构建可控代理的底层编排框架。在AI中,代理也就是执行动作的智能体,也就是agent。使用这个框架可以构建一个可以自由控制的智能执行体,它可以帮我们做许多事情,如下&#xff1…...

如何将 .txt 文件转换成 .md 文件

一、因为有些软件上传文件的时候需要 .md 文件,首先在文件所在的目录中,点击“查看”,然后勾选上“文件扩展名”,这个时候该目录下的所有文件都会显示其文件类型了。 二、这时直接对目标的 .txt 文件进行重命名,把后缀…...

pdfjs库使用记录1

import React, { useEffect, useState, useRef } from react; import * as pdfjsLib from pdfjs-dist; // 设置 worker 路径 pdfjsLib.GlobalWorkerOptions.workerSrc /pdf.worker.min.js; const PDFViewer ({ url }) > { const [pdf, setPdf] useState(null); const […...

Qt 创建QWidget的界面库(DLL)

【1】新建一个qt库项目 【2】在项目目录图标上右击,选择Add New... 【3】选择模版:Qt->Qt设计师界面类,选择Widget,填写界面类的名称、.h .cpp .ui名称 【4】创建C调用接口(默认是创建C调用接口) #ifnd…...

Django REST framework 并结合 `mixin` 的示例

下面为你提供一个使用 Django REST framework 并结合 mixin 的示例,该示例将实现一个简单的图书管理 API。 项目需求 我们要创建一个图书管理系统的 API,支持对图书信息的创建、读取、更新和删除操作。 实现步骤 1. 项目初始化 首先,确保你已经安装了 Django 和 Django…...

linux查看及修改用户过期时间

修改用户有效期 密码到期时间 sudo chage -E 2025-12-31 username sudo chage -M 180 username sudo chage -d $(date %F) username 查询用户密码到期时间 for user in $(cat /etc/passwd |cut -d: -f1); do echo $user; chage -l $user | grep "Password expires"; …...

Vue.directive自定义v-指令

翻阅文章有感,记录学习 vue前端菜单权限控制_vue权限管理菜单思路-CSDN博客 一、定义:Vue.directive是Vue框架中给开发者用于注册自定义指令和返回已注册指令的API 二、基本语法: // 注册 Vue.directive(my-directive, {bind: function () …...

AI Agent 元年,于 2025 开启

私人博客传送门 AI Agent 元年,于 2025 开启 | 魔筝炼药师...

Django 自带开发服务器

$ python manage.py runserver $ python manage.py runserver 666 # 用 666 端口 $ python manage.py runserver 0.0.0.0:8000 # 让局域网内其他客户端也可访问 $ python manage.py runserver --skip-checks # 跳过检查自动检查 $ python manage.py runserver --…...

Spring 数据库编程

Spring JDBC 传统的JDBC在操作数据库时,需要先打开数据库连接,执行SQL语句,然后封装结果,最后关闭数据库连接等资源。频繁的数据库操作会产生大量的重复代码,造成代码冗余,Spring的JDBC模块负责数据库资源…...

进阶篇|CAN FD 与性能优化

引言 1. CAN vs. CAN FD 对比 2. CAN FD 帧结构详解...

CTF--各种绕过哟

一、原网页&#xff1a; 二、步骤&#xff1a; 1.源代码&#xff1a; <?php highlight_file(flag.php); $_GET[id] urldecode($_GET[id]); $flag flag{xxxxxxxxxxxxxxxxxx}; if (isset($_GET[uname]) and isset($_POST[passwd])) {if ($_GET[uname] $_POST[passwd])pr…...

【Pandas】pandas DataFrame where

Pandas2.2 DataFrame Indexing, iteration 方法描述DataFrame.head([n])用于返回 DataFrame 的前几行DataFrame.at快速访问和修改 DataFrame 中单个值的方法DataFrame.iat快速访问和修改 DataFrame 中单个值的方法DataFrame.loc用于基于标签&#xff08;行标签和列标签&#…...

嵌入式ARM RISCV toolchain工具 梳理arm-none-eabi-gcc

嵌入式TOOLchain工具 梳理 简介 本文总结和梳理一下一些toolchain的规则和原理&#xff0c;方便后续跨平台的时候&#xff0c;给大家使用toolchain做一个参考。 解释如何理解arm-none-eabi-gcc等含义&#xff0c;以及如何一看就知道该用什么编译器。 当然如果有哪里写的不是…...

OpenBMC:BmcWeb log输出

BmcWeb的log函数定义于:http\logging.hpp 说实话,个人觉得这一版的log函数有点炫技,使用起来也没有之前的版本方便,不过也还是值的参考一下。 1.如何输出log BMCWEB_LOG_ERROR("GetAll on path {} iface {} service {} failed with code {}",objectPath, inte…...

复现SCI图像增强(Toward fast, flexible, and robust low-light image enhancement.)

运行train.py报错 > File "/home/uriky/桌面/SCI-main/SCI-main/train.py", line 105, in main > train_queue torch.utils.data.DataLoader( File "/home/uriky/anaconda3/envs/AA/lib/python3.8/site-packages/torch/utils/data/dataloader.py&q…...

深入理解C++中string的深浅拷贝

目录 一、引言 二、浅拷贝与深拷贝的基本概念 2.1 浅拷贝 2.2 深拷贝 在C 中&#xff0c; string 类的深浅拷贝有着重要的区别。 浅拷贝 深拷贝 string 类中的其他构造函数及操作 resize 构造 构造&#xff08;赋值构造&#xff09; 构造&#xff08;拼接构造&#xf…...

性能测试面试题的详细解答

以下是性能测试面试题的详细解答&#xff1a; 1. 性能测试的流程是怎样的&#xff1f; 性能测试流程通常包括以下几个步骤&#xff1a; - **需求分析**&#xff1a;明确测试目标、性能指标&#xff08;如响应时间、吞吐量等&#xff09;。 - **环境搭建**&#xff1a;搭建测试环…...

第八篇:系统分析师第三遍——3、4章

目录 一、目标二、计划三、完成情况四、意外之喜(最少2点)1.计划内的明确认知和思想的提升标志2.计划外的具体事情提升内容和标志 五、总结 一、目标 通过参加考试&#xff0c;训练学习能力&#xff0c;而非单纯以拿证为目的。 1.在复习过程中&#xff0c;训练快速阅读能力、掌…...

Unity粒子特效打包后不显示

1.粒子发mesh&#xff0c;如果打包后不显示&#xff0c;尝试勾选r/w 2.如果还不行&#xff0c;mesh重做&#xff0c;目前发现ab包打出的&#xff0c;有的mesh会出问题&#xff0c;暂时原因不详。...

PFC 是什么?

现在进行液晶电视机和等离子电视机电路分析时、故障维修时&#xff0c;都经常的提到“PFC 电路”一词&#xff0c;这 在早期的电视机中是没有的&#xff0c;早期维修电视机的师傅从来没有接触过的&#xff0c;但是 PFC 电路是目前液晶电视机 和等离子电视机中不可缺少的电路。那…...

6.5 GitHub监控系统实战:双通道采集+动态调度打造高效运维体系

GitHub Sentinel Agent 定期更新功能设计与实现 关键词:GitHub API 集成、定时任务调度、Python 爬虫开发、SMTP 邮件通知、系统稳定性保障 1. GitHub 项目数据获取功能 1.1 双通道数据采集架构设计 #mermaid-svg-ZHJIMXcMAyDHVhmV {font-family:"trebuchet ms",v…...

楼梯上下检测数据集VOC+YOLO格式5462张2类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;5462 标注数量(xml文件个数)&#xff1a;5462 标注数量(txt文件个数)&#xff1a;5462 …...

消防营区管控:从智能仓储、装备管理、应急物资调用等多维度出发

近期&#xff0c;一系列消防安全热点事件引发了社会各界的广泛关注。某老旧城区的一场火灾&#xff0c;由于消防通道被杂物堵塞&#xff0c;消防车辆无法及时靠近火源&#xff0c;加之周边消防设施老化&#xff0c;灭火物资储备不足&#xff0c;导致火势迅速蔓延&#xff0c;造…...

Flutter 自定义插件基础

1、Flutter插件是什么&#xff1f;官方插件库 在开发Flutter应用过程中会涉及到平台相关接口调用&#xff0c;例如数据库操作、相机调用、外部浏览器跳转等业务场景。其实Flutter自身并不支持直接在平台上实现这些功能&#xff0c;而是通过插件包接口去调用指定平台API从而实现…...

解锁古籍中的气候密码,探索GPT/BERT在历史灾害研究中的前沿应用;气候史 文本挖掘 防灾减灾;台风案例、干旱案例、暴雨案例

历史灾害文献分析方法论的研究&#xff0c;是连接过去与未来的关键桥梁。通过对古籍、方志、档案等非结构化文本的系统性挖掘与量化分析&#xff0c;不仅能够重建千年尺度的灾害事件序列&#xff08;如台风、洪旱等&#xff09;&#xff0c;弥补仪器观测数据的时空局限性&#…...

【java 13天进阶Day12】XML和Dom4j,装饰模式,工厂模式,commons-io工具包,Base64

XML XML 指可扩展标记语言&#xff08;EXtensible Markup Language&#xff09;&#xff0c;由各种标记(元素标签)组成。 可扩展&#xff1a;所有的标签都是自定义的&#xff0c;可以随意扩展的&#xff0c;如 。 XML 是一种标记语言&#xff0c;很类似 HTML&#xff0c;HTML…...