ChatGPT的大致原理
国外有个博主写了一篇博文,名字叫TChatGPT: Explained to KidsQ」,
直译过来就是,给小孩子解释什么是ChatGPT。

因为现实是很多的小孩子已经可以用父母的手机版ChatGPT玩了
,ChatGPT几乎可以算得上无所不知,起码给小孩子讲故事,回
答一些简单的回答不在话下。其实这里面就涉及到ChatGPT的一
个最最基本也是核心的功能,就是问答,而这个问答功能就是第
一代ChatGPT非常的简单直接,你打字给它,它输出给你。比如
你输入你好,它会随机的给出「吗」,「高」,「美」等回答,这
些回答选项取决于你们之前的对话内容。

这个阶段的ChatGPT是大语言模型,它的特点就是只能接受文字
输入,并且也只能以文字输入。中文,英文,数字或者是代码,其
本质上都是文字,那么其实最主要的问题就是为什么ChatGPT能理
解我们说的话,同时还能基本上回答出让我们满意甚至是惊艳的回
答。我们其实可以用一句老话来形容,那就是书读百遍,其义自现。
说白了就是读的多了,就算不懂某句古诗或者古文的意思,但是起
码是背下来了,直接背出来了。ChatGPT就是读了巨量的「书」,
这些资料有的来自于书籍,有的来自于互联网,总之它读了很多很
多的书,它的记忆里存储了大量的知识,这一点儿跟人类其实非常
的像。但是在回答的问题跟人类会有一些不同,比如我们在背诵古
诗词的时候,床前明月光Q,后面如果我们背下来了并且确定背的
对的话,后一句肯定接的是疑是地上霜。当然我们可以随便编一个
错误回答,比如唧唧复唧唧,我们是回答了,但是我们知道肯定是
瞎编的。但是ChatGPT在回答的时候不是这么思考的,它的学习资
料来自于公开的数据,如果所有的?里面床前明月光后面都是疑是地
上霜,那么你放心,它肯定可以回答的又快又对。不过事实上,互联
网上的资料不一定都对,有可能某一篇或者某几篇文章里面它的诗句
就是错的,那么ChatGPT就有一定的几率输出错误的回答。

特别是很多人都体验过,ChatGPT会胡乱的说作者名字。因为ChatGPT的
输出主要是靠概率,下一个字的输出取决于前面的内容,就还拿刚开始的
问题来举例。
就比如你好,后面可以跟很多的词。如果你看到一个人好像受伤了,坐在
地上,你应该会说:你好吗?如果你在篮球场碰到了一个身高2米以上的
运动员,你应该不会说你好吗或者你好美,而是你好高。你好美也同理。
我们就可以这么理解,ChatGPT是一个可以综合各种信息进行概率最大
化输出的人工智能模型。
这个时候我们可以讲一些细节。ChatGPT的名字分为两部分:Chat和GPT。
Chat是聊天的意思,GPT是Gene rative Pre-trained Transformer的首字母缩写。
其中Genrative是生成的意思,它的作用是可以创造或者生产一些新的东西;
Pre-trainedQ是它从大量的文本资料中学习而来,Transformer指的是一种人
工智能的模型。T不用关注,主要就看G和P这两个词就行。
我们主要用的就是它的Generative功能,用、来生成各种各样的内容;但是我们
需要知道方,么它可以生产各种内容,原因就在于P。只有学习了大量的内容,
才可以进行再生产。而这种学习其实是会有局限性了,很自然的,比如说你从
小学习了很多的知识,但你可以保证你对一个问题的回答是完全正确的吗?
几乎不可能,第一是知识的局限性,ChatGPT也一样,不可能掌握所有的知识;
第二是知识的准确性,怎么保证所有的知识都是准确无误的;第三是知识的复
杂性,同一个概念在不同的语境下有不同的体现,这种度别说AI,就连人都很
难完美把握。
能大致讲一下ChatGPT的原理…所以我们在使用ChatGPT的时候,也需要监督
ChatGPT输出内容的准确性,它大概率是没问题的,但是你要把它用在关键问
题上,就得人工再审核一遍。而现在的ChatGPT,其实已经升级过两次了,一
次是GPT4Q,具有更准确的回答能力,另一次是最近的GPT Turbo。现在的Ch
atGPT,是一种叫多模态的大模型它跟第一代不同的地方就在于它不仅可以接收
和输出文字,也可以接收其他类型的输入,比如图片,文档,视频等等,然后输
出也更加多样化除了文本之外,也可以输出图片或者文件等等。

这个「模」在这里就指的是不同的数据类型,为什么ChatGPT要做多模态,
本质上就是因为OpenAI做ChatGPT的初衷就是要做AGI。

而AGI又是什么呢,它的全名叫Artificial generalintelligence,通用人工智能。

它的特点就是可以在所有的任务中表现的跟人类相似。也可以简单的理解
为跟人类具有相近的智能程度,而像人类的话,起码可以跟人类一样做到几
件事,可以看东西,可以听东西,可以说东西也可以写东西。
第一代的ChatGPT只能看文字和写文字,其实远远摸不到AGI的边。
而多模态就是必要的实现路径,现在的ChatGPT可以看,看文字和看图片都
可以;可以听和说,这个功能已经在手机APP版本的ChatGPT中实现了,也
可以写,也就是输出东西,它可以写代码,写文章,也可以画画等等。
这就是为什么要做多模态的出发点,更重要的是这个世界本来就是多模态的,
很多东西很难用文字完全表述,比如如何形容一朵花都感觉不够完美,最简
单方法就是把照片拿出来看。
而多模态的ChatGPT就做的事这件事,接收:类型的输入并且输出各种类型的输出。
这篇问答主要的作用是通俗的解释了ChatGPT的运行原理,但是很多的细节并没
有涉及到,如果大家对于细节感兴趣,建议大家可以去看看深入学习一下。
相关文章:
ChatGPT的大致原理
国外有个博主写了一篇博文,名字叫TChatGPT: Explained to KidsQ」, 直译过来就是,给小孩子解释什么是ChatGPT。 因为现实是很多的小孩子已经可以用父母的手机版ChatGPT玩了 ,ChatGPT几乎可以算得上无所不知,起码给小孩…...
蓝桥杯备赛_python_BFS搜索算法_刷题学习笔记
1 bfs广度优先搜索 1.1 是什么 1.2怎么实现 2案例学习 2.1.走迷宫 2.2.P1443 马的遍历 2.3. 九宫重排(看答案学的,实在写不来) 2.4.青蛙跳杯子(学完九宫重排再做bingo) 2.5. 长草 3.总结 1 bfs广度优先搜索 【P…...
轮播图的五种写法(原生、vue2、vue3、react类组件,react函数组件)
轮播图效果是一种在网页或应用程序中展示多张图片或内容的方式,通常以水平或垂直的方式循环播放。本文使用原生、vue2、vue3、react类组件,react函数组件五种写法实现了简单的轮播图效果,需要更多轮播效果需要再增加样式或者动画。 淡入淡出效果:每张图片渐渐淡入显示,然后…...
【MySQL】高度为2和3时B+树能够存储的记录数量的计算过程
文章目录 题目答案高度为2时的B树高度为3时的B树总结 GPT4 对话过程 题目 InnoDB主键索引的Btree在高度分别为 2 和 3 时,可以存储多少条记录? 答案 高度为2时的B树 计算过程: 使用公式 ( n 8 ( n 1 ) 6 16 1024 ) (n \times 8 …...
软件著作书 60页代码轻松搞定!(附exe和代码)
最近做了一个软件,准备去申请软件著作书,看着那60页的文档,确实难搞,不过幸好会用一点点python,就自己用python写了一个读取所有文件代码的程序,使用起来也很简单,过来分享一下 链接࿱…...
阿里文档类图像的智能识别,文档分类自定义分类器
阿里云文档类图像智能识别服务为用户提供了强大的文档处理能力,可以将文档图像中的文本内容、表格数据和结构化信息自动识别并提取出来。而自定义分类器则允许用户根据自己的需求,训练出更适合自己场景的文档分类模型。本文将详细介绍阿里云文档类图像智…...
256.【华为OD机试真题】会议室占用时间(区间合并算法-JavaPythonC++JS实现)
🚀点击这里可直接跳转到本专栏,可查阅顶置最新的华为OD机试宝典~ 本专栏所有题目均包含优质解题思路,高质量解题代码(Java&Python&C++&JS分别实现),详细代码讲解,助你深入学习,深度掌握! 文章目录 一. 题目二.解题思路三.题解代码Python题解代码JAVA题解…...
人工智能学习与实训笔记(三):神经网络之目标检测问题
人工智能专栏文章汇总:人工智能学习专栏文章汇总-CSDN博客 目录 三、目标检测问题 3.1 目标检测基础概念 3.1.1 边界框(bounding box) 3.1.2 锚框(Anchor box) 3.1.3 交并比 3.2 单阶段目标检测模型YOLOv3 3.2…...
SSM框架,Spring-ioc的学习(下)
拓展:在xml文件中读取外部配置文件 例:若要导入外部配置文件jdbc.properties <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"<http://www.springframework.org/schema/beans>"xmlns:xsi"&l…...
【AIGC】Stable Diffusion的模型微调
为什么要做模型微调 模型微调可以在现有模型的基础上,让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。Stable Diffusion 模型的微调方法通常依赖于您要微调的具体任务和数据。 下面是一个通用的微调过程的概述: 准备数据集…...
VNCTF 2024 Web方向 WP
Checkin 题目描述:Welcome to VNCTF 2024~ long time no see. 开题,是前端小游戏 源码里面发现一个16进制编码字符串 解码后是flag CutePath 题目描述:源自一次现实渗透 开题 当前页面没啥好看的,先爆破密码登录试试。爆破无果…...
第11章 GUI
11.1 Swing概述 Swing是Java语言开发图形化界面的一个工具包。它以抽象窗口工具包(AWT)为基础,使跨平台应用程序可以使用可插拔的外观风格。Swing拥有丰富的库和组件,使用非常灵活,开发人员只用很少的代码就可以创建出…...
综合项目---博客
一.运行环境 192.168.32.132 Server-Web linux Web 192.168.32.133 Server-NFS-DNS linux NFS/DNS 基础配置 1.配置主机名静态ip 2.开启防火墙并配置 3.部分开启selinux并配置 4.服务器之间通过阿里云进行时间同步 5.服务器之间实现ssh免密…...
leetcode(矩阵)74. 搜索二维矩阵(C++详细解释)DAY7
文章目录 1.题目示例提示 2.解答思路3.实现代码结果 4.总结 1.题目 给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非严格递增顺序排列。每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target ,如果 target 在矩阵中…...
超详细||YOLOv8基础教程(环境搭建,训练,测试,部署看一篇就够)(在推理视频中添加FPS信息)
一、YOLOv8环境搭建 这篇文章将跳过基础的深度学习环境的搭建,如果没有完成的可以看我的这篇博客:超详细||深度学习环境搭建记录cudaanacondapytorchpycharm-CSDN博客 1. 在github上下载源码: GitHub - ultralytics/ultralytics: NEW - YO…...
LeetCode171. Excel Sheet Column Number
文章目录 一、题目二、题解 一、题目 Given a string columnTitle that represents the column title as appears in an Excel sheet, return its corresponding column number. For example: A -> 1 B -> 2 C -> 3 … Z -> 26 AA -> 27 AB -> 28 … Exa…...
pycharm创建py文件,自动带# -*- coding:utf-8 -*-
File–Settings...
希捷与索尼集团合作生产HAMR写头激光二极管
最近有报道指出,希捷(Seagate)在生产其采用热辅助磁记录(HAMR)技术的大容量硬盘时,并非所有组件都在内部制造。根据日经新闻的一份新报告,希捷已与索尼集团合作,由索尼为其HAMR写头生…...
电脑竖屏显示了怎么回复原状
电脑屏幕变成这样 怎么恢复原状? 1、登录系统 2、在桌面上空白点击鼠标右键 3、在右键菜单中选择“屏幕分辨率”,左键点击打开 4、在窗口中“方向”位置选择“横向” 5、保存设置win7桌面即可恢复到正常状态...
Elasticsearch从入门到精通
目录 🧂1.简单介绍 🥓2.安装与下载 🌭3.安装启动es 🍿4.安装启动kibana 🥞5.初步检索 🧈6.进阶检索 🫓7.Elasticsearch整合 1.简单介绍🚗🚗🚗 Elat…...
docker详细操作--未完待续
docker介绍 docker官网: Docker:加速容器应用程序开发 harbor官网:Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台,用于将应用程序及其依赖项(如库、运行时环…...
JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作
一、上下文切换 即使单核CPU也可以进行多线程执行代码,CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短,所以CPU会不断地切换线程执行,从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...
DeepSeek 技术赋能无人农场协同作业:用 AI 重构农田管理 “神经网”
目录 一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析 三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍 四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度 五、实际案例大…...
【无标题】路径问题的革命性重构:基于二维拓扑收缩色动力学模型的零点隧穿理论
路径问题的革命性重构:基于二维拓扑收缩色动力学模型的零点隧穿理论 一、传统路径模型的根本缺陷 在经典正方形路径问题中(图1): mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...
JavaScript 数据类型详解
JavaScript 数据类型详解 JavaScript 数据类型分为 原始类型(Primitive) 和 对象类型(Object) 两大类,共 8 种(ES11): 一、原始类型(7种) 1. undefined 定…...
uniapp 字符包含的相关方法
在uniapp中,如果你想检查一个字符串是否包含另一个子字符串,你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的,但它们在处理方式和返回值上有所不同。 使用includes()方法 includes()方法用于判断一个字…...
解析奥地利 XARION激光超声检测系统:无膜光学麦克风 + 无耦合剂的技术协同优势及多元应用
在工业制造领域,无损检测(NDT)的精度与效率直接影响产品质量与生产安全。奥地利 XARION开发的激光超声精密检测系统,以非接触式光学麦克风技术为核心,打破传统检测瓶颈,为半导体、航空航天、汽车制造等行业提供了高灵敏…...
在树莓派上添加音频输入设备的几种方法
在树莓派上添加音频输入设备可以通过以下步骤完成,具体方法取决于设备类型(如USB麦克风、3.5mm接口麦克风或HDMI音频输入)。以下是详细指南: 1. 连接音频输入设备 USB麦克风/声卡:直接插入树莓派的USB接口。3.5mm麦克…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...
stm32进入Infinite_Loop原因(因为有系统中断函数未自定义实现)
这是系统中断服务程序的默认处理汇编函数,如果我们没有定义实现某个中断函数,那么当stm32产生了该中断时,就会默认跑这里来了,所以我们打开了什么中断,一定要记得实现对应的系统中断函数,否则会进来一直循环…...
