《ChatGPT原理最佳解释,从根上理解ChatGPT》
【热点】
2022年11月30日,OpenAI发布ChatGPT(全名:Chat Generative Pre-trained Transformer), 即聊天机器人程序 ,开启AIGC的研究热潮。
ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。
自从ChatGPT发布以后,大家对其的探索就从未停脚步,在这半年的时间里,其引发的关注、产生的影响、改变的方式,已经深深震撼广大的信息技术从业者,甚至有人提出了信息技术革命已经到来。
各目前,行各业已经开始思考如何在这“浪潮”之中让自己处于不败之地,毕竟ChatGPT已经开始改变人们的工作和思考的方式了。当然了,要利用好它就得充分了解和认识它,从现在从未来的角度来认识这个绝佳的“帮手”,纵观整个学术界和工业级对它的解释,讲解原理最为透彻的出版丛书就属于斯蒂芬·沃尔弗拉姆的《这就是ChatGPT》了。
【发展】
从最早的统计机器学习开始,我们走过了漫长的岁月。
过去十年多的时间,基于机器学习和深度学习打造的最强的工具就属于ChatGPT了,属于成功者中的“别人家的孩子”。许多学者觉得ChatGPT的成功不仅仅是因为其提供了一个聊天工具那么简单,更重要的是这个理论的成功,只要理论这条道路走得通,剩余的也就是脑指挥手的事情了。
对于这个高智能的系统来说,有时候在一些场景下的结果是令人不满意的,甚至会在简单的一些任务场景下进行“胡言乱语”,但我们知道这个大模型存在着巨大的潜力,随着新版的ChatGPT的迭代,那些明显的错误也就随着消失,但这并不意味着我们对“模型微调”将成为LLM大模型的主流之路,而应该将更多的工作放在了通用型人工智能(AGIC)的发展上。
回想起人工智能近些年的发展:
(1)1950年,图灵发表了论文《计算机器与智能》(Computing Machinery and Intelligence),提到了著名的“图灵测试”。
(2)2006年,深度学习概念被杰弗里·辛顿正式提,因此2006年被称为深度学习元年。
(3)2016年3月,AlphaGo战胜了韩国围棋选手李世石。
(4)2018年,OpenAI发布了GPT-1。
(5)2020年6月,OpenAI发布了GPT-3。
(6)2022年11月,OpenAI发布了ChatGPT3.5。
(7)2023年4月,OpenAI发布了ChatGPT4,进一步提升模型参数量。
这些标志性的事件无一在说明,人工智能的发展是多么的迅速,迅速是因为需求驱动。另外,这种迅速是建立在人们对于大模型真的可以带来变革的信心之上。
ChatGPT迅速走红之后,国内外的企业纷纷跟进,微软、腾讯、阿里、华为、百度都发布了自己的大模型,一些大模型也都给了试用的网址,走在最前方的清华大学的ChatGLM2-6B模型已经开源,真勇气也。
【解释】
在各方的报道之中,我们大体知道ChatGPT 的工作原理是基于自然语言处理技术,通过学习大量的人类对话和文本数据,从而掌握语言的语法、语义和上下文信息。在 ChatGPT 中,对话生成模型使用了基于GPT的指令微调技术,这是一种特殊的训练技术,能够使人工智能更好地理解人类的指令和意图。
微调技术是一种基于人类反馈的强化学习技术,它通过不断地接收人类的反馈,从而不断地优化模型的生成结果。在ChatGPT 中,当用户提出一个问题时,ChatGPT 会根据问题生成一个回答,然后根据用户的反馈进行调整,不断地提高回答的质量。
ChatGPT 还使用了基于人类反馈的强化学习技术(RLHF),这是一种能够让人工智能更好地理解人类意图的技术。通过 RLHF 技术,ChatGPT 能够学习到人类的喜好和厌恶,从而生成更符合人类需求的回答。
这些解释过于学术了,好在现在这本书《这就是ChatGPT》可以快速帮助我们了解ChatGPT的全貌,我们来看这本数的目录部分:
全书内容分为两大章:
(1)第一章从原理上对ChatGPT要使用到的相关技术进行讲解,如神经网络技术,词嵌入的原理等等。基于这些理论的解释和补充作者在最后总结出基于ChatGPT能够做啥,能为我们的生活和工作带来什么样的变化。
(2)第二章作者为ChatGPT赋予了思想,在Wolfram|Alpha的加持下,Wolfram|Alpha利用其自然语言理解能力转换为精确的 Wolfram语言,基于此形式的表示,为ChatGPT赋予计算超能力,可谓是大胆实践的先驱啊。另外本章节最后使用一些实例来让读者感受ChatGPT的魅力所在。
【未来】
这本书更多的是在介绍ChatGPT的原理部分,对于如何使用ChatGPT去进行二次开发没有过多的涉及,另外比较火热的模型微调也没有进行讲述,可能作者是为了留给读者自己进行学习和研究吧。虽然有一些内容这本书没有涉及,但是也不影响这本书作为解释ChatGPT相关知识的全面性和优势性质。
目前各大公司都在基于大模型LLM进行公司内部的开发,试图在内部原有系统上进行功能增广,提升员工工作效能。尤其ChatGLM-6B模型的开源之后,基于大模型来进行自己业务场景的搭建以及构建自身知识库对模型进行微调的工作将变得越来越多。
相信未来LLM,AIGC等的发展会为我们的工作、生活带来巨大的变化。
相关文章:

《ChatGPT原理最佳解释,从根上理解ChatGPT》
【热点】 2022年11月30日,OpenAI发布ChatGPT(全名:Chat Generative Pre-trained Transformer), 即聊天机器人程序 ,开启AIGC的研究热潮。 ChatGPT是人工智能技术驱动的自然语言处理工具,它能够…...

大数据Flink(五十):流式计算简介
文章目录 流式计算简介 一、数据的时效性 二、流式计算和批量计算...

13-4_Qt 5.9 C++开发指南_基于QWaitCondition 的线程同步_Wait
在多线程的程序中,多个线程之间的同步实际上就是它们之间的协调问题。例如上一小节讲到的3个线程的例子中,假设 threadDAQ 写满一个缓冲区之后,threadShow 和 threadSaveFile 才能对缓冲区进行读操作。前面采用的互斥量和基于 OReadWriteLock…...

STM32(HAL)多串口进行重定向(printf函数发送数据)
目录 1、简介 2.1 基础配置 2.1.1 SYS配置 2.1.2 RCC配置 2.2 串口外设配置 2.3 项目生成 3、KEIL端程序整合 4、效果测试 1、简介 在HAL库中,常用的printf函数是无法使用的。本文通过重映射实现在HAL库多个串口可进行类似printf函数的操作。 2.1 基础配置 2.…...

29_互联网(The Internet)(IP数据包;UDP;TCP;DNS;OSI)
上篇介绍了计算机网络的基础知识,也提到互联网(The Internet),本篇将会详细介绍互联网(The Internet)。 文章目录 1. 互联网(The Internet)组成及数据包传输过程2. IP 数据包的不足3…...

xShell常用命令
xShell常用命令 一、文件夹目录1、cd-更改目录2、mkdir-建立目录3、rm-删除目录4、pwd-查看当前路径5、rmdir-删除空目录 二、文件操作1、cat-显示文件内容2、diff-比较文件内容3、查看文件的名字和后缀4、ls-列出文件5、cp-复制文件6、mv-移动和重命名文件找不同:选…...

React性能优化之Memo、useMemo
文章目录 React.memo两种方式参数应用场景 拓展useMemouseMemo(calculateValue, dependencies) 参考资料 React.memo React 的渲染机制,组件内部的 state 或者 props 一旦发生修改,整个组件树都会被重新渲染一次,即时子组件的参数没有被修改&…...

IDEA开启并配置services窗口
前言: 一般一个spring cloud项目中大大小小存在几个十几个module编写具体的微服务项目。此时,如果要调试测需要依次启动各个项目比较麻烦。 方法一: 默认第一次打开项目的时候,idea会提示是否增加这个选项卡,如果你没…...

vue2企业级项目(三)
vue2企业级项目(三) 引入mockjs,i18n 1、mockjs 项目下载依赖 npm install --save-dev mock根目录创建mock文件夹,并创建mock/index.js import Mock from "mockjs";// 设置全局延时 没有延时的话有时候会检测不到数据…...

QT 在label上透明绘图
一、新建TransparentDemo工程 二、在界面上添加label,修改样式表,将底色置为红色,作为北京 三、新建一个TransparentLabel类,继承自QLabel 此时,工程包括文件 五、在transparentlabel.h中添加 头文件 #include …...

SAM(Segment Anything)大模型论文汇总
A Comprehensive Survey on Segment Anything Model for Vision and Beyond 论文:https://arxiv.org/abs/2305.08196 25页综述,198篇参考文献!52个开源项目!本文第一个全面回顾了分割一切模型(SAM)的研究和应用进展,…...

金融翻译难吗,如何做好金融翻译?
我们知道,金融翻译涉及企业经济这块的,是影响各公司发展很重要的一方面,翻译做得好,可以促进公司内外的交流,及时掌握各种信息,做好应对。那么,金融翻译难吗,如何做好金融翻译&#…...

Java面试题(Tomcat与Nginx)
Tomcat 什么是Tomcat? 简单来说是一个运行Java的网络服务器,也是jsp和serlvet的一个容器 Tomcat的缺省端口是多少,怎么修改? conf文件夹下修改server.xml文件 <Connector connectionTimeout"20000" port"8080" p…...

React-使用mobx
React 中使用 mobx 配置开发环境 安装mobx和中间件工具 mobx-react-lite 只能函数组件中使用 yarn add mobx mobx-react-lite初始化 mobx 定义数据状态 state在构造器中实现数据响应式处理 makeAutoObservble定义修改数据的函数 action实例化 store 并导出 import { compute…...

LeetCode ACM模式——哈希表篇(一)
刷题顺序及部分思路来源于代码随想录,网站地址:https://programmercarl.com 部分思路来源于力扣官方题解,作者主页:https://leetcode.cn/u/leetcode-solution/ 242. 有效的字母异位词 给定两个字符串 s 和 t ,编写一个…...

WPF实战学习笔记31-登录界面全局通知
UI添加消息聚合器 <md:Snackbarx:Name"LoginSnakeBar"Grid.ColumnSpan"2"Panel.ZIndex"1"MessageQueue"{md:MessageQueue}" />注册提示消息 文件:Mytodo.Views.LoginView.cs构造函数添加内容 //注册提示消息 aggre…...

通用商城项目(中)
金山编译器出问题了。下面段落标号全出问题了,排版也出问题了。懒得改了。 使用对象存储OSS,保存品牌logo 新建Module,提供上传、显示服务 有些不明所以的,按照steinliving-commodity配置了一通pom.xml 新建application.yml&…...

谨慎使用JSON.stringify
谨慎使用JSON.stringify 为了避免因为对象是引用类型而造成的数据源污染,我们通常使用 JSON.stringify 将其转换为字符串,而后通过JSON.parse方法将字符串转化一个新对象来实现深拷贝。但是在这个过程中也会存在一些问题,本文就介绍一下使用…...

驱动开发day8
编写LED灯的驱动,使用GPIO子系统,里面添加按键的中断处理 1.应用程序发送指令控制LED亮灭 2.按键1 按下,led1电位反转 按键2按下,led2电位反转 按键3 按下,led3电位反转 驱动程序 #include <linux/init.h> #i…...

CAS 机制
问题分析与思考: CAS 是 Java 中 Unsafe 类里面的方法,它的全称是 CompareAndSwap,比较并交换 的意思。 它的主要功能是能够保证在多线程环境下,对于共享变量的修改的原子性。 举个例子,比如说有这样一个场景ÿ…...

#P1003. [NOIP2009普及组] 道路游戏
题目描述 小新正在玩一个简单的电脑游戏。 游戏中有一条环形马路,马路上有 nn 个机器人工厂,两个相邻机器人工厂之间由一小段马路连接。小新以某个机器人工厂为起点,按顺时针顺序依次将这 nn 个机器人工厂编号为 1\sim n1∼n,因…...

python-网络爬虫.regular
regular 正则表达式 (regular expression) 正则表达式(regular expression)描述了一种字符串匹配的模式 (pattern), 可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串 中取出符合某个条件的子串等。 正则表达式是由普通…...

手动搭建gateway,项目集成gateway实现Token效果
目录 背景步骤1、首先创建springboot项目2、引入依赖3、配置文件!!!!!(超级重要!!!根据自己的需要进行配置)4、相关类我们在服务中进行的白名单中接口的操作如…...

linux下SVN服务器搭建
在本教程中,我们将介绍如何在Linux系统下搭建Subversion(SVN)服务器。Subversion是一种流行的版本控制系统,它允许多个人在同一项目上进行协作,同时避免了他们各自的更改发生冲突。 安装SVN 在大多数Linux发行版中&am…...

技术等级 TRL 定义
“不同环境、不同目标下TRL表述不一样” 技术等级 TRL 定义 TRL1 基本原理提出和发现 TRL2 技术应用研究 TRL3 完成概念验证,如叶栅试验、燃烧室头部试验等 TRL4 完成模拟部件试验.如压气机性能试验,燃烧室扇形试验 TRL5 完…...

DHorse v1.3.0 发布,基于k8s的发布平台
综述 DHorse是一个简单易用、以应用为中心的云原生DevOps系统,具有持续集成、持续部署、微服务治理等功能,无需安装依赖Docker、Maven、Node等环境即可发布Java、Vue、React应用,主要特点:部署简单、操作简洁、功能快速。 新增特…...

Redis - 缓存的双写一致性
概念: 当修改了数据库的数据也要同时更新缓存的数据,缓存和数据库的数据要保持一致 那为什么会有不一致的情况呢? 如果不追求一致性,正常有两种做法 先修改数据库 后删除旧的缓存先删除旧的缓存 再修改数据库 我们以先删除旧的…...

opencv03-Mat矩阵API的使用
opencv03-Mat矩阵API的使用 构造方法(具体介绍看API文档) int main() {Mat m1 Mat(200, 100, CV_8UC1);imshow("o1", m1);Mat m2 Mat(Size(100, 200), CV_8UC1);imshow("o2", m2);Mat m3 Mat(200, 100, CV_8UC3, Scalar(255, 0, 0));imshow("o3&…...

2023届浙江大学MPA提面A资格经验总结分享
本人是去年报考的浙大MPA项目,并通过提面获得了A资格,新一年浙大MPA项目提前批面试已经开始了,受达立易考周老师邀请来分享下我的提面经验,希望我的经验能对还在迷茫中的小伙伴有所帮助。 点开提面通知,首先看到…...

BugKu CTF(杂项篇MISC)—想要种子吗
BugKu CTF(杂项篇MISC)—想要种子吗 提 示: 描 述:flag{} 题目下载后是一张图片,打开如下。 一、工具 十六进制编辑器010 editor kali系统文件分离工具binwalk或者foremost 维吉尼亚密码 STEGHIDE图片隐写工具 文章所需的软件下载地址 ARCHPR压缩包密码破解…...