ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼
⼀、通⽤型AI
在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模
型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。
但我们⽬前的AI,不管是AlphaGo还是图像识别算法,本质上都是服务于专业领域的技术
⼯⼈。
⽽GPT⽬前看似只能解决⾃然⽣成领域的任务,但实际上,他展现出了通⽤型⼈⼯智能
的潜⼒。
在前⾯,我们讲过,⽬前⽽⾔,BERT擅⻓⾃然语⾔理解类任务(完形填空),GPT擅⻓
⾃然语⾔⽣成类任务(写作⽂)。
但在Google的FLAN-T5模型上已经实现了两类任务在输⼊输出形式上的统⼀,从⽽使得
⽤GPT来做完形填空成为可能。也就是可以⽤⼀个⼤模型来解决所有NLP领域的问题。
⼆、提⽰词模式更有优势
那么再进⼀步地,是否GPT可以从NLP领域⾛向其他AI领域呢?当然有可能!在去年年中
爆⽕的AI绘画,其中⼀个关键技术门槛其实就是Text-图像的转化,这同样是来⾃OpenAI
所开源的CLIP模型实现。
因此GPT在图像领域的能⼒同样也令⼈期待。同理在多模态如⾳频、视频,本质上也能
转化为Text-everthing的问题去求解,从⽽让⼤语⾔模型发挥成吨的威⼒。
当然你可能会问,那么只要⼤语⾔模型就可以呀,为什么是GPT,⽽不是BERT呢?接着
往下看。
事实上,BERT的fine-tuning模式有两个痛点。
- 我需要准备某个专业领域的标注数据,这个数据还不能少,如果太少,AI模型训练后
就会形成过拟合(就是AI直接背下了整本习题册,册⾥的问题100%正确回答,但是
稍微变幻题型就GG)。 - 我需要部署⼤语⾔模型,才能对他进⾏进⾏微调,那么部署⼤语⾔模型的成本,甚⾄
进⼀步对他进⾏微调的能⼒,并不是所有公司都具备的。这注定是⼀个只有少数玩家
能参与的游戏。
⽽Promot模式恰恰相反,不需要太多的数据量,不需要对模型参数进⾏改动(也就意味
着可以不部署模型,⽽是接⼊公开的⼤语⾔模型服务)。那么他的调试就会呈现百花⻬放
的姿态,玩家越多,创造⼒涌现就越猛烈。
三、全新交互模式
这⾥的⼈机交互,指的是⼈-模型之间的交互。
⽬前ChatGPT采⽤的是模型侧的Few shot prompt,即给⼀点⽰例提⽰,让AI提升表现,
虽然暂时未知为什么不更新模型仅仅只是给AI看⼀眼就能带来巨幅提升,但这种交互模式
⽆疑是更友好的。
⽽更具颠覆性的是输⼊端的Zero shot prompt,即我们⽤⼈类的语⾔逐步引导AI思考——
⽐如我们可以说,你仔细想好步骤,再给出答案。就仅仅是多加⼀句“你仔细想好步骤”,
AI的答案靠谱率就会明显提升。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
四、对⼈类的献媚
在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤:
- 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
过Prompt模式进⾏,即模型参数不产⽣变化。 - 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
分低。 - 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
四、对⼈类的献媚
在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤: - 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
过Prompt模式进⾏,即模型参数不产⽣变化。 - 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
分低。 - 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。

其次,落地成本⾼。
ChatGPT的复现依托于⼤模型,他的落地有三种路径: - 基于instruct GPT复现(ChatGPT的姐妹模型,有公开paper)
- 基于OpenAI⽬前开放的GPT3.0付费接⼝落地,再结合具体场景进⾏fine-tuning,⽬
前刊例价费⽤是25000token/美元,换算国内价格约3700token/元 - 基于OpenAI试点中的ChatGPT PRO落地,42美元/⽉,换算后约284元/⽉
第⼀种路径依赖于新玩家的进⼊,但⼤概只能是⼤玩家的赛道。第⼆种和第三种路径需要
打平付费接⼝的成本,需要针对的场景具备⾜够价值。
当然成本的问题可以期待被快速解决,就像AI绘画领域⼀样。不过⽬前⽽⾔,成本仍然是
ChatGPT落地的⼀个制约因素。
最后,最重要的是ChatGPT⽬前的能⼒仍然存在缺陷: - 结果不稳定。这会导致⽆法直接应⽤,必定需要⼈⼯review,更多是瞄准辅助性场景
或本⾝就不追求稳定的场景。 - 推理能⼒有限。例如询问现在的美国总统是谁,会回答奥巴⻢,或特朗普,但⼜能回
答出拜登是46届总统。我们可以发现模型中事实存在,但他⽆法推理出正确答案。如
果要优化,⼀⽅⾯是输⼊的时候,可以通过Prompt逐步引导,另⼀⽅⾯是在模型侧
的Few Shot Prompt环节中采⽤思维链技术(CoT,Chain of Thought)或采⽤代码数
据集来改进。就⽬前⽽⾔,进展可喜,但能⼒仍然有限。 - 知识更新困难。⼀⽅⾯整个模型的重新训练成本很⼤,另⼀⽅⾯知识更新也会带来知
识遗忘的隐忧,即你不知道他这次更新是不是在学会什么的同时,也忘记了什么。也
就是说ChatGPT在解决这个问题之前,他的知识将始终落后⼀段时间。
综上,ChatGPT很惊艳,但更多在于它的潜⼒和未来,基于当下要做应⽤的话是需要做
⾮常多适配和场景探索的
相关文章:
ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼
⼀、通⽤型AI 在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模 型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。 但我们⽬前的AI,不管是AlphaGo还是图像识别算法&am…...
数据分析基础-数据可视化学习笔记03-可视化的符号与表示-图形符号学
概念 图型符号学(Cartographic Symbolization)是地图学领域中的一个重要概念,涉及到如何使用不同的符号、颜色、图案和标记来在地图上表示地理信息和数据。图型符号学旨在传达地理信息,使得地图能够清晰、有效地传达各种空间数据…...
暴力递归转动态规划(四)
题目 规定1对应A、2对应B、3对应C…26对应Z,那么一个数字字符串比如"111",就可以转化为:“AAA”、“KA"或"AK”,给定一个数字字符组成的字符串str,返回有多少种转化结果。 解释一下,字…...
大数据项目实战(Sqoop安装)
一,搭建大数据集群环境 1.4 Sqoop安装 1.sqoop安装 (1)上传安装包 (2)解压安装包 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /export/servers (3)重命名 mv sqoop-1.4.6.b…...
android——spinner下拉弹窗、popupwindow下拉弹窗列表
一、spinner下拉弹窗 效果图如下: adapter的代码: package com.yaona.spinnerimport android.R import android.content.Context import android.graphics.Color import android.view.LayoutInflater import android.view.View import android.view.Vie…...
【阿里淘天】淘天20230824真题一、二 <模拟、双指针>
一、 题目描述: 小红有一个01字符串,她可以进行最多k次提作,每次操作可以交换相邻的两个字符,问可以得到的字典序最小的字符串是什么 输入描述: 一行两个整数 n 和 k,表示字符串的长度和可以进行的操作…...
Java注解和反射
注解(Java.Annotation) 什么是注解(Annotation)? Annotation是从JDK5.0开始引入的新技术 Annotation的作用: 不是程序本身,可以对程序作出解释(这一点和注释(comment)没什么区别)可以被其他程序(比如:编译器等)读取Annotation的…...
【Docker】01-Centos安装、简单使用
参考教程: https://www.bilibili.com/video/BV1Qa4y1t7YH/?p5&spm_id_frompageDriver&vd_source4964ba5015a16eb57d0ac13401b0fe77 什么是Docker? Docker是一种开源的容器化平台,用于构建、打包、部署和运行应用程序。它通过使用容…...
k8s之存储篇---数据卷Volume
数据卷概述 Kubernetes Volume(数据卷)主要解决了如下两方面问题: 数据持久性:通常情况下,容器运行起来之后,写入到其文件系统的文件暂时性的。当容器崩溃后,kubelet 将会重启该容器ÿ…...
博流RISC-V芯片JTAG debug配置与运行
文章目录 1、Windows下安装与配置2、Linux下安装与配置3、芯片默认 JTAG PIN 列表4、命令行运行JTAG5、Eclipse下使用JTAG 1、Windows下安装与配置 CKLink 驱动安装 Windows版驱动下载地址: https://occ-oss-prod.oss-cn-hangzhou.aliyuncs.com/resource//1666331…...
[国产MCU]-W801开发实例-UART控制器
UART控制器 文章目录 UART控制器1、UART控制器介绍2、UART驱动API介绍3、UART使用示例本文将详细如何使用W801的UART模块。 1、UART控制器介绍 UART是一种通用串行 数据总线 ,用于 异步通信 。该总线支持双向通信,可以实现 全双工传输 和接收。 W801 共 6组普通 UART口,通…...
OpenCV(九):LUT查找表
LUT(Look-Up Table)查找表是OpenCV中一种常用的图像处理方法,用于对图像进行像素级别的颜色映射或图像增强操作。LUT查找表可以实现快速、高效的颜色转换和像素操作,尤其在处理大量像素的情况下具有优势。以下是关于OpenCV LUT查找…...
2023年 Java 面试八股文(25w字)
0.Java八股文上(25w字)2.3w 1.集合容器 2.Java基础链接 目录 一.Java 基础面试题1.Java概述Java语言有哪些特点?Java和C有什么关系,它们有什么区别?JVM、JRE和JDK的关系是什么?**什么是字节码?**采用字…...
STM32f103入门(7)pwm驱动led驱动舵机驱动直流电机
PWM驱动 PWM介绍TIM_OC1Init 配置通道TIM_OCStructInit 输出比较参数默认值输出比较模式 TIM_OCInitstructure输出比较极性 TIM_OCInitstructure设置输出使能以下三个决定了PWM的频率 占空比初始化通道 TIM_OC1Init(TIM2, &TIM_OCInitstructure);GPIO复用 PWM通道 驱动LED复…...
Linux centos7 bash编程——-求质数和
训练项目:使用函数求质数和。 定义一个函数IsPrime(),据此判断一个数是否为质数 由用户输入一个整数,求出比此数大的两个最小质数之和。 一、解决思路: 1.先在键盘上输入一个整数 2.求出比此数大的最小质数 3.再求出比此质数大的另一个…...
给Hexo添加说说功能
首发博客地址 官网地址 效果 👀 前言 GitHub 仓库:Artitalk.js 🎉 特性 增删查改全方面支持 支持针对每条说说的评论 支持 Markdown/html 语法 支持图片上传 🚀 快速使用 下列主题已将本项目整合进去,可以直接使用。 感…...
Tensorflow调用训练好的yolov5模型进行推理
文章目录 1、安装TensorFlow-GPU版本1.2、验证是否安装正常 2、将训练好的pt文件转换成onnx文件2.2、什么是Onnx模型和Tensorflow模型2.1、将onnx文件转换成pb文件 1、安装TensorFlow-GPU版本 1、创建虚拟环境python3.8 conda create -n TF2.4 python3.82、进入虚拟环境 conda…...
【场景方案】我所积累的一些跨页面的数据传递方式,持续更新,欢迎补充~
文章目录 Iframe内嵌相互传递BroadcastChannel同标签页数据传递localStorage中间人传递未完待续... Iframe内嵌相互传递 使用window.postMessage()的这个html5特性去跨域传递数据,不受跨域限制。 父层: sendMes(){ // 向iframe发送let iframdom this…...
ASP.NET Core 的错误页面
异常处理 Developer 环境的异常页面 ASP.NET Core App 会可以在开发阶段用UseDeveloperExceptionPage启用 Developer 异常页面: app.UseDeveloperExceptionPage();当遇到Unhandled 异常信息时,可以输出异常信息页面: 异常信息包括…...
Android静态ip设置的坑
Android静态ip设置的坑 Android静态ip设置,对于这个功能,如果没有接触过,会给人感觉是个特别简单的功能,直接调用系统的接口即可,其实这个功能还是有许多坑的,因为谷歌在Android SDK中对相关的API进行非系…...
visual studio 2022更改主题为深色
visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...
UDP(Echoserver)
网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...
Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式
点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...
Matlab | matlab常用命令总结
常用命令 一、 基础操作与环境二、 矩阵与数组操作(核心)三、 绘图与可视化四、 编程与控制流五、 符号计算 (Symbolic Math Toolbox)六、 文件与数据 I/O七、 常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结,涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...
BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践
6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...
【学习笔记】深入理解Java虚拟机学习笔记——第4章 虚拟机性能监控,故障处理工具
第2章 虚拟机性能监控,故障处理工具 4.1 概述 略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具 命令:jps [options] [hostid] 功能:本地虚拟机进程显示进程ID(与ps相同),可同时显示主类&#x…...
Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信
文章目录 Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信前言一、网络通信基础概念二、服务端与客户端的完整流程图解三、每一步的详细讲解和代码示例1. 创建Socket(服务端和客户端都要)2. 绑定本地地址和端口&#x…...
sipsak:SIP瑞士军刀!全参数详细教程!Kali Linux教程!
简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求,并检查收到的响应。它以以下模式之一…...
QT3D学习笔记——圆台、圆锥
类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体(对象或容器)QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质(定义颜色、反光等)QFirstPersonC…...
NPOI操作EXCEL文件 ——CAD C# 二次开发
缺点:dll.版本容易加载错误。CAD加载插件时,没有加载所有类库。插件运行过程中用到某个类库,会从CAD的安装目录找,找不到就报错了。 【方案2】让CAD在加载过程中把类库加载到内存 【方案3】是发现缺少了哪个库,就用插件程序加载进…...
