ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼
⼀、通⽤型AI
在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模
型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。
但我们⽬前的AI,不管是AlphaGo还是图像识别算法,本质上都是服务于专业领域的技术
⼯⼈。
⽽GPT⽬前看似只能解决⾃然⽣成领域的任务,但实际上,他展现出了通⽤型⼈⼯智能
的潜⼒。
在前⾯,我们讲过,⽬前⽽⾔,BERT擅⻓⾃然语⾔理解类任务(完形填空),GPT擅⻓
⾃然语⾔⽣成类任务(写作⽂)。
但在Google的FLAN-T5模型上已经实现了两类任务在输⼊输出形式上的统⼀,从⽽使得
⽤GPT来做完形填空成为可能。也就是可以⽤⼀个⼤模型来解决所有NLP领域的问题。
⼆、提⽰词模式更有优势
那么再进⼀步地,是否GPT可以从NLP领域⾛向其他AI领域呢?当然有可能!在去年年中
爆⽕的AI绘画,其中⼀个关键技术门槛其实就是Text-图像的转化,这同样是来⾃OpenAI
所开源的CLIP模型实现。
因此GPT在图像领域的能⼒同样也令⼈期待。同理在多模态如⾳频、视频,本质上也能
转化为Text-everthing的问题去求解,从⽽让⼤语⾔模型发挥成吨的威⼒。
当然你可能会问,那么只要⼤语⾔模型就可以呀,为什么是GPT,⽽不是BERT呢?接着
往下看。
事实上,BERT的fine-tuning模式有两个痛点。
- 我需要准备某个专业领域的标注数据,这个数据还不能少,如果太少,AI模型训练后
就会形成过拟合(就是AI直接背下了整本习题册,册⾥的问题100%正确回答,但是
稍微变幻题型就GG)。 - 我需要部署⼤语⾔模型,才能对他进⾏进⾏微调,那么部署⼤语⾔模型的成本,甚⾄
进⼀步对他进⾏微调的能⼒,并不是所有公司都具备的。这注定是⼀个只有少数玩家
能参与的游戏。
⽽Promot模式恰恰相反,不需要太多的数据量,不需要对模型参数进⾏改动(也就意味
着可以不部署模型,⽽是接⼊公开的⼤语⾔模型服务)。那么他的调试就会呈现百花⻬放
的姿态,玩家越多,创造⼒涌现就越猛烈。
三、全新交互模式
这⾥的⼈机交互,指的是⼈-模型之间的交互。
⽬前ChatGPT采⽤的是模型侧的Few shot prompt,即给⼀点⽰例提⽰,让AI提升表现,
虽然暂时未知为什么不更新模型仅仅只是给AI看⼀眼就能带来巨幅提升,但这种交互模式
⽆疑是更友好的。
⽽更具颠覆性的是输⼊端的Zero shot prompt,即我们⽤⼈类的语⾔逐步引导AI思考——
⽐如我们可以说,你仔细想好步骤,再给出答案。就仅仅是多加⼀句“你仔细想好步骤”,
AI的答案靠谱率就会明显提升。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
四、对⼈类的献媚
在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤:
- 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
过Prompt模式进⾏,即模型参数不产⽣变化。 - 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
分低。 - 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
四、对⼈类的献媚
在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤: - 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
过Prompt模式进⾏,即模型参数不产⽣变化。 - 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
分低。 - 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。

其次,落地成本⾼。
ChatGPT的复现依托于⼤模型,他的落地有三种路径: - 基于instruct GPT复现(ChatGPT的姐妹模型,有公开paper)
- 基于OpenAI⽬前开放的GPT3.0付费接⼝落地,再结合具体场景进⾏fine-tuning,⽬
前刊例价费⽤是25000token/美元,换算国内价格约3700token/元 - 基于OpenAI试点中的ChatGPT PRO落地,42美元/⽉,换算后约284元/⽉
第⼀种路径依赖于新玩家的进⼊,但⼤概只能是⼤玩家的赛道。第⼆种和第三种路径需要
打平付费接⼝的成本,需要针对的场景具备⾜够价值。
当然成本的问题可以期待被快速解决,就像AI绘画领域⼀样。不过⽬前⽽⾔,成本仍然是
ChatGPT落地的⼀个制约因素。
最后,最重要的是ChatGPT⽬前的能⼒仍然存在缺陷: - 结果不稳定。这会导致⽆法直接应⽤,必定需要⼈⼯review,更多是瞄准辅助性场景
或本⾝就不追求稳定的场景。 - 推理能⼒有限。例如询问现在的美国总统是谁,会回答奥巴⻢,或特朗普,但⼜能回
答出拜登是46届总统。我们可以发现模型中事实存在,但他⽆法推理出正确答案。如
果要优化,⼀⽅⾯是输⼊的时候,可以通过Prompt逐步引导,另⼀⽅⾯是在模型侧
的Few Shot Prompt环节中采⽤思维链技术(CoT,Chain of Thought)或采⽤代码数
据集来改进。就⽬前⽽⾔,进展可喜,但能⼒仍然有限。 - 知识更新困难。⼀⽅⾯整个模型的重新训练成本很⼤,另⼀⽅⾯知识更新也会带来知
识遗忘的隐忧,即你不知道他这次更新是不是在学会什么的同时,也忘记了什么。也
就是说ChatGPT在解决这个问题之前,他的知识将始终落后⼀段时间。
综上,ChatGPT很惊艳,但更多在于它的潜⼒和未来,基于当下要做应⽤的话是需要做
⾮常多适配和场景探索的
相关文章:
ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼
⼀、通⽤型AI 在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模 型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。 但我们⽬前的AI,不管是AlphaGo还是图像识别算法&am…...
数据分析基础-数据可视化学习笔记03-可视化的符号与表示-图形符号学
概念 图型符号学(Cartographic Symbolization)是地图学领域中的一个重要概念,涉及到如何使用不同的符号、颜色、图案和标记来在地图上表示地理信息和数据。图型符号学旨在传达地理信息,使得地图能够清晰、有效地传达各种空间数据…...
暴力递归转动态规划(四)
题目 规定1对应A、2对应B、3对应C…26对应Z,那么一个数字字符串比如"111",就可以转化为:“AAA”、“KA"或"AK”,给定一个数字字符组成的字符串str,返回有多少种转化结果。 解释一下,字…...
大数据项目实战(Sqoop安装)
一,搭建大数据集群环境 1.4 Sqoop安装 1.sqoop安装 (1)上传安装包 (2)解压安装包 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /export/servers (3)重命名 mv sqoop-1.4.6.b…...
android——spinner下拉弹窗、popupwindow下拉弹窗列表
一、spinner下拉弹窗 效果图如下: adapter的代码: package com.yaona.spinnerimport android.R import android.content.Context import android.graphics.Color import android.view.LayoutInflater import android.view.View import android.view.Vie…...
【阿里淘天】淘天20230824真题一、二 <模拟、双指针>
一、 题目描述: 小红有一个01字符串,她可以进行最多k次提作,每次操作可以交换相邻的两个字符,问可以得到的字典序最小的字符串是什么 输入描述: 一行两个整数 n 和 k,表示字符串的长度和可以进行的操作…...
Java注解和反射
注解(Java.Annotation) 什么是注解(Annotation)? Annotation是从JDK5.0开始引入的新技术 Annotation的作用: 不是程序本身,可以对程序作出解释(这一点和注释(comment)没什么区别)可以被其他程序(比如:编译器等)读取Annotation的…...
【Docker】01-Centos安装、简单使用
参考教程: https://www.bilibili.com/video/BV1Qa4y1t7YH/?p5&spm_id_frompageDriver&vd_source4964ba5015a16eb57d0ac13401b0fe77 什么是Docker? Docker是一种开源的容器化平台,用于构建、打包、部署和运行应用程序。它通过使用容…...
k8s之存储篇---数据卷Volume
数据卷概述 Kubernetes Volume(数据卷)主要解决了如下两方面问题: 数据持久性:通常情况下,容器运行起来之后,写入到其文件系统的文件暂时性的。当容器崩溃后,kubelet 将会重启该容器ÿ…...
博流RISC-V芯片JTAG debug配置与运行
文章目录 1、Windows下安装与配置2、Linux下安装与配置3、芯片默认 JTAG PIN 列表4、命令行运行JTAG5、Eclipse下使用JTAG 1、Windows下安装与配置 CKLink 驱动安装 Windows版驱动下载地址: https://occ-oss-prod.oss-cn-hangzhou.aliyuncs.com/resource//1666331…...
[国产MCU]-W801开发实例-UART控制器
UART控制器 文章目录 UART控制器1、UART控制器介绍2、UART驱动API介绍3、UART使用示例本文将详细如何使用W801的UART模块。 1、UART控制器介绍 UART是一种通用串行 数据总线 ,用于 异步通信 。该总线支持双向通信,可以实现 全双工传输 和接收。 W801 共 6组普通 UART口,通…...
OpenCV(九):LUT查找表
LUT(Look-Up Table)查找表是OpenCV中一种常用的图像处理方法,用于对图像进行像素级别的颜色映射或图像增强操作。LUT查找表可以实现快速、高效的颜色转换和像素操作,尤其在处理大量像素的情况下具有优势。以下是关于OpenCV LUT查找…...
2023年 Java 面试八股文(25w字)
0.Java八股文上(25w字)2.3w 1.集合容器 2.Java基础链接 目录 一.Java 基础面试题1.Java概述Java语言有哪些特点?Java和C有什么关系,它们有什么区别?JVM、JRE和JDK的关系是什么?**什么是字节码?**采用字…...
STM32f103入门(7)pwm驱动led驱动舵机驱动直流电机
PWM驱动 PWM介绍TIM_OC1Init 配置通道TIM_OCStructInit 输出比较参数默认值输出比较模式 TIM_OCInitstructure输出比较极性 TIM_OCInitstructure设置输出使能以下三个决定了PWM的频率 占空比初始化通道 TIM_OC1Init(TIM2, &TIM_OCInitstructure);GPIO复用 PWM通道 驱动LED复…...
Linux centos7 bash编程——-求质数和
训练项目:使用函数求质数和。 定义一个函数IsPrime(),据此判断一个数是否为质数 由用户输入一个整数,求出比此数大的两个最小质数之和。 一、解决思路: 1.先在键盘上输入一个整数 2.求出比此数大的最小质数 3.再求出比此质数大的另一个…...
给Hexo添加说说功能
首发博客地址 官网地址 效果 👀 前言 GitHub 仓库:Artitalk.js 🎉 特性 增删查改全方面支持 支持针对每条说说的评论 支持 Markdown/html 语法 支持图片上传 🚀 快速使用 下列主题已将本项目整合进去,可以直接使用。 感…...
Tensorflow调用训练好的yolov5模型进行推理
文章目录 1、安装TensorFlow-GPU版本1.2、验证是否安装正常 2、将训练好的pt文件转换成onnx文件2.2、什么是Onnx模型和Tensorflow模型2.1、将onnx文件转换成pb文件 1、安装TensorFlow-GPU版本 1、创建虚拟环境python3.8 conda create -n TF2.4 python3.82、进入虚拟环境 conda…...
【场景方案】我所积累的一些跨页面的数据传递方式,持续更新,欢迎补充~
文章目录 Iframe内嵌相互传递BroadcastChannel同标签页数据传递localStorage中间人传递未完待续... Iframe内嵌相互传递 使用window.postMessage()的这个html5特性去跨域传递数据,不受跨域限制。 父层: sendMes(){ // 向iframe发送let iframdom this…...
ASP.NET Core 的错误页面
异常处理 Developer 环境的异常页面 ASP.NET Core App 会可以在开发阶段用UseDeveloperExceptionPage启用 Developer 异常页面: app.UseDeveloperExceptionPage();当遇到Unhandled 异常信息时,可以输出异常信息页面: 异常信息包括…...
Android静态ip设置的坑
Android静态ip设置的坑 Android静态ip设置,对于这个功能,如果没有接触过,会给人感觉是个特别简单的功能,直接调用系统的接口即可,其实这个功能还是有许多坑的,因为谷歌在Android SDK中对相关的API进行非系…...
挑战杯推荐项目
“人工智能”创意赛 - 智能艺术创作助手:借助大模型技术,开发能根据用户输入的主题、风格等要求,生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用,帮助艺术家和创意爱好者激发创意、提高创作效率。 - 个性化梦境…...
生成xcframework
打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式,可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。 使用 Xcode 命令行工具打包 通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...
调用支付宝接口响应40004 SYSTEM_ERROR问题排查
在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...
在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:
在 HarmonyOS 应用开发中,手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力,既支持点击、长按、拖拽等基础单一手势的精细控制,也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档,…...
将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
Otsu 是一种自动阈值化方法,用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理,能够自动确定一个阈值,将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...
生成 Git SSH 证书
🔑 1. 生成 SSH 密钥对 在终端(Windows 使用 Git Bash,Mac/Linux 使用 Terminal)执行命令: ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" 参数说明: -t rsa&#x…...
深入解析C++中的extern关键字:跨文件共享变量与函数的终极指南
🚀 C extern 关键字深度解析:跨文件编程的终极指南 📅 更新时间:2025年6月5日 🏷️ 标签:C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录 前言🔥一、extern 是什么?&…...
【论文阅读28】-CNN-BiLSTM-Attention-(2024)
本文把滑坡位移序列拆开、筛优质因子,再用 CNN-BiLSTM-Attention 来动态预测每个子序列,最后重构出总位移,预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵(S…...
python执行测试用例,allure报乱码且未成功生成报告
allure执行测试用例时显示乱码:‘allure’ �����ڲ����ⲿ���Ҳ���ǿ�&am…...
快刀集(1): 一刀斩断视频片头广告
一刀流:用一个简单脚本,秒杀视频片头广告,还你清爽观影体验。 1. 引子 作为一个爱生活、爱学习、爱收藏高清资源的老码农,平时写代码之余看看电影、补补片,是再正常不过的事。 电影嘛,要沉浸,…...
