Sam Altman专访:GPT-4没太让我惊讶,ChatGPT则让我喜出望外
导读
ChatGPT、GPT-4 无疑是 2023 年年初人工智能界最大的「爆款」。3 月 26 日,OpenAI CEO、ChatGPT 之父 Sam Altman 接受了著名学者与科技播客、麻省理工大学研究员 Lex Fridman 的专访,Sam 分享了从OpenAI内部视角如何看待ChatGPT和GPT-4的里程碑式意义。智源社区整理了其中关于GPT-4的部分,供读者参考。
要点
▲ 我无法知晓历史书会对 GPT 的各个版本怎么评价。但如果非要我挑出一个至今看到的关键节点,我认为仍然是 ChatGPT。GPT-4 并没有太令我惊讶,ChatGPT 则让我有些喜出望外。
▲ 从某种程度上来说,GPT-4 系统增强了人类智能,可以被应用于各种各样的场景。
▲ 系统的易用性本身有时比基础模型的能力更重要。
▲ GPT-4 还不具备意识,也无法取代优秀的程序员。真正具有意识的人工智能应该能够告诉别人自己有意识,能表达自己的痛苦等情绪,理解自己的处境,有自己的记忆,并且能与人交互。
▲ 人工智能将对人类的生活质量带来巨大提升,我们可以治愈疾病、创造财富、增加资源、让人类感到快乐......看似人类不需要工作了,但是人类还需要社会地位、需要激情、需要创造、需要感受到自己的价值。因此,人工智能时代来临后,我们需要做的是找到新的工作、生活方式,拥抱新技术带来的巨大提升。

Sam Altman
OpenAI创始人之一,现任Y Combinator总裁、美国人工智能实验室OpenAI首席执行官。带领人工智能实验室OpenAI开发出聊天机器人程序ChatGPT,被媒体称为“ChatGPT之父”。
如果在维基百科上书写AI的历史,ChatGPT仍是最关键的节点
Q1
(L指代Lex Fridman,S代指Sam Altman)
L:什么是 GPT-4?它是怎样工作的?它最神奇的地方是什么?
S:现在回头来看,它还是很很初级的人工智能系统,其工作效率较低、存在一些小毛病,许多事完成得也不尽人意。尽管如此,它仍然为未来真正重要的技术指出了一条发展路径(即使该过程花费了几十年的时间)。
Q2
L:50 年后,当人回首早期的智能系统,GPT-4 会是一个真正巨大的飞跃吗,这是否是一个关键时刻?当人们在维基百科上书写人工智能的历史,会写上哪个版本的 GPT?
S:这个进步的过程是持续的,很难明确指定出一个历史性的时刻。我无法知晓历史书会对 GPT 的各个版本怎么评价。但如果非要我挑出一个至今看到的关键节点,我认为是 ChatGPT。ChatGPT 真正重要的并不是它的底层模型本身,而是如何利用底层模型,这涉及到基于人类反馈的强化学习(RLHF)及其接口。
Q3
L:RLHF 如何使 ChatGPT 有如此惊艳的性能?
S:我们用大量的文本数据训练了这些模型。在此过程中,他们学到了一些底层表征相关的知识,从而可以做一些惊艳众人的事情。但是在刚完成训练时,如果我们马上使用这个基础模型,尽管它可以在测试集上有很好的性能,但是它还并不太易于使用。为此,我们引入了一些人类反馈,实现了 RLHF。最简单的 RLHF 是:向模型给出两个版本的输出,让它判断人类评价者会更喜欢哪一个,然后通过强化学习将该信息反馈给模型。RLHF 出奇地有效,我们可以用极少的数据使模型更实用,我们通过该技术让模型与人类需求对齐,更容易给出对人有帮助的正确答案。无论基础的模型能力如何,系统的易用性十分关键。
Q4
L:如何理解通过使用 RLHF 技术,我们不再需要那么多的人类监督?
S:公平地说,相较于最初创建预训练大模型的科学研究,我们对这一部分的研究还处于早期,但是需要的数据确实更少了。
L:对于人类指导的研究十分有趣,也十分重要。我们通过这类研究理解如何让系统更实用、更智能、符合道德规范和人类的意图。引入人类反馈的过程也十分重要。
Q5
L:预训练数据集的大概有多么巨大?
S:我们费了很大力气与合作伙伴一起从互联网上的各个开源的数据库上抓取到了这些预训练数据,构建了庞大的数据集。实际上,除了 Reddit、报纸等媒体,世界上还有很多内容是大多数人意想不到的。清洗数据、过滤数据比收集数据更困难。
Q6
L:构建 ChatGPT 需要解决很多问题,例如:模型架构规模的设计,数据的选择,RLHF。这些部分结合起来有何神奇之处?
S:GPT-4 是我们真正推出的 ChatGPT 最终产品内部的版本,创造它所需的零部件数量还很难知晓,工作量很大。在早期的每个阶段,我们需要想出新的思路,或者很好地执行现有的想法。
L:GPT-4 中的一些技术步骤已经相对成熟,例如:在完成完整的训练模型之前,预测模型将会达到的性能。如何根据少量的训练就能知道训练完整的系统的特殊特性?就好比看到一个一岁的婴儿,就能知道他在高考中获得多少分。
S:这一成就令人惊讶,背后涉及许多的科学因素,最终达到人类所期待的智力水平。这一实现过程比我能够想象的要科学的多。正如所有新的科学分支一样,我们会发现一些无法拟合数据的新东西,并对此给出更好的解释,这正是科学发展的过程。尽管我们已经在社交媒体上发布了 GPT-4 的一些信息,但是我们仍然应该对其神奇之处心存敬畏。
GPT-4系统地增强了人类智能
Q7
L:GPT-4 这类语言模型可以学习或引用各个领域的素材。OpenAI 内部的研究者和工程师对语言模型的神奇之处是否有越来越深的理解?
S:我们可以通过各种方式评价模型,可以在训练好模型后在各类任务上对其进行测试,我们在 Github 上也开精力源了模型的测试过程,这很有帮助。重要的是,我们耗费了大量的人力、财力、时间来分析模型的实用性、模型如何为人们带来快乐和帮助、如何创造一个更好的世界、产生新的产品和服务。当然,我们至今仍然不能完全理解模型完成任务的全部内在过程,但我们会继续朝着这个方面努力。
Q8
L:GPT-4 将互联网上海量的信息压缩到了黑盒模型中「相对较少」的参数中,形成了人类智慧。请问从事实到智慧产生了怎样的飞跃?
S:我们将模型作为数据库吸取了人类知识,而不是将其用作推理引擎,系统的处理能力得到了神奇的提升。这样一来,系统实际上也能实现一定程度的推理,尽管某些学者可能认为这一说法并不严谨。从某种程度上来说,GPT-4 系统增强了人类智能,可以被应用于各种各样的场景。
L:ChatGPT 似乎在与人类的连续交互中「拥有」了智能,它在这种对话的方式中承认自己错误的假设,否定不合适的请求。
GPT-4不具有意识,也不会取代优秀的程序员
Q9
L:有些人很享受与 GPT 一起编程,有些人则害怕变成工作会被 GPT 取代。你怎么看待这一现象?

S:有一些关键的编程工作仍然需要人类的创造因素。GPT 类的模型会自动完成一些编程工作,但仍然无法取代优秀的程序员。有一些程序员会对未来的不确定性产生焦虑,但是更多的人会觉得它提升了自己的工作效率。
二三十年前,当「深蓝」击败了国际象棋大师卡斯帕罗夫后,也曾有人认为没有继续下国际象棋的必要了。但是国际象棋至今仍风靡全球。
人工智能将对人类的生活质量带来巨大提升,我们可以治愈疾病、创造财富、增加资源、让人类感到快乐......看似人类不需要工作了,但是人类还需要社会地位、需要激情、需要创造、需要感受到自己的价值。因此,人工智能时代来临后,我们需要做的是找到新的工作、生活方式,拥抱新技术带来的巨大提升。
Q10
L:Eliezer Yudkowsky 警告人工智能可能伤害人类,并给出了一些例子,我们几乎不可能一直让超级人工智能与人类意图「对齐」。你是否赞同他的观点?
S:这是有可能的。如果我们不谈论这一潜在的可能性,我们就不会投入足够的努力研发新技术来解决此类问题。很多新兴领域都存在此类问题,现在人们关心人工智能的能力和安全性。Elizer 的文章写得很好,但是人们很难跟进它的一些工作,存在一些逻辑问题,我并不完全支持他的看法。
早在人们相信深度学习、大语言模型的能力之前,就有很多有关人工智能安全的工作,我不认为这一领域有足够多的更新。理论确实很重要,但是需要不断地学习技术轨迹的变化,这种循环需要更加紧凑。我认为现在是研究人工智能安全的良好时机,可以探究这些新工具新技术与人类意图的「对齐」。
Q11
L:人工智能技术发展日新月异,有人说我们现在又进入了人工智能「腾飞」的阶段。当有人真正构建了通用人工智能,我们怎样知晓这种变化?
S:GPT-4 并没有太令我惊讶,ChatGPT 则稍稍让我有些喜出望外。尽管 GPT-4 令人印象深刻,但是它还并不是 AGI。AGI 的真正定义越来越重要,但我认为这距离我还很遥远。
Q12
L:你认为 GPT-4 有意识吗?
S:不,我认为它还没有意识。
L:我认为真正具有意识的人工智能应该能够告诉别人自己有意识,能表达自己的痛苦等情绪,理解自己的处境,有自己的记忆,并且能与人交互。而我觉得这些能力都是接口的能力,而不是底层知识。
S:我们 OpenAI 的首席科学家 Ilya Sutskever 曾经与我讨论过「如何知道模型是否有意识」。他认为,如果我们在数据集上小心地训练一个模型,不提及与意识或任何相关概念的主观体验,然后我们向模型描述这种意识的主观体验,看模型是否能领会我们传达的信息。
通用人工智能,我们走到了哪一步?
Q13
L:乔姆斯基等人对「大语言模型」能实现通用人工智能持批判态度。对此,你怎么看?大语言模型是否是通往通用人工智能的正确道路?
S:我认为大语言模型是通往 AGI 的道路中的一环,我们还需要其它非常重要的部分。
L:你认为智能体需要一个感受世界的「身体」吗?
S:我对此持谨慎态度。但在我看来,无法很好地融入已知的科学知识的系统不能称之为「超级智能」,它就像发明新的基础科学。为了实现「超级智能」,我们需要继续拓展 GPT 类的范式,这还有很长的路要走。
L:我认为通过改变训练 GPT 的数据,就已经可以获得各种巨大的科学突破。
Q14
L:随着提示(Prompt)链越来越长,这些交互本身就会成为人类社会的一部分,并互为基础。如何看待这一现象?
S:与 GPT 系统能完成某些任务相比,更让我激动的是人类参与到了这一工具的反馈回路中,我们可以从多轮交互的轨迹中学到更多的东西。AI 将拓展、放大人类的意图和能力,这也将塑造人们使用它的方式。也许,我们永远不会建造出 AGI,但是让人类变得更好这件事本身就是巨大的胜利。
整理:熊宇轩
更多内容 尽在智源社区
相关文章:
Sam Altman专访:GPT-4没太让我惊讶,ChatGPT则让我喜出望外
导读ChatGPT、GPT-4 无疑是 2023 年年初人工智能界最大的「爆款」。3 月 26 日,OpenAI CEO、ChatGPT 之父 Sam Altman 接受了著名学者与科技播客、麻省理工大学研究员 Lex Fridman 的专访,Sam 分享了从OpenAI内部视角如何看待ChatGPT和GPT-4的里程碑式意…...
弯道超车的机会
弯道超车的机会 原文地址:https://bmft.tech/#/1-throught/0302-chance 前言 我一直很想把自己思考的东西表达出来,苦于语文成绩差,文字功力不够,想来想去也不知道用什么话来开场。我不喜欢站在高处对别人指指点点,…...
【设计模式】创建型模式之原型模式
【设计模式】创建型模式之原型模式 文章目录【设计模式】创建型模式之原型模式1.概述2. 构成3. 实现3.1 浅克隆3.2 深克隆1.概述 原型模式(Prototype Pattern):是用于创建重复的对象,同时又能保证性能。这种类型的设计模式属于创建型模式,它…...
KMP算法——我欲修仙(功法篇)
个人主页:【😊个人主页】 系列专栏:【❤️我欲修仙】 学习名言:莫等闲、白了少年头,空悲切。——岳飞 系列文章目录 第一章 ❤️ 学习前的必知知识 第二章 ❤️ 二分查找 文章目录系列文章目录前言🚗&…...
【嵌入式Linux学习笔记】QT在Linux嵌入式设备上的使用
QT是目前主流的UI界面设计软件之一,Linux系统也支持QT应用,并且提供了很多方便的接口。所以有必要记录一下基于QT,在LCD屏幕上实现UI界面功能的各种细节。 学习视频地址:【正点原子】STM32MP157开发板 1. 系统配置 出于方便&am…...
js根据数据关键字实现模糊查询功能
js根据数据关键字实现模糊查询功能模糊查询实现模糊查询功能的步骤和一般方法第一步:创建假数据或请求接口数据第二步:分析数据格式,处理数据第三步:验证功能完整代码模糊查询 模糊查询功能是指在搜索或者查询时,允许…...
java获取对象属性
Field[] fields vo.getClass().getDeclaredFields(); for (Field field : fields) {//设置允许通过反射访问私有变量field.setAccessible(true);//获取字段的值String value "";Class<?> type field.getType();if (Date.class.equals(type)) {value DateU…...
51单片机(IIC协议OLED屏)
一、IIC协议 1、IIC协议概述 1.1、概述:IIC全称Inter-Integrated Circuit (集成电路总线) 是由PHILIPS公司在80年代开发的两线式串行总线,用于连接微控制器及其外围设备。IIC属于半双 工同步通信方式 1.2、特点:简单性和有效性。 由于接口直…...
你知道,华为对项目经理要求的3项技能5项素质是什么吗?
很多人一定在好奇,华为对项目经理的要求是什么呢?普通项目经理应具备什么素质,才能进入华为这样的大厂,在严峻的经济形势下无惧裁员呢? 一、三项软技能 我们在华为举办的项目经理论坛中找到了答案:对于华…...
优漫动游 提升效率常用的C4D技巧
C4D是近几年非常热的趋势,经常有人问3D相关的问题,想把自己在找捷径的过程中觉得最实用的小技巧分享给大家 1、快速定位层级和模型 模型的过程中,经常遇到模型层级多难定位的问题,逐级打开或者全部展开对于定位模型使…...
基于蚁群算法的时间窗口路径优化
目录 背影 蚁群算法的原理及步骤 基本定义 编程思路 适应度函数 算法的规则 特点 主要参数 代码 结果分析 展望 背影 现代物流配送对时间要求更高,是否及时配送是配送是否成功的重要指标,本文对路径优化加时间窗口,实现基于蚁群算法的时间窗口路径优化, 蚁群算法 基本…...
liunx
linux常用命令 mkdir :创建文件夹 rm -f :删除文件 docker cp 文件名 20f:容器内地址 将文件从linux系统移动到docker地址 ln -s 将两个文件做链接 compgen -u 查看所有用户 groups 查看所在组 vim 编辑 quit 退出 sudo su - root 获得root权限 cp dir1/…...
机动车发票组件【vue】
发票组件 问题反馈:在这就可以 Install-下载 npm install motorvehicles --savewarrning:我们推荐您设置key的,因为不存在它会带来数据的复用性问题usage-使用说明 import MotorVehiclesIvoice from motorvehiclesimport MotorVehiclesIvo…...
学习笔记-剖析k8s之StatefulSet的拓扑状态-3月day18
文章目录前言StatefulSetHeadless ServicePod的拓扑状态小结附前言 Deployment实际上并不足以覆盖所有的应用编排问题,原因在于Deployment对应用做了一个简单化的假设:一个应用的所有Pod,是完全一样的。所以,它们互相之间没有顺序…...
Java实现输出九九乘法口诀表,输入行数输出对应的梯形(平行四边形)这两个代码
目录 一、前言 二、代码部分 1.输出九九乘法口诀表的代码 三、程序运行结果(控制台输出) 一、前言 1.本代码是我在上学时写的,有一些地方没能完美实现,请包涵也请多赐教! 2.本弹窗界面可以根据简单的要求进行输…...
C++空间配置器
目录 1.什么是空间配置器 2.为什么需要空间配置器 3.SGI-STL空间配置器实现原理 3.1一级空间配置器 3.2二级空间配置器 3.2.1内存池 3.2.2 SGI-STL中二级空间配置器设计 3.3 空间配置器的默认选择 4.空间配置器与容器的结合 1.什么是空间配置器 空间配置器࿰…...
JConsole使用教程
JConsole是一个Java虚拟机的监控和管理工具,可以监控Java应用程序的内存使用、线程和类信息等。 以下是JConsole的使用教程: 1.启动JConsole JConsole是一个Java自带的工具,可以在bin目录下找到jconsole.exe文件。双击运行该文件即可启动JC…...
JS手写防抖和节流函数(超详细版整理)
1、什么是防抖和节流防抖(debounce):每次触发定时器后,取消上一个定时器,然后重新触发定时器。防抖一般用于用户未知行为的优化,比如搜索框输入弹窗提示,因为用户接下来要输入的内容都是未知的&…...
我的Macbook pro使用体验
刚拿到Mac那一刻,第一眼很惊艳,不经眼前一亮,心想:这是一件艺术品,太好看了吧 而后再体验全新的Macos 系统,身为多年的win用户说实话一时间还是难以接受 1.从未见过的访达,不习惯的右键 2. …...
炼石入选“首届工业和信息化领域商用密码应用峰会”典型方案
2023年3月22日-23日,浙江省经济和信息化厅、浙江省通信管理局、浙江省密码管理局、工业和信息化部商用密码应用产业促进联盟联合举办的“首届工业和信息化领域商用密码应用峰会”(以下简称峰会)在浙江杭州成功举办,旨在深入推进工…...
CTF show Web 红包题第六弹
提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框,很难让人不联想到SQL注入,但提示都说了不是SQL注入,所以就不往这方面想了 先查看一下网页源码,发现一段JavaScript代码,有一个关键类ctfs…...
【JVM】- 内存结构
引言 JVM:Java Virtual Machine 定义:Java虚拟机,Java二进制字节码的运行环境好处: 一次编写,到处运行自动内存管理,垃圾回收的功能数组下标越界检查(会抛异常,不会覆盖到其他代码…...
三体问题详解
从物理学角度,三体问题之所以不稳定,是因为三个天体在万有引力作用下相互作用,形成一个非线性耦合系统。我们可以从牛顿经典力学出发,列出具体的运动方程,并说明为何这个系统本质上是混沌的,无法得到一般解…...
多模态大语言模型arxiv论文略读(108)
CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题:CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者:Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...
Web 架构之 CDN 加速原理与落地实践
文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 …...
OPENCV形态学基础之二腐蚀
一.腐蚀的原理 (图1) 数学表达式:dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一,腐蚀跟膨胀属于反向操作,膨胀是把图像图像变大,而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...
初探Service服务发现机制
1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。 主要功能:服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源…...
Razor编程中@Html的方法使用大全
文章目录 1. 基础HTML辅助方法1.1 Html.ActionLink()1.2 Html.RouteLink()1.3 Html.Display() / Html.DisplayFor()1.4 Html.Editor() / Html.EditorFor()1.5 Html.Label() / Html.LabelFor()1.6 Html.TextBox() / Html.TextBoxFor() 2. 表单相关辅助方法2.1 Html.BeginForm() …...
Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)
引言 在人工智能飞速发展的今天,大语言模型(Large Language Models, LLMs)已成为技术领域的焦点。从智能写作到代码生成,LLM 的应用场景不断扩展,深刻改变了我们的工作和生活方式。然而,理解这些模型的内部…...
day36-多路IO复用
一、基本概念 (服务器多客户端模型) 定义:单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用:应用程序通常需要处理来自多条事件流中的事件,比如我现在用的电脑,需要同时处理键盘鼠标…...
