宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
文章目录
- 前言
- 一、准确性提升
- 1.创造力
- 2.视觉输入
- 3.更长的上下文
- 二、相比于ChatGPT有哪些提升
- 1.GPT-4 的高级推理能力超越了 ChatGPT
- 2.GPT-4 在多种测试考试中均优于 ChatGPT。
- 三、研究团队在GPT-4模型都做了哪些改善
- 1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
- 2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
- 3.安全与对齐:
- 四、和一些开发创新产品的组织合作
- 五、其他
- 详细研究报告
- 基础设施:
- 局限性
- 可用性
- 总结
前言
昨晚OpenAI公开了GPT-4的进展,并可以基于ChatGPT实现GPT-4的使用和访问。博主连夜总结出以下Xmind,那么GPT-4到底有哪些巨大的能力提升呢,让我们来一探究竟!【如需进一步交流,请私信】
一、准确性提升
GPT-4 可以更准确地解决难题,这要归功于其更广泛的常识和解决问题的能力。
GPT能力提升主要在三个方面:
1.创造力
如上图所示,是OpenAI官网展示的一个例子,这里我人肉翻译了下:
Input
用一个句子解释灰姑娘的情节,其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头,> 不重复任何字母。
Output
美丽的灰姑娘充满热切地生活,最终找到了幸福;她激发了嫉妒的亲戚们,神奇的爱情滋养着富有的王子;她悄悄地拯救了他,水晶鞋取得胜利,奇妙地将他们紧密团结在一起,这对热情洋溢的年轻人友好相处。
从上述例子汇总我们可以发现,GPT-4 比以往任何时候都更具创造性和协作性。官网说它可以生成、编辑并与用户一起迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
2.视觉输入
GPT-4还支持视觉输入
上面给出了一个例子:我可以用这些原料干什么,随后给出一张鸡蛋、面粉、奶油的图片。GPT-4给出如下回复:
Output
有很多种方法可以用这些食材制作美食!以下是一些可能的选择:
- 煎饼或华夫饼
- 可丽饼
- 法式吐司
- 煎蛋卷或意式烘蛋
- 派
- 蛋奶酥或布丁
- 蛋糕或纸杯蛋糕
- 松饼或面包
- 饼干或饼干
这只是其中的一些例子,但可能性是无穷无尽的!
这回复简直太赞了!
3.更长的上下文
GPT-4 能够处理超过 25,000 个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。
二、相比于ChatGPT有哪些提升
1.GPT-4 的高级推理能力超越了 ChatGPT
Input
安德鲁从上午11点到下午3点有空,乔安娜从中午12点到下午2点,然后从下午3点半到5点有空。汉娜在中午12点有半小时空闲,然后在下午4点到6点有空。对于安德鲁、汉娜和乔安娜来说,安排一场时长30分钟的会议,有哪些开始时间的选项?
ChatGPT Output
以下是他们的空闲时间列表:
- 安德鲁:上午11点至下午3点
- 乔安娜:中午12点至下午2点,下午3点半至5点
- 汉娜:中午12点至12点半,下午4点至6点
根据他们的空闲时间,有一个30分钟的时间窗口,这三个人都有空,即下午4点至4点半。所以,会议可以安排在下午4点
GPT-4 Output
安德鲁:上午11点 - 下午3点
乔安娜:中午12点 - 下午2点,下午3点半 - 下午5点
汉娜:中午12点 - 12点半,下午4点 - 下午6点
可以安排30分钟会议的共同空闲时间:中午12点 - 12点半
2.GPT-4 在多种测试考试中均优于 ChatGPT。
在统一律师考试中,ChatGPT排名在倒数10%内,而GPT-4或者了前10%的好成绩,而在生物奥林匹克考试中,GPT-4的领先更加夸张,或者排名前1%的好成绩,而ChatGPT才排31名。
三、研究团队在GPT-4模型都做了哪些改善
1.遵循 GPT、GPT-2 和 GPT-3 的研究路径
我们的深度学习方法利用更多数据和更多计算来创建越来越复杂和强大的语言模型。
2.我们花了 6 个月的时间使 GPT-4 更安全、更一致。
在我们的内部评估中,与 GPT-3.5 相比,GPT-4 响应不被允许内容请求的可能性低 82%,产生事实响应的可能性高 40%
3.安全与对齐:
- 1.通过人工反馈进行训练(人工+专家反馈)
- 我们纳入了更多的人工反馈,包括 ChatGPT 用户提交的反馈,以改进 GPT-4 的行为。我们还与 50 多位专家合作,在 AI 安全和保障等领域获得早期反馈。
- 2.从现实世界的使用中不断改进(现实世界反馈)
- 我们已经将我们以前模型在现实世界中使用的经验教训应用到 GPT-4 的安全研究和监控系统中。与 ChatGPT 一样,随着越来越多的人使用它,我们将定期更新和改进 GPT-4。
-
- GPT-4 辅助的安全研究(自己使用)
- GPT-4 的高级推理和指令遵循能力加快了我们的安全工作。我们使用 GPT-4 帮助创建用于模型微调的训练数据,并在训练、评估和监控过程中迭代分类器。
四、和一些开发创新产品的组织合作
- Duolingo:一种对话类应用
- Be My Eyes:使用GPT-4提高视觉能力
- Stripe:使用GPT-4简化用户体验并打击欺诈
- Morgan Stanley:使用GPT-4来管理公司内部知识库
- Khan Academy:在试点项目中探索GPT-4的潜力
- Government of Iceland:使用GPT-4保护本土语言
- Etc.
五、其他
详细研究报告
https://openai.com/research/gpt-4
基础设施:
GPT-4 在 Microsoft Azure AI 超级计算机上接受过训练。Azure 的 AI 优化基础架构还使我们能够向世界各地的用户提供 GPT-4。
局限性
GPT-4 仍然有许多我们正在努力解决的已知局限性,例如社会偏见、幻觉和对抗性提示。随着社会采用这些模型,我们鼓励并促进透明度、用户教育和更广泛的人工智能素养。我们还旨在扩大人们在塑造我们的模型时的输入途径。
可用性
我们在 ChatGPT Plus 上提供 GPT-4,并作为开发人员构建应用程序和服务的 API。
总结
GPT-4的横空出世将ChatGPT的很多局限性突破了,虽然基础模型能力只有一点提升(官方团队谦虚之语),但是在各种测试中GPT-4都完爆ChatGPT了,如果想了解更多内容或者加入到AIGC&ChatGPT的研究交流中可以私信我!
相关文章:

宇宙最强-GPT-4 横空出世:最先进、更安全、更有用
文章目录前言一、准确性提升1.创造力2.视觉输入3.更长的上下文二、相比于ChatGPT有哪些提升1.GPT-4 的高级推理能力超越了 ChatGPT2.GPT-4 在多种测试考试中均优于 ChatGPT。三、研究团队在GPT-4模型都做了哪些改善1.遵循 GPT、GPT-2 和 GPT-3 的研究路径2.我们花了 6 个月的时…...

HashMap的实际开发使用
目 录 前言 一、HashMap是什么? 二、使用步骤 1.解析一下它实现的原理 编辑 2.实际开发使用 总结 前言 本章,只是大概记录一下hashMap的简单使用方法,以及理清一下hashMap的put方法的原理,以及get方法的原理。 一、Has…...

OpenCV入门(十三)快速学会OpenCV 12 图像梯度
OpenCV入门(十三)快速学会OpenCV 12 图像梯度1.Sobel算子1.1 计算x1.2 计算y1.3 计算xy2.Scharr算子2.1 计算x2.2 计算y2.3 计算xy3.Laplacian算子4.总结图像梯度计算的是图像变化的速度。对于图像的边缘部分,其灰度值变化较大,梯…...

软考:常见小题目计算题
01采购合同的类型采购合同主要包括总价类合同、成本补偿类合同、工料合同三大类合同。1、总价类合同此类合同为既定产品、服务或成果的采购设定一个总价。这种合同应在已明确定义需求,且不会出现重大范围变更的情况下使用。包括:(1࿰…...

【Linux】进程的程序替换
文章目录1. 程序替换1.创建子进程的目的是什么?2.了解程序是如何进行替换的3. 程序替换的基本原理当创建进程的时候,先有进程数据结构,还是先加载代码和数据?程序替换是整体替换,不是局部替换execl 返回值4. 替换函数1…...

【C++】模板(上)
文章目录1、泛型编程2、函数模板函数模板的实例化模板参数的匹配原则3、 类模板类模板的实例化1、泛型编程 void Swap(int& left, int& right) {int temp left;left right;right temp; } void Swap(double& left, double& right) {double temp left;left …...

express框架利用formidable上传图片
express框架,在上传图片功能方面,用formidable里面的incomingform功能,很方便。很多功能都已经封装好了,非常好用,简单,不需要写更深层次的代码了。确实不错。 下面是我自己跟着黑马教程的博客系统的部分&…...

测试背锅侠?入职软件测试后大d佬给我丢了这个bug分类分析,至今受益匪浅......
目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 刚成为入职…...

STM32 OTA应用开发——通过内置DFU实现USB升级(方式1)
STM32 OTA应用开发——通过内置DFU实现USB升级(方式1) 目录STM32 OTA应用开发——通过内置DFU实现USB升级(方式1)前言1 硬件介绍2 环境搭建2.1 Keil uVsion2.2 zadig2.3 STM32CubeProgrammer2.4 安装USB驱动3 OTA升级结束语前言 …...

基于MFC的JavaScript进行网页数据交互
目录 前言 一、创建html对话框工程 二、使用步骤 1.引入JavaScript接口代码 2.重写相关接口 3.在html网页中添加C/C调用的接口 4.在MFC工程中添加调用接口 5.设置确认按键触发调用 6.运行结果 总结 前言 如何快速的进行MFC开发,这里我介绍一种JavaScript与C/C交互的…...

AUTOSAR-Fee
Fee模块 全称Flash EEPROM Emulation Module,属于ECU抽象层 Fee模块本身是脱离硬件的,但是Fee模块可能会引用的Fls模块定制API,所以只能算半抽象. FEE模块应从设备特定的寻址方案和分段中抽象出来,并为上层提供虚拟寻址方案和分段(virtual addressing scheme and segment…...

Linux基本命令——操作演示
Linux基本命令——操作演示Linux的目录结构Linux命令入门目录切换相关命令(cd/pwd)相对路径、绝对路径和特殊路径符创建目录命令(mkdir)文件操作命令part1 (touch、cat、more)文件操作命令part2 (cp、mv、rm)查找命令 …...

【Linux】目录和文件的权限
Linux中的权限有什么作用Linux权限管理文件访问者的分类文件类型和访问权限(事物属性)**文件权限值的表示方法**文件访问权限的相关设置方法chmodchownchgrpumaskumask使用 sudo分配权限目录的权限Linux中的权限有什么作用 Linux下有两种用户࿱…...

Unity 优化之Player Setting
Quality SettingPixel Light Count 使用前向渲染时最大像素光源数。也是性能关键。数量越大消耗越多。Texture Quality:贴图质量,可以选择Half Res,这样速度会更快,但是贴图质量会轻微下降。Anisotropic Textures 纹理各向异形Ant…...
Qt——通过一个简单的程序例程熟悉使用Qt Creator软件进行项目搭建的基本流程(新建项目、项目的文件组成、修改ui文件、编译运行与调试)
【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《项目案例分享》 《极客DIY开源分享》 《嵌入式通用开发实战》 《C++语言开发基础总结》 《从0到1学习嵌入式Linux开发》 《QT开发实战》 《Android开发实战》...

Linux 如何使用 git | 新建仓库 | git 三板斧
文章目录 专栏导读 一、如何安装 git 二、注册码云账号 三、新建仓库 配置仓库信息 四、克隆远端仓库到本地 五、git 三板斧 1. 三板斧第一招:git add 2. 三板斧第二招:git commit 解决首次 git commit 失败的问题 配置机器信息 3. 三…...

3.springcloud微服务架构搭建 之 《springboot自动装配ribbon》
1.springcloud微服务架构搭建 之 《springboot自动装配Redis》 2.springcloud微服务架构搭建 之 《springboot集成nacos注册中心》 ribbon工作原理自己网上百度,说的都很详细 目录 1.项目引入openfeign和ribbon配置 2.新建lilock-ribbon-spring-boot-starter 3…...

【一】进程到底是个啥?
1. 什么是进程 进程(process):一个运行起来的程序,就是进程!,我们可以在任务管理中看到进程。 进程是操作系统进行资源分配的基本单位 2. 进程的管理 所谓的进程管理,其实就是分为两步&…...

[蓝桥杯] 双指针、BFS和DFS与图论问题
文章目录 一、日志统计 1、1 题目描述 1、2 题解关键思路与解答 二、献给阿尔吉侬的花束 2、1 题目描述 2、2 题解关键思路与解答 三、红与黑 3、1 题目描述 3、2 题解关键思路与解答 3、2、1 dfs题解代码 3、2、2 bfs题解答案 四、交换瓶子 4、1 题目描述 4、2 题解关键思路与…...

编译原理陈火旺版第四章课后题答案
下面答案仅供参考! 1.考虑下面文法G1: (1) 消去 Q 的左递归。然后,对每个非终结符,写岀不带回溯的递归子程序。 (2) 经改写后的文法是否是LL(1)的?给出它的预测分析表。 2.对下面的文法G: P→(E)lalblΛ (1)计算这个文法的每个非…...

Chapter03-Authentication vulnerabilities
文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...

中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试
作者:Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位:中南大学地球科学与信息物理学院论文标题:BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接:https://arxiv.…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
基于Uniapp开发HarmonyOS 5.0旅游应用技术实践
一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...

CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...
2023赣州旅游投资集团
单选题 1.“不登高山,不知天之高也;不临深溪,不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...

以光量子为例,详解量子获取方式
光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学(silicon photonics)的光波导(optical waveguide)芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中,光既是波又是粒子。光子本…...