当前位置: 首页 > news >正文

GPT-4:论文阅读笔记

  • GPT-4的输入和输出:输入的内容是文本或图片,输出的内容是文本。因此,GPT-4是一种输入端多模态的模型。
  • GPT-4的效果:在真实世界中还是比不上人类,但是在很多专业性的任务上已经达到了人类的水平,甚至超过人类。例如GPT-4能够在所有考生中以前10%的成绩通过律师资格证考试(GPT-3.5只能排在末尾的10%)。
  • GPT-4的图片输入功能:GPT-4目公布的内容还不支持图片上传,这个属于内测功能。目前,OpenAI只选择了一家合作公司测试图片输入功能。
  • GPT-4的align过程:GPT-4用了六个月的时间进行Align。这里的Align一方面使得模型能够执行人类的指令,同时使得模型能够生成与人类三观一致并且安全有用的输出。Align的方法包括使用根据用户体验中不好的例子进行学习。OpenAI认为GPT-4是它们目前最好的模型,在安全性可控性等方面都有了很大的进步。
  • GPT-4的深度学习栈:OpenAI重建了深度学习栈(与微软云Azure一起),并且为了训练GPT-4重新设计了一个超级计算集群。一年前该集群也被用于训练GPT-3.5。在这次的训练中,他们修复了一些BUG,并发现训练过程非常稳定。
  • GPT-4的训练任务:GPT-4也是使用传统的语言模型任务进行训练的。
  • RLHF的作用:为了使得模型的回答能够与人类的意图保持一致,以及保持模型的安全可控。(或者说,RLHF就是为了对模型做控制,让模型更能够知道提问者的意图,并按照用户喜欢的方式进行作答)
  • 预训练中的发现:OpenAI发现模型的能力好像就是从预训练的过程中获得的,RLHF并不能提高各种考试的成绩,有时还会使得成绩下降。
  • 可预测的训练损失:OpenAI在GPT-4开始训练时,就知道最终的损失结果。这个损失结果是通过另一个小一万倍的数据集(但是方法相同)上训练的损失函数外推出来的。因为大模型的训练稳定性是非常重要的,所以这样的方法非常实用。
  • GPT-4更加理性:之前的大模型有一种情况,就是模型越大,其本身就越来越不理性。但是GPT-4克服了这个缺点。
  • GPT-4和GPT-3.5的能力对比:对于日常对话,GPT-4和GPT-3.5的差别不大。但是任务难度增加后,这个区别就体现出来了,GPT-4更加可靠且更加有创造力。
  • GPT-4的数学和文学不好:GPT-4的数学仍然不好。另外,GPT-4在语言学和文学的本身考试上能力也不够强,但是其生成的东西大多数是空话。
  • GPT-4与其他NLP大模型的对比:GPT-4在多个Benchmark数据集上的表现都明显高于之前的其他语言模型,而且是大幅度碾压。
  • GPT-4与其他CV大模型的对比:GPT-4的图像输入表现也不错,但是比不上GPT-4在NLP的效果。
  • GPT-4的多语言性能:GPT-4在英语上的性能最好,中文也有不错的结果。另外,GPT-4在不同语言的性能与使用语言的人数没有直接关系。
  • GPT-4的System Message功能:让GPT-4扮演一个指定的角色,由此确定与用户对话时的语气语调。
  • GPT-4的安全性:GPT-4的安全性已经显著提高了,相较于GPT-3.5提高了40%。另外,GPT-4通过自己提升安全性:在RLHF的过程中设置了一个奖励信号,根据预训练好的模型创建一个分类器,判断一个回答是否是敏感的、有危险的和不应该回答的,从而提升自身的回答安全性。
  • GPT-4的限制:GPT-4的训练数据截至时间到2021年的9月份(尽管在后续的过程中可能会使用新的数据更新模型)。另外,GPT-4容易受到用户的欺骗。
  • GPT-4的置信度:在经过RLHF之前,GPT-4对回答内容的置信度和答案本身的正确可能性基本上是对齐的。但是,经过RLHF之后,模型的校准明显下降了很多。
  • GPT-4的文本长度:GPT-4的文本长度是8192个Token,这个相较于之前的模型已经是非常长的了。另外,GPT-4还有一个32768个Token长度的版本。
  • GPT-4的一种图像生成方法:先让GPT-4根据指定的描述生成代码,然后运行代码得到图片。GPT-4通过这种方式可以生成图像,但是都是比较初级的图像。

相关文章:

GPT-4:论文阅读笔记

GPT-4的输入和输出:输入的内容是文本或图片,输出的内容是文本。因此,GPT-4是一种输入端多模态的模型。GPT-4的效果:在真实世界中还是比不上人类,但是在很多专业性的任务上已经达到了人类的水平,甚至超过人类…...

hm商城微服务远程调用及拆分

RequiredArgsConstructor是Lombok库中的一个注解 它会自动在类中生成一个构造函数,这个构造函数会接收类中所有被标记为final的字段,并将其作为参数。这个注解可以帮助我们减少样板代码,例如手动编写构造函数。 eg: public fin…...

设置指定时间之前的时间不可选

1、el-date-picker设置今天之前的日期不可选 <el-date-picker style"width: 100%" type"date" v-model"form.resetDate" align"right" :value-format"yyyy-MM-dd" placeholder"选择调整日期":disabled"t…...

Java使用Redis来实现分布式锁

Java使用Redis来实现分布式锁 在单节点服务中&#xff0c;我们可以使用synchronized来保证同一时间内只允许一个线程执行限定的代码块。但是如果我们是多节点服务呢&#xff0c;因为synchronized是针对服务内部的&#xff0c;其他服务是无法受到他的干预的。那么如何保证多个节…...

移动端表格分页uni-app

使用uni-app提供的uni-table表格 网址&#xff1a;https://uniapp.dcloud.net.cn/component/uniui/uni-table.html#%E4%BB%8B%E7%BB%8D <uni-table ref"table" :loading"loading" border stripe type"selection" emptyText"暂无更多数据…...

全志R128芯片RTOS调试指南

RTOS 调试指南 此文档介绍 FreeRTOS 系统方案支持的常用软件调试方法&#xff0c;帮助相关开发人员快速高效地进行软件调试&#xff0c;提高解决软件问题的效率。 栈回溯 栈回溯是指获取程序的调用链信息&#xff0c;通过栈回溯信息&#xff0c;能帮助开发者快速理清程序执行…...

超级实用的程序员接单平台,看完少走几年弯路,强推第一个!

“前途光明我看不见&#xff0c;道路曲折我走不完。” 兜兜转转&#xff0c;心心念念&#xff0c;念念不忘&#xff0c;必有回响。终于找到了… 网络上好多人都在推荐程序员线上接单&#xff0c;有人说赚得盆满钵满&#xff0c;有的人被坑得破口大骂&#xff0c;还有的人甚至还…...

前端字符串方法汇总

1、length属性 const sss lengthconsole.log(字符串长度是, sss.length) 2、chartAt() charAt()和charCodeAt()方法都可以通过索引来获取指定位置的值&#xff1a; charAt() 方法获取到的是指定位置的字符&#xff1b;charCodeAt()方法获取的是指定位置字符的Unicode值。 …...

12 分布式锁加入看门狗

1、看门狗的流程图 2、看门狗的代码实现 /****类说明&#xff1a;Redis的key-value结构*/ public class LockItem {private final String key;private final String value;public LockItem(String key, String value) {this.key key;this.value value;}public String getKey…...

怎么判断list是否为null

List<Entity> baseMess new ArrayList<>(); baseMess motiveService.getBaseMessage(machine.get(i),preDate,nowDate); System.out.println("获取Size"baseMess.size()); baseMess.removeIf(Objects::isNull); System.out.println("获取Size"…...

11.数据公式中使用2个 $$ a =b $$,是什么意思?

在 LaTeX 中&#xff0c;双美元符号 $$ 用于进入和退出独立的数学模式&#xff0c;也就是数学公式模式。在 $$ 中的文本将被视为数学公式&#xff0c;并以数学排版的方式显示。 具体地说&#xff0c;$$ 的使用是为了在文档中创建居中显示的独立数学公式。这意味着公式将单独占…...

设计模式-14-迭代器模式

经典的设计模式有23种&#xff0c;但是常用的设计模式一般情况下不会到一半&#xff0c;我们就针对一些常用的设计模式进行一些详细的讲解和分析&#xff0c;方便大家更加容易理解和使用设计模式。 1-原理和实现 迭代器模式&#xff08;Iterator Design Pattern&#xff09;&a…...

防雷接地+防雷工程施工综合方案

一、地凯科技防雷工程接地概述 防雷接地工程是指在建筑物或其他设施上安装防雷装置&#xff0c;以防止雷电对人员、设备和建筑物造成危害的工程。防雷装置主要包括避雷针&#xff08;网&#xff09;、引下线、接地体&#xff08;网&#xff09;等部分&#xff0c;其中接地体&a…...

排序算法--选择排序

实现逻辑 ① 第一轮从下标为 1 到下标为 n-1 的元素中选取最小值&#xff0c;若小于第一个数&#xff0c;则交换 ② 第二轮从下标为 2 到下标为 n-1 的元素中选取最小值&#xff0c;若小于第二个数&#xff0c;则交换 ③ 依次类推下去…… void print_array(int a[], int n){f…...

【Web】Ctfshow SSRF刷题记录1

核心代码解读 <?php $url$_POST[url]; $chcurl_init($url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); $resultcurl_exec($ch); curl_close($ch); ?> curl_init()&#xff1a;初始curl会话 curl_setopt()&#xff1a;会…...

【算法挨揍日记】day30——300. 最长递增子序列、376. 摆动序列

300. 最长递增子序列 300. 最长递增子序列 题目解析&#xff1a; 给你一个整数数组 nums &#xff0c;找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列&#xff0c;删除&#xff08;或不删除&#xff09;数组中的元素而不改变其余元素的顺序。例如&#…...

ROS2对比ROS1的一些变化与优势(全新安装ROS2以及编译错误处理)《1》

1、概述 我们在前面介绍的ROS&#xff0c;都是ROS1的版本&#xff0c;近期对机器狗进行学习的时候&#xff0c;发现版本是ROS2了&#xff0c;也发现平时习惯的一些命令都有了变化&#xff0c;改变还是挺大的&#xff0c;不过熟悉之后还是很习惯ROS2的写法。 ROS2不是在ROS1的基…...

基于单片机PM2.5监测系统仿真设计

**单片机设计介绍&#xff0c; 基于单片机PM2.5监测系统仿真设计 文章目录 一 概要简介设计目标系统组成工作流程仿真设计结论 二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 # 基于单片机PM2.5监测系统仿真设计介绍 简介 PM2.5&#xff08;可吸…...

CRM系统中的联系人是什么?如何进行联系人管理?

上手CRM系统前掌握专业术语是必要的功课&#xff0c;在第一次使用CRM系统时小编和大家一样&#xff0c;分不清楚线索、联系人、客户、商机之间的关系&#xff0c;今天我们就来着重分享一下CRM中联系人是什么&#xff1f;如何进行联系人管理&#xff1f; CRM系统联系人是指能够…...

uniapp:如何实现点击图片可以全屏展示预览

这个需要使用uniapp中的api&#xff1a;uni.previewImage&#xff0c;使用方法如下 1、html <template><view><image src"图片路径" click"preview"></image></view> </template> 2、JavaScript <script> e…...

AI代理成本管理:基于MCP协议构建成本监控与预算控制系统

1. 项目概述&#xff1a;一个为AI代理成本管理而生的MCP服务器最近在折腾AI应用开发&#xff0c;特别是基于大语言模型的智能代理&#xff08;Agent&#xff09;时&#xff0c;发现一个挺头疼的问题&#xff1a;成本不可控。你给Agent接上各种工具&#xff0c;让它去调用搜索引…...

技能进化系统:用数据可视化与网状图谱管理个人知识成长

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目&#xff0c;叫“skill-evolution”。光看这个名字&#xff0c;你可能会联想到技能树、能力进化或者某种学习系统。没错&#xff0c;这个项目本质上就是一个个人技能管理与进化追踪系统。它不是那种简单的待办清单&a…...

Nextpy框架深度解析:编译型AI应用开发与自修改软件实践

1. 项目概述&#xff1a;Nextpy&#xff0c;一个为自修改软件而生的框架最近在探索AI驱动的应用开发时&#xff0c;我深度体验了一个名为Nextpy的开源框架。它给我的第一印象&#xff0c;就像是为那些不满足于静态代码、希望构建能够自我进化系统的开发者量身打造的工具箱。简单…...

UI-TARS桌面版:重构GUI自动化前沿的技术革命与智能自动化创新架构

UI-TARS桌面版&#xff1a;重构GUI自动化前沿的技术革命与智能自动化创新架构 【免费下载链接】UI-TARS-desktop The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra 项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS…...

Windows安卓应用安装神器:APK-Installer完全指南

Windows安卓应用安装神器&#xff1a;APK-Installer完全指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经希望在Windows电脑上直接安装安卓应用&#xff…...

Arm Socrates™ IP工具平台:SoC设计的高效解决方案

1. Arm Socrates™ IP工具平台概述 Arm Socrates™是Arm公司推出的一款专业IP工具平台&#xff0c;专为系统级芯片(SoC)设计工程师打造。作为一个集成化开发环境&#xff0c;它提供了从IP选型、配置到构建的完整工作流程&#xff0c;极大简化了基于Arm IP的SoC设计过程。 1.1…...

氢燃料微型燃气轮机增程系统建模及控制策略【附代码】

✅ 博主简介&#xff1a;擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导&#xff0c;毕业论文、期刊论文经验交流。 ✅ 如需沟通交流&#xff0c;扫描文章底部二维码。&#xff08;1&#xff09;微型燃气轮机模块化建模与燃烧室温度-转速耦合仿真&#xff…...

API规范即代码:基于OpenAPI/Swagger的自动化管理与质量门禁实践

1. 项目概述&#xff1a;一个为开发者而生的API规范管理工具如果你和我一样&#xff0c;长期在软件开发的泥潭里摸爬滚打&#xff0c;尤其是在前后端分离、微服务架构成为主流的今天&#xff0c;一定对“接口文档”这四个字又爱又恨。爱的是&#xff0c;一份清晰、准确的API文档…...

AI驱动Premiere Pro:基于MCP协议的自然语言视频剪辑自动化实践

1. 项目概述&#xff1a;一个为创意工作者量身打造的AI助手如果你是一名视频剪辑师、内容创作者&#xff0c;或者任何需要频繁与Adobe Premiere Pro打交道的创意工作者&#xff0c;那么你肯定对“重复劳动”深恶痛绝。每天&#xff0c;我们都在与时间线、素材箱、效果控件面板搏…...

集团首都公报:继美国谷歌公司、苹果公司之后,世界第三家手机控制系统公司(即     武汉市放飞炬人控制系统有限公司)今天2026年5月6日9点36分获得官方批准。

集团首都公报&#xff1a;继美国谷歌公司、苹果公司之后&#xff0c;世界第三家手机控制系统公司&#xff08;即 武汉市放飞炬人控制系统有限公司&#xff09;今天2026年5月6日9点36分获得官方批准。...