当前位置: 首页 > news >正文

ChatGPT- OpenAI 的 模型(Model) 介绍

        ChatGPT的火爆程度大家都知道了,该章节我们来了解一下 ChatGPT 一个关键概念 - 模型(Model)。主要是为大家介绍一下在 OpenAI 中,究竟有哪些模型可以使用。

在后续的章节,我们会分单独的小章节逐一的为大家介绍各个不同模型的调用以及接口参数的一些说明,该章节我们先来做一个大概得了解即可。

⭐ OpenAI 模型列表
模型    描述
GPT3    一种基于人工智能的自然语言处理模型,可以实现自然语言理解和自然语言生成等任务。
GPT-3.5    基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
GPT-4    一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码
DALL·E    可以将自然语言描述转换为高质量图像的图像生成模型。
Whisper    一种基于语音识别和自然语言处理技术的智能语音助手,可以实现高质量的语音识别和语音转换。
Embeddings    一种自然语言处理技术,可以将自然语言文本转换为向量表示的模型。
Codex    一种可以将自然语言描述转换为代码,从而实现快速编写和自动化编程的模型。
Moderation    一种内容审核模型,可以自动检测和过滤出不良内容,从而保护用户的权益和利益。

除此之外,OpenAI还发布了一些开源模型, Point-E、Jukebox 和 CLIP,接下来就为大家分别介绍一下这些模型的作用。

⭐ GPT 模型
ChatGPT的GPT模型是一种强大的自然语言处理模型,可以自动产生自然流畅的文本。随着模型的不断升级,GPT模型的语言生成能力和应用场景也在不断扩展,为多个领域提供更加智能、高效和便捷的解决方案。

GPT-1:是最早的GPT模型,采用了基于Transformer的模型架构。它在多个自然语言处理任务上取得了良好的表现,但是生成的文本质量相对较低。
GPT-2:是GPT模型的升级版,拥有更多的参数和更强大的语言生成能力。可以自动产生高质量、连贯、自然的文本,同时也可以应用于多个领域,如智能客服、智能问答等。
GPT-3:是目前最先进的GPT模型,拥有数十亿个参数和强大的语言生成能力。它可以自动产生高质量、连贯、自然的文本,同时还可以完成更加复杂的自然语言任务,如机器翻译、自动摘要等,比 GPT-2 更加强大。
GPT-3.5:是基于 GPT-3 改进的模型,更加强大和智能,可以理解并生成自然语言或代码。
GPT4:目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。
🌟 GPT-3 模型
GPT-3 模型可以理解和生成自然语言。这些模型被更强大的 GPT-3.5 代模型所取代。然而,最初的 GPT-3 基础模型(davinci、curie、ada 和 babbage)是目前唯一可用于微调的模型。


最新模型    描述    最大 TOKENS    训练日期
text-curie-001    非常有能力,比 Davinci 更快,成本更低。    2,049 tokens    Up to Oct 2019
text-babbage-001    能够执行简单的任务,速度非常快,成本更低。    2,049 tokens    Up to Oct 2019
text-ada-001    能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。    2,049 tokens    Up to Oct 2019
davinci    功能最强大的 GPT-3 模型。可以完成其他模型可以完成的任何任务,而且通常质量更高。    2,049 tokens    Up to Oct 2019
curie    能力很强,但比 Davinci 更快,成本更低。    2,049 tokens    Up to Oct 2019
babbage    能够执行简单的任务,速度非常快,成本更低。    2,049 tokens    Up to Oct 2019
ada    能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。    2,049 tokens    Up to Oct 2019
🌟 GPT-3.5 模型
建议在试验时使用gpt-3.5-turbo,因为它会产生最佳结果。一旦一切正常,可以尝试其他模型,看看是否能以更低的延迟或成本获得相同的结果。

GPT-3.5 模型可以理解并生成自然语言或代码。OpenAI 在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的完成任务。


最新模型    描述    最大tokens    训练日期

gpt-3.5-turbo    功能最强大的 GPT-3.5 模型并针对聊天进行了优化,
成本仅为 text-davinci-003 的 1/10,
将使用最新的模型迭代进行更新。    
4,096 tokens    
Up to Sep 2021

gpt-3.5-turbo-0301    2023 年 3 月 1 日的 gpt-3.5-turbo 快照,
与 gpt-3.5-turbo 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 1 日结束的三个月内提供支持。    
4,096 tokens    
Up to Sep 2021

text-davinci-003    可以比 curie、babbage 或 ada 模型
更好的质量、更长的输出,和一致的指令
遵循来完成任何语言任务。还支持在文本中插入补全。    
4,097 tokens    
Up to Jun 2021

ext-davinci-002    与 text-davinci-003 类似的功能,
但使用supervised fine-tuning
而不是强化学习进行训练    
4,097 tokens    
Up to Jun 2021
code-davinci-002    针对代码完成任务进行了优化    8,001 tokens    Up to Jun 2021
🌟 GPT-4 模型
GPT-4 目前处于有限测试阶段,只有获得访问权限的人才能访问。请加入候补名单,以便在容量可用时获得访问权限。

GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,将来会出现图像输入),由于其更广泛的常识和高级推理,它可以比以前的任何模型更准确地解决难题能力。与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于传统的补全任务。

最新模型    描述    最大 TOKENS    训练日期

gpt-4    比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,

并针对聊天进行了优化。将使用最新的模型迭代进行更新。    
8,192 tokens    
Up to Sep 2021

gpt-4-0314    2023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同,

该模型不会收到更新,并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。    
8,192 tokens    
Up to Sep 2021

gpt-4-32k    与基本 gpt-4 模式相同的功能,

但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。    
32,768 tokens    
Up to Sep 2021

gpt-4-32k-0314    2023 年 3 月 14 日的 gpt-4-32 快照。
与 gpt-4-32k 不同,此模型不会收到更新,
并且仅在 2023 年 6 月 14 日结束的三个月内提供支持。    
32,768 tokens    
Up to Sep 2021
对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。然而,在更复杂的推理情况下,GPT-4 比之前的任何模型都更有能力。

⭐ 特定功能的模型
虽然目前最新的 gpt-3.5-turbo 模型针对聊天对话进行了优化,但是这个模型只适合适合传统的完成任务。原始 GPT-3.5 模型针对文本补全进行了优化。

试用 gpt-3.5-turbo 是了解 API 功能的好方法。在了解要完成的任务后,我们可以继续使用 gpt-3.5-turbo 或其他模型并尝试围绕其功能进行优化。

🌟 DALL·E 模型
DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过 API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。

DALL·E模型可以生成与文本描述相符的高质量图像,包括人物、动物、物体、场景等。与传统的图像生成模型相比,DALL·E模型可以生成更加丰富和多样化的图像,同时还可以生成符合逻辑和语义的图像。

DALL·E模型的训练数据来自于多个来源,包括网络上的图像、图像数据库以及自然语言描述。模型使用这些数据来学习如何将语言描述转换为图像,并在训练过程中不断优化模型的性能。

DALL·E模型可以应用于多个场景,如图像生成、视觉效果、设计和创意等领域。它可以为设计师、艺术家、广告公司等提供更加高效和创新的图像生成工具,同时也可以为普通用户提供更加丰富和多样化的图像内容。

可以通过实验室的界面或API进行试用,DALL·E室验室地址: https://labs.openai.com/ 可以在线体验DALLE的功能。

🌟 Whisper模型
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过 OpenAI 的 API 使用 whisper-1 模型名称获得。

目前,Whisper 的开源版本与通过 OpenAI 的 API 提供的版本之间没有区别。ChatGPT的Whisper模型是一种基于语音识别和自然语言处理技术的智能语音助手,可以帮助用户实现语音控制、智能问答和语音交互等功能。

Whisper模型采用了深度神经网络和语音识别技术,可以实现高质量的语音识别和语音转换。同时,模型还采用了自然语言处理技术,可以将语音转换为文本,并进行语义分析和理解,从而实现智能问答和语音交互。

Whisper模型可以应用于多个场景,如智能家居、智能客服、语音搜索等领域。它可以为用户提供更加便捷和高效的语音控制和交互方式,同时也可以为企业提供更加智能和人性化的客服和搜索服务。

提示:可以使用Whiper这种模型,为语音生成文本,这在视频生成字幕方面,语音识别等领域将会有很多相关应用。

🌟 Embeddings 模型
ChatGPT的Embeddings模型是一种自然语言处理技术,可以将自然语言文本转换为向量表示,从而实现自然语言文本的语义分析和文本分类等任务。

Embeddings模型采用了深度学习和神经网络技术,通过学习自然语言文本的上下文关系,将文本转换为向量表示。这种向量表示可以捕捉文本的语义信息和上下文关系,从而实现文本的语义分析和文本分类等任务。

Embeddings模型可以应用于多个场景,如文本分类、情感分析、实体识别等领域。它可以为企业提供更加精准和智能的文本分类和情感分析服务,同时也可以为用户提供更加个性化和智能的文本推荐和搜索服务。

总之,ChatGPT的Embeddings模型是一种强大的自然语言处理技术,可以将自然语言文本转换为向量表示,为文本分类、情感分析和实体识别等任务提供更加精准和智能的解决方案。

🌟 Codex 模型
Codex 模型是可以自然语言理解的和生成代码的 GPT-3 模型的后代。他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。

他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

OpenAI目前提供两种 Codex 型号:

最新模型    描述    最大 TOKENS    训练日期
code-davinci-002    功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。
除了补全代码,还支持在代码中插入补全。    8001 tokens    Up to Jun 2021
code-cushman-001    几乎与 Davinci Codex 一样强大,但速度稍快。
这种速度优势可能使其成为实时应用程序的首选。    Up to 2048 tokens    Up to Jun 2021
Codex 模型在有限的测试版期间可以免费使用,并且会降低速率限制。

在此期间,只要符合 OpenAI 的使用政策,OPenAI非常欢迎也非常乐意为这些模型时提供任何反馈,并期待能与官方社区进行更多的互动。

🌟 Moderation 审核模型
还有一种特殊的模型,那就是 “审核模型” 。"审核模型"旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能:仇恨、威胁、自残、性、未成年人、暴力图片。

大家都知道做为一个人工智能,OpenAI 是要禁止那些违反法律,道德,甚至人性底线的提问,这也是一个AI需 要遵守的基本底线。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

模型    描述
text-moderation-latest    最有能力的审核模型。精度会比稳定模型略高
text-moderation-stable    几乎与最新型号一样强大,但稍旧一些。
⭐ 持续的模型升级
随着 gpt-3.5-turbo 的发布,OpenAI 的一些模型现在正在不断更新。为了减少模型更改以意外方式影响我们用户的可能性,官方将提供在 3 个月内保持静态的模型版本。随着模型更新的新节奏,OPenAI官方还希望人们能够贡献更多的评估,以帮助他们针对不同的用例改进模型。

以下模型是将在指定日期弃用的临时快照。如果想使用最新的模型版本,请使用标准模型名称,如 gpt-4 或 gpt-3.5-turbo。

模型名称    弃用日期
gpt-3.5-turbo-0301    June 1st,2023
gpt-4-0314    June 14th,2023
gpt-4-32k-0314    June 14th,2023
 

相关文章:

ChatGPT- OpenAI 的 模型(Model) 介绍

ChatGPT的火爆程度大家都知道了,该章节我们来了解一下 ChatGPT 一个关键概念 - 模型(Model)。主要是为大家介绍一下在 OpenAI 中,究竟有哪些模型可以使用。 在后续的章节,我们会分单独的小章节逐一的为大家介绍各个不同模型的调用以及接口参…...

X 态及基于 VCS 的 X-Propagation 检测

🔥点击查看精选 IC 技能树系列文章🔥 🔥点击进入【芯片设计验证】社区,查看更多精彩内容🔥 📢 声明: 🥭 作者主页:【MangoPapa的CSDN主页】。⚠️ 本文首发于CSDN&#…...

数据库之事务隔离级别详解

事务隔离级别详解 一、事务的四大特性(ACID)1. 原子性(atomicity):2. 一致性(consistency):3. 隔离性(isolation):4. 持久性(durability): 二、事务的四种隔离级别1. 读未提交(Read uncommitted)&#xff1…...

守护进程、僵尸进程、孤儿进程

守护进程、僵尸进程、孤儿进程 守护进程(Daemon Process) 定义 守护进程又称Daemon进程(精灵进程),是Linux中的后台服务进程。 它的生命周期较长,通常独立于控制终端并且周期性地执行某种任务或者等待处…...

软件设计师笔记

软件设计师笔记 计算机组成与体系结构 数据的表示、计算机结构、Flynn分类法、CISC与RISC、流水线技术、存储系统、总线系统、可靠性、校验码 1. 数据的表示 (一)进制转换 R进制转十进制使用按权展开法: 十进制转R进制使用短除法 二进制…...

4_用dockerfile制作镜像

Docker 镜像原理 思考: Docker 镜像本质是什么? Docker 中一个centos镜像为什么只有200MB,而一个centos操作系统的iso文件要几个个G? Docker 中一个tomcat镜像为什么有500MB,而一个tomcat安装包只有70多MB&#xff…...

肝一肝设计模式【四】-- 建造者模式

系列文章目录 肝一肝设计模式【一】-- 单例模式 传送门 肝一肝设计模式【二】-- 工厂模式 传送门 肝一肝设计模式【三】-- 原型模式 传送门 肝一肝设计模式【四】-- 建造者模式 传送门 文章目录 系列文章目录前言一、什么是建造者模式二、举个栗子三、静态内部类写法四、开源框…...

从设计到产品

从设计到产品 最近上的一些课的笔记,从 0 开始设计项目的角度去看产品。 设计系统 设计系统(design system) 不是 系统设计(system design),前者更偏向于 UI/UX 设计部分,后者更偏向于实现部分。 个人觉得,前端开发与 UI/UX 设…...

《疯狂Python讲义》值传递的细节

函数的参数包含着整个程序的规范性,之前还是没有那么去注意重要的细节,读完书中函数值传递篇章,还是有所收获的。 参数有两种形式,一种是形参一种是实参,形参可以理解为实参的载体,函数当中的关键词也是描…...

【7. ROS 中的 IMU 惯性测量单元消息包】

欢迎大家阅读2345VOR的博客【6. 激光雷达接入ROS】🥳🥳🥳 2345VOR鹏鹏主页: 已获得CSDN《嵌入式领域优质创作者》称号👻👻👻,座右铭:脚踏实地,仰望星空&#…...

pcie m.2固态硬盘装机后无法识别到启动盘

1、第一种情况《系统版本过低》 原因: 使用m.2固态硬盘的电脑,最好安装iwn8.1以上的系统,因为win7系统及其win xp系统 没有自带NVME驱动。 搞定办法: 比较简单的方式就是直接开运行快启动u盘启动盘制作工具将系统升级到win10系…...

Java Web应用开发 ——第四章:JavaBean技术测验

一.单项选择题&#xff08;共13题,55.9分&#xff09; 1 在 JSP 中调用 JavaBean 时不会用到的标记是&#xff1a;&#xff08; &#xff09; A、 < jsp:javabean> B、 < jsp:useBean> C、 < jsp:setProperty> D、 < jsp:getProperty> 正确答案&a…...

CTF权威指南 笔记 -第二章二进制文件- 2.4 -动态链接

目录 静态文件的缺点 动态链接 位置无关代码 延迟绑定 _dl_runtime_reslove 函数定义 深入审视 静态文件的缺点 随着可执行文件的增加 静态链接带来的浪费空间问题就会愈发严重 如果大部分可执行文件都需要glibc 那么在链接的时候就需要把 libc.a链接进去 如果一个libc…...

C++:计算机操作系统:多线程:高并发中的线程

高并发中的线程 一切要从CPU说起PC 程序计数器从CPU到操作系统从进程到线程 从这篇开始&#xff0c;我将会开启高性能&#xff0c;高并发系列&#xff0c;本篇是给系列的开篇&#xff0c;主要关注 多线程以及线程池。 一切要从CPU说起 你可能会有疑问&#xff0c;讲多线程为何…...

大数据Doris(十一):Aggregate 数据模型

文章目录 Aggregate 数据模型 一、导入数据聚合 二、保留明细数据...

osg::Drawable类通过setDrawCallback函数设置回调函数的说明

osg::Drawable类可以通过该类的setDrawCallback函数设置回调函数类对象。被设置的回调类对象必须从osg::Drawable::DrawCallback类派生&#xff0c;并重写drawImplementation函数&#xff0c;以实现自己特定的需求。这个回调函数在每次帧事件中都会被调用(如&#xff1a;在帧的…...

Python基础合集 练习17(类与对象)

class Dog: pass papiDog() print(papi) print(type(papi)) 构建方法 创建类过后可以定义一个特殊的方法。在python中构建方法是__init__(),init()必须包含一个self参数 class pig(): #def__init__(self) -> None&#xff1a; print(‘你好’) pipgpig() 属性和方法 cl…...

再多猜一次就爆炸(小黑子误入)

目录 猜数字游戏 游戏设计思路 1.电脑随机生成一个数 2.猜数字 3.输入我是ikun&#xff0c;泰裤辣! 否则电脑将在一分钟后关机 游戏运行效果 源码 代码分析 代码实现关键语句 strcmp() rand()与srand() 时间戳time() 寄语 猜数字游戏 游戏设计思路 1.电脑随机生…...

图像超分辨率简单介绍

文章目录 图像超分辨率简单介绍什么是图像超分辨率&#xff1f;常见的图像超分辨率算法插值算法基于边缘的图像重建算法局部线性嵌入&#xff08;LLE&#xff09;拉普拉斯正则化 基于深度学习的超分辨率算法超分辨率CNN超分辨率GAN 步骤1. 收集数据2. 选择算法3. 训练模型4. 测…...

【Liunx】进程的程序替换——自定义编写极简版shell

目录 进程程序替换[1~5]1.程序替换的接口&#xff08;加载器&#xff09;2.什么是程序替换&#xff1f;3.进程替换的原理4.引入多进程5.系列程序替换接口的详细解析&#xff08;重点&#xff01;&#xff09; 自定义编写一个极简版shell[6~8]6.完成命令行提示符7.获取输入的命令…...

oracle与MySQL数据库之间数据同步的技术要点

Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异&#xff0c;它们的数据同步要求既要保持数据的准确性和一致性&#xff0c;又要处理好性能问题。以下是一些主要的技术要点&#xff1a; 数据结构差异 数据类型差异&#xff…...

苍穹外卖--缓存菜品

1.问题说明 用户端小程序展示的菜品数据都是通过查询数据库获得&#xff0c;如果用户端访问量比较大&#xff0c;数据库访问压力随之增大 2.实现思路 通过Redis来缓存菜品数据&#xff0c;减少数据库查询操作。 缓存逻辑分析&#xff1a; ①每个分类下的菜品保持一份缓存数据…...

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式&#xff1a;dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一&#xff0c;腐蚀跟膨胀属于反向操作&#xff0c;膨胀是把图像图像变大&#xff0c;而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...

LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》

这段 Python 代码是一个完整的 知识库数据库操作模块&#xff0c;用于对本地知识库系统中的知识库进行增删改查&#xff08;CRUD&#xff09;操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 &#x1f4d8; 一、整体功能概述 该模块…...

【Linux手册】探秘系统世界:从用户交互到硬件底层的全链路工作之旅

目录 前言 操作系统与驱动程序 是什么&#xff0c;为什么 怎么做 system call 用户操作接口 总结 前言 日常生活中&#xff0c;我们在使用电子设备时&#xff0c;我们所输入执行的每一条指令最终大多都会作用到硬件上&#xff0c;比如下载一款软件最终会下载到硬盘上&am…...

【免费数据】2005-2019年我国272个地级市的旅游竞争力多指标数据(33个指标)

旅游业是一个城市的重要产业构成。旅游竞争力是一个城市竞争力的重要构成部分。一个城市的旅游竞争力反映了其在旅游市场竞争中的比较优势。 今日我们分享的是2005-2019年我国272个地级市的旅游竞争力多指标数据&#xff01;该数据集源自2025年4月发表于《地理学报》的论文成果…...

Java并发编程实战 Day 11:并发设计模式

【Java并发编程实战 Day 11】并发设计模式 开篇 这是"Java并发编程实战"系列的第11天&#xff0c;今天我们聚焦于并发设计模式。并发设计模式是解决多线程环境下常见问题的经典解决方案&#xff0c;它们不仅提供了优雅的设计思路&#xff0c;还能显著提升系统的性能…...

【Ftrace 专栏】Ftrace 参考博文

ftrace、perf、bcc、bpftrace、ply、simple_perf的使用Ftrace 基本用法Linux 利用 ftrace 分析内核调用如何利用ftrace精确跟踪特定进程调度信息使用 ftrace 进行追踪延迟Linux-培训笔记-ftracehttps://www.kernel.org/doc/html/v4.18/trace/events.htmlhttps://blog.csdn.net/…...

大数据驱动企业决策智能化的路径与实践

&#x1f4dd;个人主页&#x1f339;&#xff1a;慌ZHANG-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 一、引言&#xff1a;数据驱动的企业竞争力重构 在这个瞬息万变的商业时代&#xff0c;“快者胜”的竞争逻辑愈发明显。企业如何在复杂环…...

GeoServer发布PostgreSQL图层后WFS查询无主键字段

在使用 GeoServer&#xff08;版本 2.22.2&#xff09; 发布 PostgreSQL&#xff08;PostGIS&#xff09;中的表为地图服务时&#xff0c;常常会遇到一个小问题&#xff1a; WFS 查询中&#xff0c;主键字段&#xff08;如 id&#xff09;莫名其妙地消失了&#xff01; 即使你在…...