当前位置: 首页 > news >正文

ChatGPT实时语音将于本周向免费用户推出:OpenAI DevDay 2024详细解读

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

北美时间2024年10月1日,2024年度的OpenAI开发者大会(OpenAI DevDay 2024)如期而至。

1. ChatGPT实时语音将于本周向免费用户推出

在OpenAI DevDay 2024的最新更新中,OpenAI宣布从本周开始,实时语音功能Advanced Voice Mode)将面向全球所有ChatGPT Enterprise、Edu和Team用户推出。此外,免费用户也将能够抢先体验到这一功能。

虽然OpenAI如是说,但不出意外,ChatGPT免费用户应该是只能够短暂体验实时语音功能Advanced Voice Mode)这一新功能。毕竟对于ChatGPT Plus用户,实时语音功能也是有着聊天时长限制的,超过规定的聊天时长后,语音模式将会自动切换为标准语音模式(标准语音模式)。

目前OpenAI并没有给出明确的聊天时长限制,只是表示聊天时长的限制可能会随着计算资源而动态调整。聊天时长达到上限前15分钟,ChatGPT会发出通知提醒。

2. Realtime API

对于开发者,OpenAI推出了Realtime API,允许开发者在其应用中构建快速的语音聊天体验,类似于上面提到的ChatGPT实时语音模式(Advanced Voice Mode),但适用于开发者自己的应用。此API以低延迟提供自然的语音对话,现已面向付费开发者以公测形式推出。除了Realtime API,OpenAI还在其Chat Completions API中增加了音频输入和输出功能,开发者无需再将多个模型组合使用,单次API调用即可实现自然的语音对话体验。

主要特点:

  1. 低延迟的多模态体验:开发者可利用Realtime API实现快速的语音到语音转换,并支持在对话中插入功能调用,使语音助手可以执行操作或拉取上下文。

  2. 典型应用场景:可用于客户服务、语言学习、健康和健身教练等场景,提供自然流畅的语音交互。

  3. 音频定价Realtime API支持文本和音频输入输出,按token分别计费,价格为每百万个输入音频tokens 100美元,每百万个输出音频tokens 200美元。

  4. 安全与隐私Realtime API具备多层安全防护,防止滥用,并对用户输入输出进行监控。

3. 在Playground中自动生成Prompt

在OpenAI DevDay的更新中,OpenAI在Playground推出了自动生成Prompt提示词的功能。此功能可以帮助开发者更快地将想法转化为原型。开发者只需简单描述其使用模型的目的,Playground就会自动生成提示、有效的函数架构和结构化输出格式,让开发者更轻松地进行原型设计。

用过Claude控制台的小伙伴应该可以联想到,OpenAI新推出的这个功能对标的就是Claude几个月前在控制台添加的自动生成提示词的功能。详情可以看我这篇文章:《Claude更新王炸功能:一键生成、评估、优化提示词!》。

4. Prompt Caching(提示缓存)

此外,OpenAI推出了Prompt Caching(提示缓存)功能,让开发者能够降低使用成本并加快提示词处理速度。此功能可自动对模型最近处理过的输入令牌进行缓存,开发者可以以50%的折扣价格重复使用这些令牌,并且不会影响延迟。

主要特点:

  1. 折扣与定价:对于已经缓存的输入令牌,开发者可以获得50%的折扣。例如,GPT-4o模型的未缓存输入令牌费用为每百万tokens 2.50美元,而缓存令牌的费用为1.25美元。

  2. 自动应用:Prompt Caching将自动应用于最新版本的GPT-4oGPT-4o minio1-previewo1-mini模型,以及它们的微调版本。提示内容超过1024个令牌时,API会自动缓存,开发者无需修改API集成。

  3. 缓存清除:缓存通常在5到10分钟不活跃后清除,并在最后一次使用后一小时内完全移除。

  4. 企业隐私承诺:缓存不会在组织之间共享,且遵循OpenAI的企业隐私协议。

最后提一句,OpenAI这次推出的Prompt Caching(提示缓存)功能对标的也是Claude在今年8月推出的同名称的功能。

5. Model Distillation(模型蒸馏)

OpenAI在本次更新中推出了Model Distillation(模型蒸馏)功能,这是一个用于微调较小、成本效益更高模型的工作流程,利用大型模型(如GPT-4oo1-preview)的输出来提升性能。

模型蒸馏的主要功能:

  1. 存储完成(Stored Completions):开发者可以通过API捕捉并存储模型生成的输入输出对,生成用于微调的数据集。这使得使用生产数据构建数据集变得更加简单,以便评估和微调较小的模型。

  2. 评估(Evals,测试版):开发者可以在OpenAI平台上创建和运行自定义评估,以衡量模型在特定任务上的性能。Evals与微调流程完全集成,也可以独立使用来评估模型性能。

  3. 微调集成:存储完成和评估工具与现有的微调功能相结合,开发者可以使用存储的完成数据集进行微调,并使用Evals测试微调后的模型性能。

模型蒸馏工作流程:

  1. 通过Evals创建一个评估,以测试目标模型(如GPT-4o mini)的性能。

  2. 使用Stored Completions生成真实世界任务的数据集,将大型模型(如GPT-4o)的输出作为微调的基准数据。

  3. 使用生成的数据集微调较小的模型(如GPT-4o mini),并通过Evals不断测试其性能。

模型蒸馏定价与可用性:

Model Distillation(模型蒸馏)功能现已向所有开发者开放,支持所有OpenAI模型。开发者每天可以获得2百万个免费训练令牌用于GPT-4o mini,直到10月31日。此外,存储完成是免费的,而Evals在2024年底之前,每周最多可运行7次免费的评估,条件是开发者选择将其评估共享给OpenAI以改进未来的模型。

6. Vision Fine-tuning(视觉微调)

OpenAI宣布在其微调API中添加了对视觉微调的支持,开发者现在可以使用图像和文本微调GPT-4o。这一功能为图像理解任务提供了更强大的定制能力,适用于增强视觉搜索、改进自动驾驶的物体检测、或更精确的医学图像分析等应用。

主要特点:

  1. 图像和文本结合微调:开发者可以通过上传图像数据集来增强GPT-4o的视觉处理能力,并且只需100张图像即可实现显著性能提升。随着图像和文本数据量的增加,性能将进一步提升。

  2. 真实世界应用:通过与合作伙伴的测试,GPT-4o在改进道路图像检测、自动化企业流程以及优化网站设计等领域表现出色。例如,Grab 使用视觉微调改进了道路标志定位准确性,Automat 提高了桌面机器人在识别UI元素时的成功率,Coframe 则通过视觉微调提升了网站设计的一致性。

视觉微调定价与可用性:

视觉微调现已向所有付费开发者开放,并支持最新的GPT-4o模型(gpt-4o-2024-08-06)。OpenAI提供了免费的视觉微调训练令牌,2024年10月31日前每天最多100万免费令牌。之后,微调训练将按每百万tokens 25美元收费,推理过程则按每百万输入tokens 3.75美元、输出tokens 15美元计费。

7. 扩大o1模型API的使用权限

OpenAI宣布扩大o1模型API的使用权限,允许账号使用级别第3层(usage tier 3)的开发者访问,并提升了调用速率限制,使其与GPT-4o的速率限制相同,以满足生产级别的应用开发。

  • 第 5 层o1-preview每分钟10,000个请求,o1-mini每分钟30,000个请求。

  • 第 4 层o1-previewo1-mini均为每分钟10,000个请求。

  • 第 3 层o1-previewo1-mini均为每分钟5,000个请求。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

相关文章:

ChatGPT实时语音将于本周向免费用户推出:OpenAI DevDay 2024详细解读

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工…...

一个月学会Java 第7天 字符串与键盘输入

Day7 字符串与键盘输入 字符串作为所有程序都很重要的东西,这个东西必须好好的学习,在Java中String会比较好学习,比起C和C里面会更加的简单, 在Java之中也是很好理解的,因为底层已经封装好了char数组,也就是…...

Java后端面试题(day16)

目录 java常见的引用类型java中深拷贝和浅拷贝如何设计一个秒杀系统?谈一下对高并发的理解,平时怎么处理高并发问题?Comparable和Comparator区别?解决hash冲突有哪些方法?Synchronized锁的升级过程 java常见的引用类型 java的引用类型一般分…...

Auto-Animate:是一款零配置、即插即用的动画工具,可以为您的 Web 应用添加流畅的过渡效果

嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 用户体验成为了检验产品成功与否的关键因素。而动画效果,作为提升用户体验的重要手段,在网页和应用开发中扮演着举足轻重的角色…...

k8s之ingress-nginx-controller安装

作者:程序那点事儿 日期:2024/01/30 01:25 要在master节点上安装 helm repo add ingress-nginx Welcome - Ingress-Nginx Controller helm search repo ingress-nginx helm pull ingress-nginx/ingress-nginx --version 4.4.2 mv ingress-nginx-4.4.…...

力扣SQL仅数据库(1098~1132)

1098 小众书籍 需求 编写解决方案,筛选出过去一年中订单总量 少于 10 本 的 书籍,并且 不考虑 上架距今销售 不满一个月 的书籍 。假设今天是 2019-06-23 。 返回结果表 无顺序要求 。 数据准备 Create table If Not Exists Books (book_id int, nam…...

优惠点餐api接口对接的具体步骤是什么?

优惠点餐API接口对接的具体步骤通常包括以下几个阶段: 需求分析:明确对接的目标和需求,例如实现在线点餐、订单管理、支付集成等 。选择API服务提供商:根据业务需求选择合适的点餐API服务提供商 。注册和获取API密钥:…...

【韩顺平Java笔记】第8章:面向对象编程(中级部分)【297-313】

文章目录 297. super基本语法297.1 基本介绍297.2 基本语法 298. super使用细节1299. super使用细节2300. super使用细节3301. 方法重写介绍302. 方法重写细节303. 重写课堂练习1304. 重写课堂练习2输出结果: 姓名:田所浩二 年龄:24305. 养宠物引出多态3…...

快递批量查询物流追踪只揽收无物流信息的单号

在电子商务和物流领域,快递单号的追踪是确保货物顺利送达的关键环节。然而,在实际操作中,经常会遇到一些只显示揽收信息而没有后续物流更新的单号,这给商家和买家都带来了不小的困扰。本文将介绍如何通过快递批量查询物流的方法&a…...

【动态网站资源保存下载】

文章目录 概要解决思路技术细节小结 概要 我们在网上浏览网站时,经常有这样的需求:将浏览的网页保存下来,即使无网的情况下也可以继续浏览。比如一些教育类网站的PPT,内容为HTML格式的,无法作为PPT格式下载下来&#…...

Selenium自动化测试中如何处理数据驱动?

在自动化测试中,数据驱动(Data-Driven Testing)是指通过外部数据源(如Excel、CSV、数据库等)来控制测试用例的执行,而不是直接在代码中硬编码数据。这种方式可以提高测试的灵活性和可维护性,使得…...

淘宝API接口系列有哪些内容?

淘宝API(Application Programming Interface)接口系列是一套允许开发者与淘宝平台进行数据交互的接口集合,涵盖了商品信息、订单信息、物流信息、用户信息以及营销等多个方面的数据接口。以下是对淘宝API接口系列内容的详细归纳: …...

华为OD机试 - 冠亚军排名(Java 2024 E卷 100分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(E卷D卷A卷B卷C卷)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加…...

VmWare中安装CenterOs(内网服务器)

VmWare中安装CenterOs(内网服务器) 文章目录 VmWare中安装CenterOs(内网服务器)[toc] 一 、CentOS 7的下载与安装1、下载2、安装(1)前期准备(2)正式安装 开始等待!!! 二、软件仓库更换1、root用…...

JS 数组去重 — 各类场景适合方法大全

JS 数组去重 — 各类场景适合方法大全 本文介绍各种场景 JS 去重 方法使用 性能最好、用的最多、场景大全 文章目录 JS 数组去重 — 各类场景适合方法大全 一、基础篇:简单直观的去重方法1. 使用Set数据结构2. 利用filter和indexOf方法3. reduce方法的应用 二、进阶…...

【Java 问题】集合——List

List 1.说说有哪些常见集合?2.ArrayList和LinkedList有什么区别?3.ArrayList的扩容机制了解吗?4.ArrayList怎么序列化的知道吗? 为什么用transient修饰数组?5.快速失败(fail-fast)和安全失败(fail-safe)了解吗&#xf…...

xss 跨站脚本攻击

XSS 的全称是 Cross-Site Scripting(跨站脚本攻击)。是一种常见的web安全漏洞。 1. XSS 的定义 XSS 是一种注入类型的攻击,攻击者将恶意脚本注入到受信任的网站中。当其他用户访问该网站时,这些脚本会在用户的浏览器中执行。 2…...

5.toString()、构造方法、垃圾回收、静态变量与静态方法、单例设计模式、内部类

文章目录 一、toString()1. 优缺点2. 使用方法举例① Dos类里更省事的方法 ② Application里 二、构造方法1. 导入2. 什么是构造方法3. 怎么写构造方法① 无参的构造方法(无参构造器)② 有参的构造方法(有参构造器)③ 注意 4. 构造方法的重载 三、再探this1. 给成员变量用2. 给…...

Fiddler配合wireshark解密ssl

环境: win11(wireshark)--虚拟机win7(Fiddler)---虚拟机win7(HTTPS站点) 软件安装问题: 需要.net环境,NDP461-KB3102436-x86-x64-AllOS-ENU.exe。 安装fiddler后安装下…...

【UI】将 naive ui 的 message 封装进axios 中,关于naiveui的message相关的用法

文章目录 前言在setup外进行使用直接包裹使用vue 单文件中使用 参考文章: 关于naiveui的message相关的用法 前言 最近新建了一个vite vu3 的项目,完全是从0 到1 ,封装到request 的时候 想对axios 请求做一个全局的处理,但发现…...

MPNet:旋转机械轻量化故障诊断模型详解python代码复现

目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

前端导出带有合并单元格的列表

// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...

在四层代理中还原真实客户端ngx_stream_realip_module

一、模块原理与价值 PROXY Protocol 回溯 第三方负载均衡(如 HAProxy、AWS NLB、阿里 SLB)发起上游连接时,将真实客户端 IP/Port 写入 PROXY Protocol v1/v2 头。Stream 层接收到头部后,ngx_stream_realip_module 从中提取原始信息…...

是否存在路径(FIFOBB算法)

题目描述 一个具有 n 个顶点e条边的无向图,该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序,确定是否存在从顶点 source到顶点 destination的路径。 输入 第一行两个整数,分别表示n 和 e 的值(1…...

LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》

这段 Python 代码是一个完整的 知识库数据库操作模块,用于对本地知识库系统中的知识库进行增删改查(CRUD)操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述 该模块…...

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中,附加包含目录、附加库目录和附加依赖项是三个至关重要的设置,它们相互配合,确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中,这些概念容易让人混淆,但深入理解它们的作用和联…...

给网站添加live2d看板娘

给网站添加live2d看板娘 参考文献: stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言 网站环境如下,文章也主…...

掌握 HTTP 请求:理解 cURL GET 语法

cURL 是一个强大的命令行工具,用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中,cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

Modbus RTU与Modbus TCP详解指南

目录 1. Modbus协议基础 1.1 什么是Modbus? 1.2 Modbus协议历史 1.3 Modbus协议族 1.4 Modbus通信模型 🎭 主从架构 🔄 请求响应模式 2. Modbus RTU详解 2.1 RTU是什么? 2.2 RTU物理层 🔌 连接方式 ⚡ 通信参数 2.3 RTU数据帧格式 📦 帧结构详解 🔍…...

深入解析 ReentrantLock:原理、公平锁与非公平锁的较量

ReentrantLock 是 Java 中 java.util.concurrent.locks 包下的一个重要类,用于实现线程同步,支持可重入性,并且可以选择公平锁或非公平锁的实现方式。下面将详细介绍 ReentrantLock 的实现原理以及公平锁和非公平锁的区别。 ReentrantLock 实现原理 基本架构 ReentrantLo…...