OpenAI发布新模型!ChatGPT性能重磅提升,API大幅降价,GPT-4 「变懒」被修复
OpenAI 对ChatGPT进行了大更新:推出了新一代的嵌入模型,对GPT-4 Turbo模型进行了更新,并将很快对GPT-3.5 Turbo的API进行大幅降价,GPT-4「变懒」行为也被修复。

接下来二狗就带大家看看ChatGPT的这次详细更新。
推出新的嵌入模型且价格更低
OpenAI这次推出了两种新的嵌入模型:
-
一是更小但高效的 text-embedding-3-small 模型;
-
二是更大且性能更强大的 text-embedding-3-large 模型;
嵌入(embedding)是表示自然语言或代码等内容中的概念的数字序列。嵌入使机器学习模型和其他算法可以轻松理解内容之间的关系并执行聚类或检索等任务。嵌入为 ChatGPT 和 Assistants API 中的知识检索等应用程序以及很多检索增强生成 (RAG) 开发工具提供了支持。

相比前身模型(2022 年 12 月发布的 text-embedding-ada-002 模型),OpenAI这次推出的两种新的嵌入模型性能变的更强了。
相比前身模型,text-embedding-3-small在常用的多语言检索基准(MIRACL)上的平均得分从31.4%增加到44.0%,而在常用的多语言检索基准上的平均得分从31.4%增加到44.0%英语任务基准(MTEB)从 61.0% 提高到 62.3%。
而text-embedding-3-large模型是OpenAI新的下一代更大的嵌入模型,可创建高达 3072 维的嵌入,在两个基准上的得分分别提升到了54.9%和64.6%。

价格方面,与 text-embedding-ada-002模型相比:
-
text-embedding-3-small 的定价降低了 5 倍从 0.0001美元/1k tokens 降到了 0.00002美元/1k tokens;
-
text-embedding-3-large 的定价为0.00013美元/ 1k tokens;
GPT-3.5 Turbo模型更新,价格降低
OpenAI下周将推出新的 GPT-3.5 Turbo 型号 gpt-3.5-turbo-0125,并且第三次降低 GPT-3.5 Turbo 的价格。
GPT-3.5 Turbo新模型输入价格直接降价一半,输出价格降低25%,降价后的价格分别是:
-
输入:0.0005 美元/1K tokens;
-
输出:0.0015 美元/1K tokens;
该模型还将进行各种改进,包括以更高的精度响应请求的格式,以及修复导致非英语函数调用的文本编码问题的错误。使用固定 gpt-3.5-turbo模型的用户将在该模型发布两周后自动从 gpt-3.5-turbo-0613 升级到 gpt-3.5-turbo-0125。
GPT-4 Turbo预览模型更新,懒惰行为被修复
OpenAI本次将GPT-4 Turbo 预览模型更新为gpt-4-0125-preview,新模型还修复了影响非英语 UTF-8 生成的错误。
另外更重要的是新模型相比之前的预览模型可以更彻底地完成代码生成等任务,这将减少模型未完成任务的“懒惰”情况!

芜湖!要知道前一段时间,GPT-4模型变懒惹的多少人来吐槽,OpenAI官方也亲自承认了。

当时为了应对GPT-4变懒,众多网友祭出了魔法prompt:

审核模型也进行了更新
免费的审核 API 允许开发人员识别潜在有害的文本。作为持续安全工作的一部分,OpenAI本次发布了 text-moderation-007模型,这是OpenAI本次迄今为止最强大的审核模型。text-moderation-latest 和 text-moderation-stable 别名已更新为指向text-moderation-007。
API管理平台更新
OpenAI 正在推出两项平台改进,以使开发人员能够更清楚地了解API 的使用情况以及对 API 密钥的控制。
首先,开发人员现在可以从 API 密钥页面为 API 密钥分配权限。例如,可以为密钥分配只读访问权限以支持内部跟踪仪表板,或限制为仅访问某些端点。
其次,使用情况仪表板和使用情况导出功能现在在打开跟踪后公开 API 密钥级别的指标。这让查看每个功能、团队、产品或项目级别的使用情况变得简单好用,只需为每个功能、团队、产品或项目级别设置单独的 API 密钥即可。
在接下来的几个月中,OpenAI 计划进一步提高开发人员查看其 API 使用情况和管理 API 密钥的能力。

好了,ChatGPT的这次详细更新介绍完毕了。
最后,二狗其实更期待GPT-4.5和GPT-5早日发布!


参考资料
[1]https://openai.com/blog/new-embedding-models-and-api-updates
[2]https://www.theverge.com/2024/1/25/24050829/openai-gpt-4-turbo-lazy-ai-model
相关文章:
OpenAI发布新模型!ChatGPT性能重磅提升,API大幅降价,GPT-4 「变懒」被修复
OpenAI 对ChatGPT进行了大更新:推出了新一代的嵌入模型,对GPT-4 Turbo模型进行了更新,并将很快对GPT-3.5 Turbo的API进行大幅降价,GPT-4「变懒」行为也被修复。 接下来二狗就带大家看看ChatGPT的这次详细更新。 推出新的嵌入模型…...
【C深度解剖】计算机数据下载和删除原理
简介:本系列博客为C深度解剖系列内容,以某个点为中心进行相关详细拓展 适宜人群:已大体了解C语法同学 作者留言:本博客相关内容如需转载请注明出处,本人学疏才浅,难免存在些许错误,望留言指正 作…...
ASTORS国土安全奖:ManageEngine AD360荣获银奖
美国安全今日(AST)的年度“ASTORS”国土安全奖计划是一个备受瞩目的活动,致力于突显国土安全领域的创新与进步。这一奖项旨在表彰在保护国家免受安全威胁方面做出卓越贡献的个人和组织。该计划汇聚了执法、公共安全和行业领袖,不仅…...
clang--cpplint--gitlint
clang_format clang_format是什么 代码格式化工具 clang_format 官网和官网教程 中文教程 下载 sudo apt install clang sudo apt install clang-format#查看下载是否成功 clang --version 代码的构建到提交的过程: cmake .. make make test make clang_f…...
Web开发8:前后端分离开发
在现代的 Web 开发中,前后端分离开发已经成为了一种常见的架构模式。它的优势在于前端和后端可以独立开发,互不干扰,同时也提供了更好的可扩展性和灵活性。本篇博客将介绍前后端分离开发的概念、优势以及如何实现。 什么是前后端分离开发&am…...
基于 java+springboot+mybatis电影售票网站管理系统前台+后台设计和实现
基于 javaspringbootmybatis电影售票网站管理系统前台后台设计和实现 🍅 作者主页 央顺技术团队 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 🍅 文末获取源码联系方式 📝 🍅 查看下方微信号获取联系方式 承…...
【INTEL(ALTERA)】错误:*.onchip_flash_0:UFM 扇区不支持“隐藏”模式。请更新访问模式设置
说明 由于英特尔 Quartus Prime Standard Edition 软件版本 22.1 存在一个问题,当您针对 10 FPGA Compact 变体英特尔 MAX在片上闪存英特尔 FPGA IP中选择单压缩映像配置模式时,可能会出现以下错误消息。 错误:*.onchip_flash_0:…...
备战蓝桥杯---数据结构与STL应用(基础3)
今天我们主要介绍的是pair,string,set,map pair:我们可以把它当作一个结构体: void solve(){pair<int int> a;//创建amake_pair(1,2);//添加元素cout<<a.first<<endl<<a.second<<endl;}//输出 当然,它也可以嵌套&#…...
「优选算法刷题」:只出现一次的数字Ⅲ
一、题目 给你一个整数数组 nums,其中恰好有两个元素只出现一次,其余所有元素均出现两次。 找出只出现一次的那两个元素。你可以按 任意顺序 返回答案。 你必须设计并实现线性时间复杂度的算法且仅使用常量额外空间来解决此问题。 示例 1: …...
Vue-43、Vue中组件自定义事件
1、给学生绑定atguigu事件 2、在组件内触发事件 第二种写法 传多个参数。 解绑 解绑一个事件 解绑多个自定义事件 this.$off([xxx1,xxx2]);解绑所有事件 this.$off();总结...
GitHub 开启 2FA 双重身份验证的方法
为什么要开启 2FA 自2023年3月13日起,我们登录 GitHub 都会看到一个要求 Enable 2FA 的重要提示,具体如下: GitHub users are now required to enable two-factor authentication as an additional security measure. Your activity on GitHub includes you in this requi…...
ASP.NET Core 过滤器 使用依赖项注入
过滤器是 ASP.NET Core 中的特殊组件,允许我们在请求管道的特定阶段控制请求的执行。这些过滤器在中间件执行后以及 MVC 中间件匹配路由并调用特定操作时发挥作用。 简而言之,过滤器提供了一种在操作级别自定义应用程序行为的方法。它们就像检查点&#…...
2024年的网创之路应该这样走才对
2024年的网创之路应该这样走才对 大家都知道这两年经济环境不好,钱不好挣,对于普通人,只有一条出路,就是学某项技能,然后死磕,不能提升某项技能的项目,打死也不做,因为多数项目都是…...
ssh异常报错:Did not receive identification string from
一、问题描述 某次外出在异地工作场所xshell炼乳远程服务器时,报错:Connection closed by foreign host. D,服务器查看secure日志或sshd服务状态会显示:id not receive identification string from client_ip; 二、分析处理 1&a…...
MIDI码深度解析
MIDI 协议即数字音乐接口(Musical Instrument Digital Interface),是电子乐器、合成器等演奏设备之间的一种即时通信协议,用于硬件之间的实时演奏数据传递。如果理解还不够深刻,官方如下解释: 常用midi硬件…...
小红书如何做混部?
作者:宋泽辉(小红书)、张佐玮(阿里云) 编者按: Koordinator 是一个开源项目,是基于阿里巴巴内部多年容器调度、混部实践经验孵化诞生,是行业首个生产可用、面向大规模场景的开源混…...
[PHP]严格类型
PHP: 类型声明 - Manual...
作为程序员,你必须学会Maven
资源领取在末尾. Maven 是一款旨在简化 Java 开发流程的管理工具,它的主要功能包括: 1. 项目管理:Maven 提供了一种项目对象模型(Project Object Model, POM),用于管理项目的构建、报告和文档。它允许开发者通过少量代码…...
UDF学习(三)数据访问宏
数据访问宏一 网格节点相关宏** NODE_X (v) 节点v的x方向的坐标 (Node *v) NODE_Y (v) 节点v的y方向的坐标 (Node *v) NODE_Z (v) 节点v的z方向的坐标 (Node *v) F_NODE (f,t,n) 获取节点 (face_t f, Thread *t, int n 节点索引号) F_NNODES(f,t) 获取面上的节点数量 (…...
Web3技术革新:重新定义在线体验
互联网的不断演进塑造了我们的数字生活,而Web3技术的涌现正带来一场前所未有的变革。本文将深入探讨Web3技术的创新,以及它如何重新定义和提升我们的在线体验。 Web3技术的基本概念 Web3是互联网的第三个时代,它将去中心化、区块链、智能合约…...
Dell R730服务器iDRAC远程安装操作系统的完整指南
1. Dell R730服务器iDRAC远程安装操作系统全流程 第一次接触iDRAC远程管理功能时,我完全被它的便捷性震惊了。想象一下,你躺在家里沙发上,用笔记本就能完成机房服务器的系统安装,这种体验简直不要太爽。Dell R730作为经典的2U机架…...
2025届最火的五大降重复率神器推荐
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 把AI生成内容的痕迹降下来,其关键在于回归自然表达,具体来说&#x…...
效率革命:告别繁琐配置,用快马AI一键生成个性化在线工作台
最近在尝试优化自己的工作流程,发现一个高效的个人工作台真的能大幅提升生产力。传统的待办清单、番茄钟和便签工具往往需要切换多个应用,于是我用纯前端技术打造了一个三合一的工作台Web应用,整个过程在InsCode(快马)平台上完成,…...
cat-catch:突破网页资源捕获限制的高效下载解决方案
cat-catch:突破网页资源捕获限制的高效下载解决方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 问题:网页资源获取的三…...
主流AI培训机构评测:关键指标全对比
引言 随着AI技术的飞速发展,AI培训市场也日益繁荣。然而,无论是企业还是创业者在选择AI培训机构时,都面临着诸多挑战。企业端存在缺乏数字化运营团队、不懂AI工具使用、短视频内容生产效率低、打造个人IP能力不足、同城获客成本高且精准度低…...
别再死记硬背了!用MONAI Transform处理医学图像,这5个实战场景帮你一次搞懂
医学图像处理实战:5个MONAI Transform核心场景解析 医学影像AI开发中最令人头疼的环节,往往不是模型设计,而是数据预处理。我曾见过不少团队花费80%的时间在数据清洗和转换上,却依然难以构建标准化的处理流程。MONAI Transform的出…...
AI 模型推理 GPU 调度策略优化
AI 模型推理 GPU 调度策略优化 随着人工智能技术的快速发展,AI 模型推理在医疗、金融、自动驾驶等领域的应用日益广泛。GPU 资源的高效调度成为提升推理性能的关键挑战。如何优化 GPU 调度策略,以降低延迟、提高吞吐量并减少资源浪费,成为研…...
Qwen3-14B在Keil5 MDK开发中的奇思妙用:注释生成与调试日志分析
Qwen3-14B在Keil5 MDK开发中的奇思妙用:注释生成与调试日志分析 1. 嵌入式开发的痛点与AI机遇 在STM32项目开发过程中,每个工程师都经历过这样的场景:接手一个遗留项目,面对大段没有注释的汇编代码;或者调试时串口不…...
新手必看:AI人脸隐私卫士从部署到使用,完整操作指南
新手必看:AI人脸隐私卫士从部署到使用,完整操作指南 1. 引言:为什么需要AI人脸隐私保护? 在日常生活中,我们经常需要分享照片到社交媒体或工作群聊。但你是否想过,这些照片中可能无意间暴露了他人的隐私信…...
Keepalived实战:用MySQL主从高可用方案解决你的数据库单点故障
Keepalived与MySQL主从架构:构建零宕机数据库高可用方案 当数据库成为业务系统的核心支柱时,单点故障可能意味着灾难性的业务中断。我曾亲历一次凌晨3点的数据库故障,整个电商平台瘫痪两小时,损失超过七位数。这次教训让我深刻认识…...
