当前位置: 首页 > news >正文

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens 60 美分,比之前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜超过 60%。这种经济实惠的定价使得更多的应用程序能够负担得起 AI 技术,预计将大大扩展 AI 应用的范围。

使用 OpenAI 的模型构建应用程序可能会产生巨额费用,许多开发者因此望而却步,转而选择谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等更便宜的模型。为此,OpenAI 进入了轻量级模型市场。OpenAI 的 API 平台产品负责人 Olivier Godement 在接受媒体采访时表示:“我认为 GPT-4o Mini 真正体现了 OpenAI 使 AI 更广泛可及的使命。如果我们希望 AI 能惠及世界的每一个角落、每一个行业、每一个应用,我们就必须让 AI 更加实惠。”

从今天开始,ChatGPT 免费版、Plus 版和团队计划的用户可以使用 GPT-4o Mini 代替 GPT-3.5 Turbo,企业用户将在下周获得访问权限。这意味着 ChatGPT 用户将不再能使用 GPT-3.5,但开发者仍可以通过 API 使用它,如果他们不想切换到 GPT-4o Mini。Godement 表示,GPT-3.5 将在某个时间点从 API 中退役,具体时间尚未确定。

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

具有卓越文本智能和多模态推理的小型模型

新模型不仅支持文本,还支持 API 中的视觉功能,未来还将处理视频和音频等多模态输入和输出。凭借这些能力,GPT-4o Mini 可以用于理解旅行行程并提供建议等更复杂的虚拟助手功能。然而,该模型主要用于简单任务,因此没有人会真正用它来廉价地构建类似 Siri 的助手。

GPT-4o mini 在学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型,无论在文本智能还是多模态推理方面都表现出色,并支持与 GPT-4o 相同的语言范围。它在函数调用方面表现优异,能让开发者构建从外部系统获取数据或采取行动的应用程序,并且相比 GPT-3.5 Turbo,长上下文性能有所提升。

在测量大规模多任务语言理解(MMLU)测试中,GPT-4o Mini 取得了 82% 的得分。这项基准考试包括 57 个学科的约 16000 道选择题。相比之下,GPT-3.5 的得分为 70%,GPT-4o 为 88.7%,而谷歌声称其 Gemini Ultra 创下了 90% 的最高得分。竞争模型 Claude 3 Haiku 和 Gemini 1.5 Flash 分别得分 75.2% 和 78.9%。然而,研究人员对这些基准测试持谨慎态度,因为各家公司进行测试的方式略有不同,分数难以直接比较。此外,AI 可能会在其数据集中包含这些答案,从而让它“作弊”。

对于渴望以低成本构建 AI 应用的开发者来说,GPT-4o Mini 的推出为他们提供了另一种工具。OpenAI 让金融科技初创公司 Ramp 测试了该模型,使用它构建了一个提取收据费用数据的工具,用户可以上传收据的照片,模型会自动整理信息。电子邮件客户端 Superhuman 也测试了 GPT-4o Mini,并用它创建了电子邮件回复的自动建议功能。

这款新模型的目标是为开发者提供一种轻量级且廉价的工具,帮助他们创建无法负担更大、更昂贵模型的应用和工具。许多开发者会选择 Claude 3 Haiku 或 Gemini 1.5 Flash,而不是支付运行最强大模型之一所需的高昂计算成本。

至于为什么 OpenAI 花了这么久的时间才推出这个模型,Godement 表示,这是“纯粹的优先级问题”,因为公司专注于创建更大更好的模型,如 GPT-4,这需要大量的人力和计算资源。随着时间的推移,OpenAI 发现开发者渴望使用更小的模型,因此公司决定现在是投资资源构建 GPT-4o Mini 的时机。

内置安全措施

GPT-4o mini 继承了 GPT-4o 的安全措施,确保在开发过程中的每一步都强化安全性。从预训练阶段开始,OpenAI 就过滤掉仇恨言论、成人内容和垃圾信息等不希望模型学习或输出的内容。在后训练阶段,通过人类反馈强化学习(RLHF)等技术,使模型的行为与政策保持一致,提高模型响应的准确性和可靠性。

GPT-4o mini 具有与 GPT-4o 相同的安全缓解措施,这些措施通过自动和人工评估进行了仔细评估。来自社会心理学和虚假信息等领域的 70 多位外部专家测试了 GPT-4o,以识别潜在风险,OpenAI 已经解决了这些问题,并计划在即将发布的 GPT-4o 系统卡和准备得分卡中分享详细信息。这些专家评估的见解有助于提高 GPT-4o 和 GPT-4o mini 的安全性。

此外,GPT-4o mini 还首次在 API 中应用了指令层级方法,增强了模型抵御越狱、提示注入和系统提示提取的能力,确保模型响应的可靠性和安全性。

可用性和未来展望

GPT-4o mini 现已在 Assistants API、Chat Completions API 和 Batch API 中上线。开发者可以通过支付每百万输入 tokens 15 美分和每百万输出 tokens 60 美分的费用,使用这一新型模型。在 ChatGPT 平台上,Free、Plus 和 Team 用户今天起可以使用 GPT-4o mini,取代 GPT-3.5,企业用户也将在下周开始访问。

OpenAI 承诺在未来继续推动 AI 技术的普及和成本降低。自 2022 年推出能力较低的 text-davinci-003 模型以来,GPT-4o mini 的每个 token 成本已下降了 99%。OpenAI 设想未来模型将无缝集成到每个应用程序和网站中,推动 AI 应用更高效、更经济地发展。​​​​​​​

相关文章:

价格战再起:OpenAI 发布更便宜、更智能的 GPT-4o Mini 模型|TodayAI

OpenAI 今日推出了一款名为 GPT-4o Mini 的新模型,这款模型较轻便且成本更低,旨在为开发者提供一个经济实惠的选择。与完整版模型相比,GPT-4o mini 在成本效益方面表现卓越,价格仅为每百万输入 tokens 15 美分和每百万输出 tokens…...

从0开始对时间序列模型ACF和PACF的理解(以股价预测为例子)

目录 ACF模型选择问题ACF处理问题 PACF(偏自相关系数)模型选择 ACF 先了解一下概念,我不喜欢用公式套话讲。 ACF(自相关函数):就是看看当前的股票价格和之前的股票价格之间有没有关系。比如说,…...

MybatisPlus(MP)基础知识全解析

MyBatis-Plus(简称MP)是一个基于Java的持久层框架,它在MyBatis的基础上提供了许多实用的功能增强,使得开发者可以更加便捷地进行数据库操作。本文将介绍MyBatis-Plus的基础知识,包括其特性、核心组件以及如何使用它进行…...

前端组件化实践:Vue自定义加载Loading组件的设计与实现

摘要 随着前端技术的飞速发展,组件化开发已成为提高开发效率、降低维护成本的重要方法。本文介绍了前端Vue自定义加载Loading组件的设计思路与实现过程,该组件通过设置gif动画实现加载效果,可广泛应用于页面请求加载场景。通过该组件的实践&…...

LLaMA 背景

什么是LLaMA? 模型介绍:LLaMA是Meta开发的语言模型,旨在推动开放科学和人工智能的实践。 参数范围:这些模型的参数数量从7B到65B不等,覆盖了不同规模的需求。 训练数据:LLaMA模型是在数万亿个公开数据集的…...

硅谷裸机云多IP服务器怎么样?

硅谷裸机云多IP服务器是一种在硅谷地区提供的、具有多个IP地址的裸机云服务器。这种服务器结合了裸机服务器的高性能和云服务器的灵活性,同时提供了多个IP地址,为用户的各种需求提供了支持。以下是关于硅谷裸机云多IP服务器的一些详细信息,ra…...

Python+Django+MySQL的新闻发布管理系统【附源码,运行简单】

PythonDjangoMySQL的新闻发布管理系统【附源码,运行简单】 总览 1、《新闻发布管理系统》1.1 方案设计说明书设计目标工具列表 2、详细设计2.1 登录2.2 程序主页面2.3 新闻新增界面2.4 文章编辑界面2.5 新闻详情页2.7 其他功能贴图 3、下载 总览 自己做的项目&…...

实战项目:仿muduo库实现并发服务器

目录 项目初始与项目演示HTTP服务器基础认识Reactor模式基础认识单Reactor单线程模式认识单Reactor多线程模式认识多Reactor多线程模式认识 目标定位总体大模块划分server模块的管理思想Buffer子模块Socket子模块Channel子模块Connection子模块Acceptor子模块TimerQueue子模块P…...

提高Java程序效率:ImmutableList、Stream API 和 JSON序列化实战指南

常用列表构建方法: 1.ImmutableList.of() : 静态方法、不可变的列表 可以接受任意数量的参数,并将它们作为元素添加到新创建的列表中,但是一旦创建,集合的内容就不能被改变。在多线程环境中非常有用,因为…...

[CP_AUTOSAR]_分层软件架构_接口之通信模块交互介绍

目录 1、协议数据单元(PDU)传输2、通信模块的案例2.1、SDU、 PCI & PDU2.2、通信模块构成2.3、从数据传输的角度看Communication2.4、Communication中的接口 在前面 《关于接口的一些说明》 以及  《Memory软件模块接口说明》 中,简要介绍了CP_AUTOSAR分层…...

C语言 ——— 浮点数类型 在 内存中 的 存储模式

目录 浮点数存储规则 单\双精度浮点数 存储 S、M、E 的布局 有效数字M 和 指数位E 的特殊规定 浮点数在内存中是否存储的S、M、E 浮点数存储规则 根据国际标准IEEE754(电气和电子工程协会)规定:任意一个 浮点数F的二进制 都可以表示成…...

socket 收发TCP/UDP

一、c 个人测试记录,有问题还请指出,谢谢 参考:C开发基础之网络编程WinSock库使用详解TCP/UDP Socket开发_c udp使用什么库-CSDN博客 代码中Logger测试见文章: c中spdlog的使用/python中logger的使用-CSDN博客 1、main.cpp 收…...

Nest.js 实战 (三):使用 Swagger 优雅地生成 API 文档

什么是 Swagger ? Swagger 是一组围绕 OpenAPI 规范构建的开源工具,可以帮助您设计、构建、记录和使用 REST API。主要的 Swagger 工具 包括: Swagger Editor:基于浏览器的编辑器,您可以在其中编写 OpenAPI 定义Swagger UI&…...

spark shell

1.进行shell命令行 spark-shell 2.创建RDD 2.1 读取文件创建RDD 2.1.1读取linux文件系统的文件创建RDD --需要保证每一个worker中都有该文件 val data1 sc.textFile("file:/opt/file/word.txt") 2.1.2读取hdfs文件系统上的文件创建RDD val data2sc.textFile("…...

集群架构-web服务器(接入负载均衡+数据库+会话保持redis)--15454核心配置详解

紧接着前面的集群架构深化—中小型公司(拓展到大型公司业务)–下面图简单回顾一下之前做的及故障核心知识总结(等后期完全整理后,上传资源希望能帮大家) web集群架构-接入负载均衡部署web02服务器等 web集群-搭建web0…...

# Redis 入门到精通(七)-- redis 删除策略

Redis 入门到精通(七)-- redis 删除策略 一、redis 删除策略–过期数据的概念 1、Redis 中的数据特征 Redis 是一种内存级数据库,所有数据均存放在内存中,内存中的数据可以通过TTL指令获取其状态。 XX :具有时效性…...

10:00面试,10:08就出来了,问的问题有点变态。。。

从小厂出来,没想到在另一家公司又寄了。 到这家公司开始上班,加班是每天必不可少的,看在钱给的比较多的份上,就不太计较了。没想到6月一纸通知,所有人不准加班,加班费不仅没有了,薪资还要降40%…...

html+canvas 实现签名功能-手机触摸

手机上的效果图 需要注意&#xff0c;手机触摸和鼠标不是一个事件&#xff0c;不能通用&#xff0c;上一篇是关于使用鼠标的样例 相关代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewpo…...

前端组件化探索与实践:Vue自定义暂无数据组件的开发与应用

摘要 随着前端开发技术的不断进步&#xff0c;组件化开发已成为提升开发效率、降低维护成本的关键手段。本文旨在通过介绍一款Vue自定义暂无数据组件的开发与实践&#xff0c;深入探讨前端组件化开发的重要性、优势及其在实际项目中的应用。 一、引言 在前端开发中&#xff0…...

《汇编语言 基于x86处理器》- 读书笔记 - Visual Studio 2019 配置 MASM环境

安装 Visual Studio 2019 配置 MASM环境 下载 Visual Studio Installer安装 Visual Studio 20191. 双击运行2. 自定义安装内容3. 修改 MSVC 工具集版本4. 设置主题&#xff08;可选&#xff09;5. 安装代码高亮插件 AsmDude&#xff08;可选&#xff09;6. 通义灵码&#xff08…...

linux之kylin系统nginx的安装

一、nginx的作用 1.可做高性能的web服务器 直接处理静态资源&#xff08;HTML/CSS/图片等&#xff09;&#xff0c;响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器 隐藏后端服务器IP地址&#xff0c;提高安全性 3.负载均衡服务器 支持多种策略分发流量…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)

可以使用Sqliteviz这个网站免费编写sql语句&#xff0c;它能够让用户直接在浏览器内练习SQL的语法&#xff0c;不需要安装任何软件。 链接如下&#xff1a; sqliteviz 注意&#xff1a; 在转写SQL语法时&#xff0c;关键字之间有一个特定的顺序&#xff0c;这个顺序会影响到…...

鱼香ros docker配置镜像报错:https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题 一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题&#xff1a;docker pull 失败 网络不同&#xff0c;需要使用镜像源 按照如下步骤操作 sudo vi /etc/docker/dae…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一&#xff0c;概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本&#xff1a;2014.07&#xff1b; Kernel版本&#xff1a;Linux-3.10&#xff1b; 二&#xff0c;Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01)&#xff0c;并让boo…...

MySQL账号权限管理指南:安全创建账户与精细授权技巧

在MySQL数据库管理中&#xff0c;合理创建用户账号并分配精确权限是保障数据安全的核心环节。直接使用root账号进行所有操作不仅危险且难以审计操作行为。今天我们来全面解析MySQL账号创建与权限分配的专业方法。 一、为何需要创建独立账号&#xff1f; 最小权限原则&#xf…...

Web后端基础(基础知识)

BS架构&#xff1a;Browser/Server&#xff0c;浏览器/服务器架构模式。客户端只需要浏览器&#xff0c;应用程序的逻辑和数据都存储在服务端。 优点&#xff1a;维护方便缺点&#xff1a;体验一般 CS架构&#xff1a;Client/Server&#xff0c;客户端/服务器架构模式。需要单独…...

HubSpot推出与ChatGPT的深度集成引发兴奋与担忧

上周三&#xff0c;HubSpot宣布已构建与ChatGPT的深度集成&#xff0c;这一消息在HubSpot用户和营销技术观察者中引发了极大的兴奋&#xff0c;但同时也存在一些关于数据安全的担忧。 许多网络声音声称&#xff0c;这对SaaS应用程序和人工智能而言是一场范式转变。 但向任何技…...

【堆垛策略】设计方法

堆垛策略的设计是积木堆叠系统的核心&#xff0c;直接影响堆叠的稳定性、效率和容错能力。以下是分层次的堆垛策略设计方法&#xff0c;涵盖基础规则、优化算法和容错机制&#xff1a; 1. 基础堆垛规则 (1) 物理稳定性优先 重心原则&#xff1a; 大尺寸/重量积木在下&#xf…...

GAN模式奔溃的探讨论文综述(一)

简介 简介:今天带来一篇关于GAN的,对于模式奔溃的一个探讨的一个问题,帮助大家更好的解决训练中遇到的一个难题。 论文题目:An in-depth review and analysis of mode collapse in GAN 期刊:Machine Learning 链接:...

ubuntu中安装conda的后遗症

缘由: 在编译rk3588的sdk时&#xff0c;遇到编译buildroot失败&#xff0c;提示如下&#xff1a; 提示缺失expect&#xff0c;但是实测相关工具是在的&#xff0c;如下显示&#xff1a; 然后查找借助各个ai工具&#xff0c;重新安装相关的工具&#xff0c;依然无解。 解决&am…...