当前位置：首页 > news >正文

价格较低，功能最强？OpenAI 推出 GPT-4o mini，一个更小、更便宜的人工智能模型

news 2026/2/9 0:16:45

OpenAI美东时间周四推出“GPT-4o mini”，入局“小而精”AI模型竞争，称这款新模型是“功能最强、成本偏低的模型”，计划今后整合图像、视频、音频到这个模型中。

OpenAI表示，GPT-4o mini 相较于 OpenAI 目前最先进的 AI 模型更加便宜且运行速度更快，今日起面向开发者以及通过 ChatGPT 网络和移动应用向消费者发布，企业用户将于下周获得访问权限。

据OpenAI介绍，GPT-4o mini 在涉及文本和视觉的推理任务中表现优于行业领先的小型 AI 模型。随着小型 AI 模型的改进，由于其速度和成本效益相较于大型模型（如 GPT-4 Omni 或 Claude 3.5 Sonnet）更具优势，开发者越来越青睐使用小型 AI 模型。它们是适用于高频率、简单任务的有用选择，这些任务需要开发者反复调用 AI 模型来执行。

GPT-4o mini 将取代 GPT-3.5 Turbo 成为 OpenAI 提供的最小模型。根据 Artificial Analysis 的数据，OpenAI 声称其最新的 AI 模型在 MMLU 推理能力评估中得分为 82%，而 Gemini 1.5 Flash 得分为 79%，Claude 3 Haiku 得分为 75%。在 MGSM 数学推理评估中，GPT-4o mini 得分为 87%，Flash 得分为 78%，Haiku 得分为 72%。

此外，OpenAI 表示，GPT-4o mini 的运行成本明显低于以往的尖端模型，比 GPT-3.5 Turbo 便宜超过 60%。目前，GPT-4o mini 支持 API 中的文本和视觉功能，并且 OpenAI 表示该模型未来还将支持视频和音频功能。

“为了让世界各地都能受益于 AI，我们需要让模型更具成本效益。”OpenAI 的产品 API 负责人 Olivier Godement 在接受 TechCrunch 采访时表示，“我认为 GPT-4o mini 是朝这个方向迈出的重要一步。”

对于基于 OpenAI API 构建的开发者，GPT-4o mini 的定价为每百万输入 tokens 15 美分，每百万输出 tokens 60 美分。该模型的上下文窗口为 128,000 tokens，大致相当于一本书的长度，其知识截止日期为 2023 年 10 月。

OpenAI 未透露 GPT-4o mini 的确切规模，但表示其大致与其他小型 AI 模型（如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash）在同一层级。不过，OpenAI声称，根据在 LMSYS.org 聊天机器人领域的预发布测试，GPT-4o mini 比行业领先的小型模型更快、更具成本效益且更智能。早期的独立测试似乎证实了这一点。

“与同类模型相比，GPT-4o mini 非常快，平均输出速度为每秒 202 tokens。”Artificial Analysis 联合创始人 George Cameron 在给 TechCrunch 的一封电子邮件中表示，“这比 GPT-4o 和 GPT-3.5 Turbo 快 2 倍以上，对于包括许多消费者应用程序和使用 LLM 的代理方法在内的依赖速度的用例来说，是一个引人注目的选择。”

OpenAI 为 ChatGPT Enterprise 推出的新工具

另据报道，OpenAI 于周四宣布了针对企业客户的新工具。在一篇博文中，OpenAI 宣布了 Enterprise Compliance API，帮助金融、医疗、法律服务和政府等高度监管行业的企业符合日志和审计要求。

OpenAI表示，这些工具将允许管理员审计和采取行动处理其 ChatGPT Enterprise 数据。该 API 将提供时间戳记录的交互，包括对话、上传的文件、工作区用户等。

OpenAI 还为管理员提供了更细粒度的控制，以管理工作区 GPT，这是为特定业务用例创建的定制版本 ChatGPT。此前，管理员只能完全允许或阻止工作区中创建的 GPT 操作，但现在工作区所有者可以创建 GPT 可以交互的批准域列表。

参考内容：

GPT-4o mini: advancing cost-efficient intelligence

GPT-4o mini：推动高效智能的发展

ChatGPT-4o mini使用

价格较低，功能最强？OpenAI 推出 GPT-4o mini，一个更小、更便宜的人工智能模型

OpenAI 为 ChatGPT Enterprise 推出的新工具

相关文章：

价格较低，功能最强？OpenAI 推出 GPT-4o mini，一个更小、更便宜的人工智能模型

【学习笔记】无人机系统（UAS）的连接、识别和跟踪（八）-无人机探测与避让（DAA）机制

网络结构-组件-AI（九）

弹性网络回归（Elastic Net Regression）

【深度学习】FaceChain-SuDe，免训练，AI换脸

Uniapp鸿蒙项目实战

计算机三级嵌入式笔记（一）—— 嵌入式系统概论

react Jsx基础概念和本质

【深大计算机系统（2）】实验一实验环境配置与使用附常用指令

目标检测经典模型之YOLOV5-detect.py源码解析（持续更新）

PF4J+SpringBoot

设计模式11-原型模式

Tomcat长连接源码解析

C++编程：实现一个跨平台安全的定时器Timer模块

PyTorch的自动微分模块【含梯度基本数学原理详解】

AI 绘画｜Midjourney设计Logo提示词

LeNet实验四分类与四分类变为多个二分类

【BUG】已解决：java.lang.reflect.InvocationTargetException

配置kali 的apt命令在线安装包的源为国内源

JAVA 异步编程（线程安全）二

rknn优化教程（二）

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

day52 ResNet18 CBAM

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

GitHub 趋势日报 (2025年06月08日)

零基础设计模式——行为型模式 - 责任链模式

c#开发AI模型对话

浅谈不同二分算法的查找情况

C++使用 new 来创建动态数组