当前位置: 首页 > news >正文

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

目录

相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

OpenAI o3-mini的简介

1、特点

2、性能表现

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

3、模型速度和性能

4、安全性

5、未来展望

OpenAI o3-mini的安装和使用方法

1、安装

2、使用方法

ChatGPT

API

OpenAI o3-mini的案例应用


相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读-CSDN博客

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略-CSDN博客

OpenAI o3-mini的简介

OpenAI o3-mini是OpenAI发布的最新推理模型,也是该系列中最经济高效的模型。它于2024年12月预览,现已在ChatGPT和API中可用。o3-mini是一个强大且快速的模型,它突破了小型模型的性能限制,在科学、数学和编码等STEM领域展现出卓越的能力,同时保持了与OpenAI o1-mini相同的低成本和低延迟。

o3-mini是第一个支持函数调用结构化输出开发者消息小型推理模型,使其具备生产就绪能力。它支持流式输出,并提供低、中、高三种推理强度选项,以适应不同的使用场景。 o3-mini作为一款经济高效、功能强大的推理模型,已在多种平台和API中推出,并对不同用户群体开放,极大提升了AI技术的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上线,企业版将于2月上线。API方面,o3-mini已开始向API使用等级3-5的开发者推出。免费用户也可以在ChatGPT中使用o3-mini。

总而言之,OpenAI o3-mini 是一款在保持低成本低延迟的同时,拥有强大STEM能力,尤其在科学、数学和编码方面表现出色的推理模型。它支持多种开发者功能,并提供了多种推理强度选项,以适应不同的使用场景。在多个基准测试中,o3-mini 的性能超越了其前代模型,并且在安全性方面也进行了充分的考量。o3-mini 的发布标志着 OpenAI 在经济高效人工智能领域取得了重要进展,也为更广泛的 AI 应用铺平了道路。

官网文章:https://openai.com/index/openai-o3-mini/

1、特点

>> 高性价比:o3-mini在保持低成本和低延迟的同时,提供了强大的推理能力。
>> 强大的STEM能力:在科学、数学和编码方面表现出色,尤其在解决复杂问题方面能力突出。
>> 丰富的开发者功能:支持函数调用、结构化输出和开发者消息,方便开发者集成到各种应用中。
>> 可调节的推理强度:提供低、中、高三种推理强度选项,允许开发者根据具体应用场景调整模型的推理深度和速度。
>> 快速响应:平均响应时间比o1-mini快24%,首次token生成时间快2500毫秒。
>> 更高的准确性:专家测试显示,o3-mini的答案更准确、更清晰,推理能力更强,错误率降低了39%。
>> 支持搜索:可以结合搜索引擎查找最新的信息,并提供相关链接(目前为早期原型)。
>> 安全性:采用审慎对齐技术进行训练,在安全性和防越狱评估中表现优异。

2、性能表现

o3-mini在STEM领域表现出色,尤其在数学、编码和科学方面,其性能与OpenAI o1相当甚至超越,同时响应速度更快,错误率更低。o3-mini在各种STEM相关的基准测试和人类偏好测试中均表现优异,证明了其在准确性、速度和推理能力方面的优势。

在多个基准测试中,o3-mini均取得了优异的成绩,包括:

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

>> FrontierMath:o3-mini (高推理强度)在首次尝试时解决了超过32%的问题。

>> 竞赛编码 (Codeforces):o3-mini在不同推理强度下均优于o1-mini。

>> 软件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表现最佳的模型。

>> LiveBench 编码:o3-mini在中、高推理强度下均优于o1-high。

>> 一般知识:o3-mini在一般知识评估中优于o1-mini。

在人类偏好评估中,测试者更倾向于o3-mini的回答 (56%),并且错误率降低了39%。o3-mini的响应速度比o1-mini快24%。

3、模型速度和性能

o3-mini在保持与OpenAI o1相当的智能水平的同时,实现了更快的性能和更高的效率。o3-mini在速度和效率方面显著优于其前代模型,这使其更适合需要快速响应的应用场景。

o3-mini的平均响应时间为7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的时间上也比o1-mini快2500毫秒。

4、安全性

OpenAI 采取了严格的安全措施来确保 o3-mini 的安全性和可靠性。OpenAI 使用审慎对齐技术训练 o3-mini,使其能够安全地响应用户提示。o3-mini在安全性和防越狱评估中显著优于GPT-4o。

在部署之前,OpenAI 对 o3-mini 进行了全面的安全评估,包括外部红队测试和安全评估。详细的评估结果可在 o3-mini 系统卡片中查看。

5、未来展望

OpenAI 将继续努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 将继续致力于开发平衡智能、效率和安全性的模型。OpenAI o3-mini 的发布是 OpenAI 持续推进经济高效人工智能发展的重要一步,它使得高质量的 AI 更加易于获取。

OpenAI o3-mini的安装和使用方法

1、安装

OpenAI o3-mini 目前并未开源,不支持本地部署。用户只能通过在线方式(例如在ChatGPT中使用)或调用OpenAI提供的API来使用该模型。

2、使用方法

ChatGPT

ChatGPT Plus、Team和Pro用户可以直接在模型选择器中选择o3-mini使用。免费用户可以通过选择“Reason”或重新生成回复来使用o3-mini。

付费用户 (Plus, Team, Pro):直接在ChatGPT的模型选择器中选择 o3-mini 即可使用。

免费用户:可以通过两种方式使用:在消息输入框中选择 "Reason"。重新生成已有的回复。

API

o3-mini已开始在Chat Completions API、Assistants API和Batch API中向特定等级的开发者推出。 具体使用方法取决于你选择的 API,请参考 OpenAI 的 API 文档。开发者可以根据需求选择三种推理强度:低、中、高。 高强度推理会更准确,但响应速度较慢;低强度推理速度更快,但准确性可能略低。 中等强度则在速度和准确性之间取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)

OpenAI o3-mini的案例应用

持续更新中……

相关文章:

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略 目录 相关文章 LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读 LLMs之OpenAI o系列:OpenAI o3-mini的简介、安…...

深度解析:网站快速收录与网站安全性的关系

本文转自:百万收录网 原文链接:https://www.baiwanshoulu.com/58.html 网站快速收录与网站安全性之间存在着密切的关系。以下是对这一关系的深度解析: 一、网站安全性对收录的影响 搜索引擎惩罚: 如果一个网站存在安全隐患&am…...

【Rust自学】16.2. 使用消息传递来跨线程传递数据

喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 16.2.1. 消息传递 有一种很流行而且能保证安全并发的技术(或者叫机制)叫做消息传递。在这种机制里,线…...

如何实现滑动网格的功能

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了SliverList组件相关的内容,本章回中将介绍SliverGrid组件.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 我们在本章回中介绍的SliverGrid组件是一种网格类组件,主要用来…...

使用C# 如何获取本机连接的WIFI名称[C# ---1]

前言 楼主最近在写一个WLAN上位机,遇到了使用C#查询SSID 的问题。CSDN上很多文章都比较老了,而且代码过于复杂。楼主自己想了一个使用CMD来获得SSID的方法 C#本身是没有获得WINDOWS网路信息的能力,必须要用系统API,WMI什么的&…...

【Docker】快速部署 Nacos 注册中心

【Docker】快速部署 Nacos 注册中心 引言 Nacos 注册中心是一个用于服务发现和配置管理的开源项目。提供了动态服务发现、服务健康检查、动态配置管理和服务管理等功能,帮助开发者更轻松地构建微服务架构。 仓库地址 https://github.com/alibaba/nacos 步骤 拉取…...

OpenCV:闭运算

目录 1. 简述 2. 用膨胀和腐蚀实现闭运算 2.1 代码示例 2.2 运行结果 3. 闭运算接口 3.1 参数详解 3.2 代码示例 3.3 运行结果 4. 闭运算的应用场景 5. 注意事项 相关阅读 OpenCV:图像的腐蚀与膨胀-CSDN博客 OpenCV:开运算-CSDN博客 1. 简述…...

Python | Pytorch | Tensor知识点总结

如是我闻: Tensor 是我们接触Pytorch了解到的第一个概念,这里是一个关于 PyTorch Tensor 主题的知识点总结,涵盖了 Tensor 的基本概念、创建方式、运算操作、梯度计算和 GPU 加速等内容。 1. Tensor 基本概念 Tensor 是 PyTorch 的核心数据结…...

aws(学习笔记第二十六课) 使用AWS Elastic Beanstalk

aws(学习笔记第二十六课) 使用aws Elastic Beanstalk 学习内容: AWS Elastic Beanstalk整体架构AWS Elastic Beanstalk的hands onAWS Elastic Beanstalk部署node.js程序包练习使用AWS Elastic Beanstalk的ebcli 1. AWS Elastic Beanstalk整体架构 官方的guide AWS…...

《OpenCV》——图像透视转换

图像透视转换简介 在 OpenCV 里,图像透视转换属于重要的几何变换,也被叫做投影变换。下面从原理、实现步骤、相关函数和应用场景几个方面为你详细介绍。 原理 实现步骤 选取对应点:要在源图像和目标图像上分别找出至少四个对应的点。这些对…...

9 点结构模块(point.rs)

一、point.rs源码 use super::UnknownUnit; use crate::approxeq::ApproxEq; use crate::approxord::{max, min}; use crate::length::Length; use crate::num::*; use crate::scale::Scale; use crate::size::{Size2D, Size3D}; use crate::vector::{vec2, vec3, Vector2D, V…...

Java线程认识和Object的一些方法ObjectMonitor

专栏系列文章地址:https://blog.csdn.net/qq_26437925/article/details/145290162 本文目标: 要对Java线程有整体了解,深入认识到里面的一些方法和Object对象方法的区别。认识到Java对象的ObjectMonitor,这有助于后面的Synchron…...

【高等数学】贝塞尔函数

贝塞尔函数(Bessel functions)是数学中一类重要的特殊函数,通常用于解决涉及圆对称或球对称的微分方程。它们在物理学、工程学、天文学等多个领域都有广泛的应用,例如在波动方程、热传导方程、电磁波传播等问题中。 贝塞尔函数的…...

99.20 金融难点通俗解释:中药配方比喻马科维茨资产组合模型(MPT)

目录 0. 承前1. 核心知识点拆解2. 中药搭配比喻方案分析2.1 比喻的合理性 3. 通俗易懂的解释3.1 以中药房为例3.2 配方原理 4. 实际应用举例4.1 基础配方示例4.2 效果说明 5. 注意事项5.1 个性化配置5.2 定期调整 6. 总结7. 代码实现 0. 承前 本文主旨: 本文通过中…...

实现使用K210单片机进行猫脸检测,并在检测到猫脸覆盖屏幕50%以上时执行特定操作

要实现使用K210单片机进行猫脸检测,并在检测到猫脸覆盖屏幕50%以上时执行特定操作,以及通过WiFi上传图片到微信小程序,并在微信小程序中上传图片到开发板进行训练,可以按照以下步骤进行: 1. 硬件连接 确保K210开发板…...

小程序设计和开发:如何研究同类型小程序的优点和不足。

一、确定研究目标和范围 明确研究目的 在开始研究同类型小程序之前,首先需要明确研究的目的。是为了改进自己的小程序设计和开发,还是为了了解市场趋势和用户需求?不同的研究目的会影响研究的方法和重点。例如,如果研究目的是为了…...

tiktok 国际版抖抖♬♬ X-Bogus参数算法逆向分析

加密请求参数得到乱码,最终得到X-Bogus...

Redis 基础命令

1. redis 命令官网 https://redis.io/docs/latest/commands/ 2. 在 redis-cli 中使用 help 命令 # 查看 help string 基础命令 keys * # * 代表通配符set key value # 设置键值对del key # 删除键expire key 时间 # 给键设置时间 # -2 代表时间到期了, -1 代表…...

深入解析Python机器学习库Scikit-Learn的应用实例

深入解析Python机器学习库Scikit-Learn的应用实例 随着人工智能和数据科学领域的迅速发展,机器学习成为了当下最炙手可热的技术之一。而在机器学习领域,Python作为一种功能强大且易于上手的编程语言,拥有庞大的生态系统和丰富的机器学习库。其…...

专业的定制版软件,一键操作,无限使用

今天给大家介绍一个专业的PDF转word的小软件,软件只有5.5M。非常小,而且没有文档大小的限制,可以随意使用。 PDFtu PDF转word 软件第一次使用需要安装一下。 安装好之后,我们就能在桌面找到对应的图标,打开就能直接使…...

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计:let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性,这种设计体现了语言的核心哲学。以下是深度解析: 1.1 设计理念剖析 安全优先原则:默认不可变强制开发者明确声明意图 let x 5; …...

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径

目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

大型活动交通拥堵治理的视觉算法应用

大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动(如演唱会、马拉松赛事、高考中考等)期间,城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例,暖城商圈曾因观众集中离场导致周边…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...

汽车生产虚拟实训中的技能提升与生产优化​

在制造业蓬勃发展的大背景下,虚拟教学实训宛如一颗璀璨的新星,正发挥着不可或缺且日益凸显的关键作用,源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例,汽车生产线上各类…...

条件运算符

C中的三目运算符(也称条件运算符,英文:ternary operator)是一种简洁的条件选择语句,语法如下: 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true,则整个表达式的结果为“表达式1”…...

测试markdown--肇兴

day1: 1、去程:7:04 --11:32高铁 高铁右转上售票大厅2楼,穿过候车厅下一楼,上大巴车 ¥10/人 **2、到达:**12点多到达寨子,买门票,美团/抖音:¥78人 3、中饭&a…...

【7色560页】职场可视化逻辑图高级数据分析PPT模版

7种色调职场工作汇报PPT,橙蓝、黑红、红蓝、蓝橙灰、浅蓝、浅绿、深蓝七种色调模版 【7色560页】职场可视化逻辑图高级数据分析PPT模版:职场可视化逻辑图分析PPT模版https://pan.quark.cn/s/78aeabbd92d1...