当前位置: 首页 > news >正文

GPT-4o:免费且更快的模型

OpenAI GPT-4o 公告

OpenAI 推出了增强版 GPT-4 模型——OpenAI GPT-4o,用于支持 ChatGPT。首席技术官 Mira Murati 表示,更新后的模型速度更快,并在文本、视觉和音频处理方面有了显著提升。GPT-4o 将免费向所有用户开放,付费用户的使用容量可达免费用户的五倍。

首席执行官 Sam Altman 强调,该模型具备“原生多模态”能力,能够生成内容或理解语音、文本和图像中的指令。开发者将可以访问该 API,费用是 GPT-4 Turbo 的一半,速度则是其两倍。

ChatGPT 的语音模式即将新增功能,使其能够作为实时语音助手并观察周围环境。Altman 回顾了 OpenAI 的发展历程,指出公司现在主要通过付费 API 向开发者提供先进的 AI 模型。

在发布之前,有关 OpenAI 的公告存在不同的猜测,包括 AI 搜索引擎、集成到 GPT-4 中的语音助手或新模型 GPT-5。OpenAI 选择在 Google I/O 之前发布,我们预计 Gemini 团队将在 I/O 上发布各种 AI 产品。

解析名称:GPT-4o

  • GPT: GPT 代表生成式预训练 Transformer,一种用于语言处理任务的神经网络架构。OpenAI GPT-4o 建立在其前身 GPT-3 和 GPT-4 的基础上。
  • “o” 代表 Omni: 字母“o”表示 GPT-4o 的关键特性——全模式能力。与之前的模型不同,GPT-4o 可以处理并响应各种格式的信息:文本、语音甚至视频。这样可以更全面地理解用户输入,从而提供更相关的响应。

可实时推理音频、视觉和文本的 AI 模型(功能)

无论你如何提出问题和请求,人工智能都能理解。无论是说话、打字还是展示图片,OpenAI 的最新成果 GPT-4o 都会迅速且智能地回应。以下是 GPT-4o 成为人工智能革命性飞跃的原因:

像天才一样思考,像闪电一样行动:

  • 更聪明: GPT-4o 在基于文本的任务中拥有与 GPT-4 Turbo 相当的推理和编码能力。此外,它在理解和响应音频、视频以及非英语语言方面表现优异。
  • **极快的速度:**瞬间获得答案!GPT-4o 的响应速度是 GPT-4 Turbo 的两倍,适合实时应用。

更实惠,更强大:

  • 价格减半,乐趣加倍: OpenAI GPT-4o 比其前身便宜得多,输入和输出令牌的价格都只有一半,使得这项先进技术更易获得。
  • 更高效: GPT-4o 的速率限制是其前代的五倍,允许用户更广泛地探索其功能并处理更大的数据集。

清晰的视觉,流利的表达:

  • 更清晰的视觉: GPT-4o 改进的视觉处理能力使其能够更准确地解释和响应图像。
  • **打破语言障碍:**跨境沟通变得更简单。GPT-4o 能有效处理非英语语言,并通过新的文本分解系统,使沟通更流畅。

始终保持最新:

  • 最新知识: GPT-4o 的知识库更新至 2023 年 10 月的信息,确保提供最相关、最准确的答复。

这只是 GPT-4o 功能的一瞥。未来,你可能会看到它:

  • 使用另一个 GPT-4o 实时创作音乐!
  • 通过逼真的对话练习求职面试。
  • 在实时翻译的帮助下学习新语言。

OpenAI 在开发过程中优先考虑安全性,因此你可以放心使用 GPT-4o。

使用新的 ChatGPT 桌面应用程序 (MacOS) 增强工作流程

更快完成任务:

  • 使用键盘快捷键(Option + Space)立即询问 ChatGPT 问题,无需切换应用程序!
  • 直接在应用程序中讨论屏幕截图,非常适合集思广益或获取反馈。

与 ChatGPT 对话(即将推出):

  • 使用 ChatGPT 开始语音对话,非常适合深入讨论。(目前提供基于文本的语音模式)

现可供 Plus 用户 (MacOS) 使用:

  • 所有人很快都会获得访问权限!Windows 版本将于今年晚些时候推出。

模态

通过图像看世界(即将提供视频支持):

目前,GPT-4o API 可以通过其视觉功能理解视频内容。视频需要以每秒 2-4 帧的速度分解为静止图像(帧)。可以在整个视频中均匀采样这些帧,或使用特定算法选择关键帧。欲了解更多信息,请参阅“GPT-4o 入门指南”。

聆听您的声音(数量有限):

虽然目前还未广泛普及,但 OpenAI 计划在未来几周内向选定的可信测试人员推出音频支持。GPT-4o 将能够直接理解口语,使交互更加自然。

生成图像:

如果你的目标是创建图像,GPT-4o 尚未实现。OpenAI 的 DALL-E 3 API 仍然是生成创意视觉内容的首选。

探索 GPT-4o 的功能

现在,让我们探索 GPT-4o 的令人兴奋的可能性:

  • **和谐二重唱:**想象一下两个 GPT-4o 模型互动甚至一起唱歌!这为探索 AI 驱动的音乐创作的新形式打开了大门。
  • **完善面试技巧:**需要在即将到来的面试中脱颖而出吗?使用 GPT-4o 进行练习,模拟真实的面试环境,进行真实的对话。
  • **有人玩石头、剪刀、布吗?:**想玩吗?GPT-4o 可以成为你的游戏伙伴,快速玩一轮石头、剪刀、布。
  • **攻克数学难题:**被数学题难住了?GPT-4o 可以帮助你理解复杂的概念和解方程。
  • **解锁新语言:**学习一门新语言?GPT-4o 可以成为你的私人语言导师,提供实时翻译并协助语言习得。
  • **打破语言障碍:**跨语言无缝沟通现已成为现实。GPT-4o 可以实时翻译语言,促进全球协作和理解。

使用 OpenAI GPT-4o 是否安全?

GPT-4o 完全可以安全使用,因为 OpenAI 优先考虑人工智能的安全性和负责任的开发。以下是 GPT-4o 的安全措施:

  • 多模态安全设计: GPT-4o 从头开始在其所有功能(文本、图像和未来的音频/视频)中整合了安全措施。过滤训练数据和训练后优化模型行为等技术有助于降低潜在风险。此外,还专门为语音输出创建了新的安全系统。
  • 严格的风险评估: OpenAI 根据自己的安全框架对 GPT-4o 进行了细致的评估,重点关注网络安全、生物安全风险 (CBRN)、说服技术和模型自主性等领域。这些评估表明,GPT-4o 在任何类别中的风险不超过“中等”。该评估涉及整个开发过程中的全面自动化和人工评估过程。
  • **外部红队测试:**为了识别新模式(音频和视频)带来的潜在风险,GPT-4o 与 70 多位外部专家进行了广泛的测试。这些专家专注于社会心理学、偏见检测和错误信息等领域。从这一过程中获得的经验被用于进一步完善 GPT-4o 的安全措施,确保更安全、更值得信赖的交互体验。
  • 持续的安全改进: OpenAI 承认,特别是在音频功能方面,存在新的风险需要考虑。虽然文本和图像功能最初会发布,但音频功能将分阶段推出。最初,音频输出将仅限于一组预定的声音,并受现有安全协议的约束。OpenAI 将在即将发布的系统卡中提供有关所有模式的安全措施的更多详细信息。

OpenAI 在探索 GPT-4o 的全部潜力的同时,致力于持续降低风险。
订阅国外服务,如GPT、Midjourney、OnlyFans等,请使用WildCard

结论:释放 GPT-4o 的力量

OpenAI 的 GPT-4o 现已推出,它已准备好彻底改变您的 AI 交互体验。文本和图像功能将首先推出,无论是在 ChatGPT 的 GPT-4o 免费版还是 GPT Plus 版中。Plus 用户将享受更高的消息限制。准备好通过文本提示和图像输入体验 GPT-4o 的强大功能吧。

想要使用语音与 GPT-4o 互动?ChatGPT Plus 用户即将迎来以 GPT-4o 为特色的语音模式新 alpha 版本。

开发者可以立即加入!通过 OpenAI API 访问 GPT-4o 的文本和视觉功能,与 GPT-4 Turbo 相比,它具有速度快、价格合理和更高的速率限制等优势。虽然音频和视频功能即将推出,但初始访问权限将授予一组选定的合作伙伴。

请继续关注 OpenAI 揭示 GPT-4o 全部潜力的激动人心的更新!

相关文章:

GPT-4o:免费且更快的模型

OpenAI GPT-4o 公告 OpenAI 推出了增强版 GPT-4 模型——OpenAI GPT-4o,用于支持 ChatGPT。首席技术官 Mira Murati 表示,更新后的模型速度更快,并在文本、视觉和音频处理方面有了显著提升。GPT-4o 将免费向所有用户开放,付费用户…...

docker部署fastdfs

我的镜像包地址 链接:https://pan.baidu.com/s/1j5E5O1xdyQVfJhsOevXvYg?pwdhcav 提取码:hcav docker load -i gofast.tar.gz拉取gofast docker pull sjqzhang/go-fastdfs启动gofast docker run -d --name fastdfs -p 8080:8080 -v /opt/lijia/lijia…...

【劲舞团game】

编写《劲舞团》这样的游戏代码是一个复杂的过程,涉及到游戏引擎的使用、图形渲染、物理模拟、音频处理、网络通信等多个方面。以下是一个非常简化的步骤,用于说明如何开始编写一个基于Unity引擎的简单舞蹈游戏: 1. 准备开发环境 下载并安装…...

Day15—图像爬虫与简单处理

图像爬虫是一种专门用于从互联网上下载图像的网络爬虫。除了文本内容,图像也是网站中的重要组成部分,它们可以用于多种目的,如图像识别、内容分析、数据备份等。 环境准备 首先,确保你的环境中已安装Python和必要的库。如果没有安装Pillow库,可以通过以下命令安装:pip in…...

Rust基础学习-Rust中的文件操作

文件结构 在Rust中,std::fs::File 结构体代表一个文件。它允许我们对文件执行读/写操作。文件 I/O 是通过提供与文件系统交互的功能的 std::fs 模块执行的。 File 结构体中的所有方法都返回std::io::Result的变体,或者简单地是 Result 枚举。这里会涉及…...

Activator.CreateInstance 与 Type.InvokeMember的区别

文章目录 一、使用 Activator.CreateInstance 创建实例1、使用 Activator.CreateInstance 的优点和缺点2、使用 Activator.CreateInstance 的代码示例 二、使用 Type.InvokeMember 创建实例1、使用 Type.InvokeMember 的优点和缺点2、使用 Type.InvokeMember 的代码示例 三、Ac…...

Java18+​App端采用uniapp+开发工具 idea hbuilder智能上门家政系统源码,一站式家政服务平台开发家政服务

Java18​App端采用uniapp开发工具 idea hbuilder智能上门家政系统源码,一站式家政服务平台开发 家政服务 家政服务是一个专为家政服务人员设计的平台,该平台旨在提供便捷、高效的工作机会,同时确保服务质量和客户体验。 以下是关于家政服务师…...

【MySQL】探索 MySQL 的 GROUP_CONCAT 函数

缘分让我们相遇乱世以外 命运却要我们危难中相爱 也许未来遥远在光年之外 我愿守候未知里为你等待 我没想到为了你我能疯狂到 山崩海啸没有你根本不想逃 我的大脑为了你已经疯狂到 脉搏心跳没有你根本不重要 🎵 邓紫棋《光年之外》 什么是 GRO…...

SpringBoot整合RabbitMQ (持续更新中)

RabbitMQ 官网地址:RabbitMQ: One broker to queue them all | RabbitMQ RabbitMQ 与 Erlang 版本兼容关系​ 3.13.0 26.0 26.2.x The 3.13 release series is compatible with Erlang 26. OpenSSL 3 support in Erlang is considered to be mature and ready for…...

瑞鑫RK3588 画中画 OSD 效果展示

这些功能本来在1126平台都实现过 但是迁移到3588平台之后 发现 API接口变化较大 主要开始的时候会比较费时间 需要找到变动接口对应的新接口 之后 就比较好操作了 经过几天的操作 已实现 效果如下...

【全开源】防伪溯源一体化管理系统源码(FastAdmin+ThinkPHP+Uniapp)

🔍防伪溯源一体化管理系统:守护品质,追溯无忧 一款基于FastAdminThinkPHP和Uniapp进行开发的多平台(微信小程序、H5网页)溯源、防伪、管理一体化独立系统,拥有强大的防伪码和溯源码双码生成功能&#xff0…...

自然语言处理:第三十三章FILCO:过滤内容的RAG

文章链接: [2311.08377] Learning to Filter Context for Retrieval-Augmented Generation (arxiv.org) 项目地址: zorazrw/filco: [Preprint] Learning to Filter Context for Retrieval-Augmented Generaton (github.com) 在人工智能领域,尤其是在开放域问答和事…...

js:flex弹性布局

目录 代码&#xff1a; 1、 flex-direction 2、flex-wrap 3、justify-content 4、align-items 5、align-content 代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewp…...

Pytorch常用函数用法归纳:创建tensor张量

1.torch.arange() (1)函数原型 torch.arange(start,end,step,*,out,dtype,layout,device,requires_grad) (2)参数说明: 参数名称参数类型参数说明startNumber起始值&#xff0c;默认值为0endNumber结束值&#xff0c;取不到&#xff0c;为开区间stepNumber步长值&#xff0…...

WPF前端:一个纯Xaml的水平导航栏

效果图&#xff1a; 代码&#xff1a; 1、样式代码&#xff0c;可以写在窗体资源处或者样式资源文件中 <Style x:Key"MenuRadioButtonStyle" TargetType"{x:Type RadioButton}"><Setter Property"FontSize" Value"16" />…...

谷粒商城实战(033 业务-秒杀功能4-高并发问题解决方案sentinel 1)

Java项目《谷粒商城》架构师级Java项目实战&#xff0c;对标阿里P6-P7&#xff0c;全网最强 总时长 104:45:00 共408P 此文章包含第326p-第p331的内容 关注的问题 sentinel&#xff08;哨兵&#xff09; sentinel来实现熔断、降级、限流等操作 腾讯开源的tendis&#xff0c…...

STM32项目分享:智能家居(机智云)系统

目录 一、前言 二、项目简介 1.功能详解 2.主要器件 三、原理图设计 四、PCB硬件设计 1.PCB图 2.PCB板及元器件图 五、程序设计 六、实验效果 七、资料内容 项目分享 一、前言 项目成品图片&#xff1a; 哔哩哔哩视频链接&#xff1a; https://www.bilibili.c…...

游戏盾之应用加速,何为应用加速

在数字化时代&#xff0c;用户对于应用程序的防护要求以及速度和性能要求越来越高。为了满足用户的期望并提高业务效率&#xff0c;应用加速成为了不可忽视的关键。 应用加速是新一代的智能分布式云接入系统&#xff0c;采用创新级SD-WAN跨域技术&#xff0c;针对高防机房痛点进…...

Java 基础面试题

文章目录 重载与重写抽象类与接口面向对象a a b 与 a b 的区别final、finalize、finallyString、StringBuild、StringBuffer位运算反射 重载与重写 重载&#xff1a;是在同一个类中&#xff0c;方法名相同&#xff0c;方法参数类型&#xff0c;个数不同&#xff0c;返回类型…...

Nginx 1.26.0 爆 HTTP/3 QUIC 漏洞,建议升级更新到 1.27.0

据悉&#xff0c;Nginx 1.25.0-1.26.0 主线版本中涉及四个与 NGINX HTTP/3 QUIC 模块相关的中级数据面 CVE 漏洞&#xff0c;其中三个为 DoS 攻击类型风险&#xff0c;一个为随机信息泄漏风险&#xff0c;影响皆为允许未经身份认证的用户通过构造请求实施攻击。目前已经紧急发布…...

离散状态观测器

-伺服&#xff08;实用&#xff09;A川伺服--模型追踪控制&#xff08;末端低频振动抑制-pmsm 完全自己搭建&#xff0c;原理清晰&#xff0c;效果可靠&#xff0c;可实际验证包含: &#xff08;1&#xff09;详细原理性推导 &#xff08;2&#xff09;仿真基于离散化模型以及离…...

宝塔面板计划任务设置教程

宝塔面板的计划任务&#xff0c;就是服务器的定时执行工具&#xff0c;不用手动敲命令&#xff0c;可视化界面就能设置&#xff0c;能实现自动备份、定时重启、清理缓存、执行脚本等多种自动化操作。下面详细讲解完整设置步骤、常用任务配置和避坑技巧。一、进入计划任务页面1.…...

每日算法练习:LeetCode 151. 反转字符串中的单词 ✅

大家好&#xff0c;我是你们的算法小伙伴。今天我们来练习一道字符串处理的经典中等题 ——LeetCode 151. 反转字符串中的单词。这道题考察对空格和单词边界的处理&#xff0c;是面试中高频的字符串操作题。题目描述给你一个字符串 s&#xff0c;请你反转字符串中单词的顺序。单…...

用PyTorch从零搭建U-Net:手把手教你搞定遥感图像分割(附完整代码)

用PyTorch从零搭建U-Net&#xff1a;手把手教你搞定遥感图像分割&#xff08;附完整代码&#xff09; 遥感图像分割是计算机视觉领域的重要应用方向&#xff0c;尤其在农业监测、城市规划、灾害评估等场景中发挥着关键作用。对于刚接触深度学习实践的开发者来说&#xff0c;从…...

如何通过AI技术提升图表创作效率?Next AI Draw.io全攻略

如何通过AI技术提升图表创作效率&#xff1f;Next AI Draw.io全攻略 【免费下载链接】next-ai-draw-io 项目地址: https://gitcode.com/GitHub_Trending/ne/next-ai-draw-io 技术人员日常工作中常会遇到这样的困境&#xff1a;花几小时绘制的架构图需要频繁修改&#x…...

可解释推荐-TKDE 24|基于强化路径推理的反事实解释优化策略

1. 为什么我们需要更好的推荐解释&#xff1f; 你有没有遇到过这种情况&#xff1a;某购物平台突然给你推荐了一款完全不符合你品味的商品&#xff0c;或者视频平台连续推送你根本不感兴趣的短视频&#xff1f;这时候你可能会想&#xff1a;"这个推荐系统到底是怎么想的&…...

SenseVoice-small部署教程:国产昇腾AI芯片Ascend CANN适配进展

SenseVoice-small部署教程&#xff1a;国产昇腾AI芯片Ascend CANN适配进展 1. 引言&#xff1a;当语音识别遇上国产算力 想象一下&#xff0c;你正在开发一款面向医疗场景的离线语音助手&#xff0c;需要实时将医生的口述病历转成文字。数据隐私要求极高&#xff0c;不能上传…...

从零开始:LabelImg图像标注工具的完整实战指南

从零开始&#xff1a;LabelImg图像标注工具的完整实战指南 【免费下载链接】labelImg LabelImg is now part of the Label Studio community. The popular image annotation tool created by Tzutalin is no longer actively being developed, but you can check out Label Stu…...

终极Android投屏指南:用escrcpy实现电脑无缝控制手机

终极Android投屏指南&#xff1a;用escrcpy实现电脑无缝控制手机 【免费下载链接】escrcpy 优雅而强大的跨平台 Android 设备控制工具&#xff0c;基于 Scrcpy 的 Electron 应用,支持无线连接和多设备管理,让您的电脑成为 Android 的完美伴侣。 项目地址: https://gitcode.co…...

从工具到生态:2026年建站系统深度解析与选型指南

在数字化转型已成为企业标配的今天&#xff0c;建立一个专业的官方网站&#xff0c;早已不是“有没有”的问题&#xff0c;而是“好不好用、能否支撑业务”的深层次考量。对于许多企业管理者、运营人员或创业者来说&#xff0c;“建站系统”这个词或许并不陌生&#xff0c;但当…...