【GPT4O 开启多模态新时代!】
系列文章目录
GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用!
不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求
文章目录
- 系列文章目录
- 什么是GPT-4o?
- 一、GPT-40 的新功能
- 二、背景故事
- 1.主要特点与功能:
- 2.可用性和用户访问:
- 3.增强智能与高级工具的普及
- 抢先体验
- Mac APP多模态原生体验
- 各项指标遥遥领先
- Sam Altman对GPT-40的评价
- 总结

什么是GPT-4o?
OpenAl刚刚发布了 GPT-4o,它是一款超级AI模型,它不仅能读懂你的文字,还能听懂你的声音,看懂你的图像和视频,然后为你生成各种形式的输出。不管是写文章、听声音还是看视频,GPT-4o都能轻松应对。GPT-4o(“o”代表“全能”)是一种能够处理文本、音频和视频输入,并生成文本、音频和图像输出的综合模型
它的速度比 GPT4-turbo 快2 倍,价格便宜 50%! – 根据传统的基准测试,GPT-40 在文本、推理和编码智能方面的性能达到了 GPT-4Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。
一、GPT-40 的新功能
- GPT-40 的新功能
- 体验 GPT-4 级别的智能从模型和网页获取响应
- 分析数据并创建图表
- 讨论拍摄的照片
- 上传文件以获取摘要、写作或分析帮助·发现并使用 GPT 和 GPT 商店
- 通过“记忆”构建更有帮助的体验
二、背景故事
1.主要特点与功能:
- 模型优势:GPT-40 是最新的旗舰模型,具有 GPT-4级别的智能,但速度更快,且在文本、语音和视觉方面的能力得到了显著提升。、
- 图像理解与讨论:GPT-40 在理解和讨论用户分享的图像方面表现优于任何现有模型。例如,用户可以拍摄不同语言的菜单,与 GPT-40 对话以翻译、了解食物的历史和重要性,以及获取推荐。
- 即将推出的语音模式:未来的改进将支持更自然的实时语音对话和通过实时视频与 ChatGPT 对话的能力。例如,用户可以在观看现场体育赛事时,请求 ChatGPT解释规则。计划在未来几周内以 alpha 版本推出新的语音模式,并向 Plus 用户提供早期访问。
2.可用性和用户访问:
- 多语言支持:GPT-40 的语言能力在质量和速度上均有改进,现在 ChatGPT 支持超过 50 种语言的注册、登录、用户设置等。
- 用户层次:目前正向 ChatGPT Plus 和团队用户推出 GPT-40,企业用户即将可用。同时也开始向 ChatGPT Free 用户推出,但有使用限制。Plus 用户的消息限制是 Free 用户的5倍团队和企业用户则有更高的限制。
3.增强智能与高级工具的普及
- 使命与目标:使先进的 AI 工具能够为尽可能多的人提供服务。每周有超过一亿人使用ChatGPT。在未来几周,我们将开始向 ChatGPT Free 用户推出更多智能和高级工具。
抢先体验
可以直接使用GPT-4o,感受这一全能AI的强大功能。

对于免费用户,GPT-4o也在逐步开放使用中,大家可以保持关注,随时准备迎接这款超级AI的到来!LangGPT社群的已经有许多小伙伴获得了免费使用资格。点开模型选项时能够看到 GPT-4o 模型即可。

Mac APP多模态原生体验
要原生较好的体验 GPT-4o 的能力可以使用 mac 客户端,OpenAI 已经推出 Mac 上使用的电脑桌面端,但当前需要有使用权限。
官网上没有提供 Mac APP的下载链接,我为大家找找到了 APP 下载链接:
https://t.co/MhliG30zMa
安装好后需要登录 ChatGPT 账号使用

当然 如果出现了Coming soon 那就没办法了 等权限呗

各项指标遥遥领先
1,GPT-40 就是之前在在 LMSys 竞技场上测试了一个版本 即 im-also-a-good-gpt2-chatbot
下面是测试结果


Sam Altman对GPT-40的评价
- 在Sam Altman的博客文章“GPT-40”中,他强调了两个主要的更新和观点:
- 1.使强大的AI工具免费或低成本提供给用户:
- 0penAl的使命之一是向用户提供强大而高效的AI工具,且基本免费,如ChatGPT,并且没有广告等干扰。
- 0penAl最初的设想是创造A1,并利用它为世界带来种种益处。现在的情形更多的是0penAl创造AI后,其他人将使用这些AI创造出让所有人受益的惊人成果
- 尽管0penAl是一家商业机构,会发现许多收费的产品和服务,但其目标是向全球数十亿用户提供免费的、卓越的AI服务。
- 2.新的语音(及视频)模式是前所未有的计算机界面体验:
·新的语音和视频模式被描述为最好的计算机界面,给人一种如同电影中AI的感觉,这种体验是真实而令人惊讶的。- 达到接近人类水平的响应速度和表达能力,带来了重大的改变。与计算机的交互从未感觉如此自然。
- 新系统的快速、智能、有趣、自然和有用的特性,让与计算机的对话变得前所未有的自然,访问用户信息、代表用户采取行动等功能,Sam Altman展望了一个通过添加个性化选项、充满激动人心的未来,我们能够使用计算机做更多以前无法想象的事情。
- 1.使强大的AI工具免费或低成本提供给用户:
总结
- 最后,Sam Altman特别感谢团队为实现这些成就所投入的巨大努力。
更详细的功能介绍和展示:https://openai.com/index/hello-gpt-4o/
相关链接—https://xiaohu.ai/c/developer/paper — 链接-
相关文章:
【GPT4O 开启多模态新时代!】
系列文章目录 GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用! 不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求 文章目录 系列文章目录什么是GPT-4o?一、GPT-40 的新功能二、…...
HTTP协议及Python实现
最近的项目需要频繁在前后端之间传输数据,本篇主要介绍HTTP协议以及数据传输方法。 1 HTTP协议 1.1 http协议简介 HTTP(Hypertext Transfer Protocol)是一种用于传输超文本数据的应用层协议。它是万维网上数据交换的基础,定义了客户端和服务器之间进行通…...
【机器学习】逻辑化讲清PCA主成分分析
碎碎念:小编去年数学建模比赛的时候真的理解不了主成分分析中的“主成分”的概念!!但是,时隔两年,在机器学习领域我又行了,终于搞明白了!且看正文!再分享一个今天听到的播客中非常触…...
Vue常见的指令
Vue.js 提供了许多内置指令,这些指令可以在模板中用于处理元素的显示、行为等。以下是 Vue.js 中常见的 7 个指令及其详细代码示例: 1、v-bind:用于属性绑定,可以动态更新 HTML 属性。 html<template> <div> <img…...
【Ansible】ansible-playbook剧本
playbook 是ansible的脚本 playbook的组成 1)Tasks:任务;通过tasks 调用ansible 的模板将多个操作组织在一个playbook中运行 2)Variables:变量 3)Templates:模板 4)Handles…...
Linux的命令
; 昨天学习了七个命令,分别是:cd命令(切换目录)、pwd命令(当前目录)、mkdir命令(创建目录)、touch命令(创建文件)、date命令(显…...
No known conditions for “./lib/locale/lang/zh-cn“ entry in “element-plus“ pa
yarn的安装和卸载 npm install -g yarn npm uninstall yarn -g //yarn卸载 改用yarn卸载试试 先安装yarn npm install -g yarn 卸载掉原来的element-plus yarn remove element-plus 重新安装原有的element-plus版本 yarn add element-plus2.3.1 低版本页面引用为 i…...
实验名称:TCP 连接管理
目录 前言 TCP报文段格式 TCP建立连接 TCP释放连接 实验目的 实验原理 实验步骤 1. 启动WireShark,设置抓包状态 2. 访问指定服务器 ,通过Wireshark抓取通信数据报文 3. 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录 实验…...
go语言map底层及扩容机制原理详解(上)
底层数据结构-哈希表 go语言map的底层数据结构是哈希表:通过哈希表来存储键值对,通过hash函数把键值对散列到一个个桶(bucket)中。 什么是哈希表? 在顺序结构以及平衡树中,元素与其的存储位置之间没有对应关系,因此…...
互联网职场说 | “领导找我谈话,原来是给我涨薪,但却只涨了200,还偷偷叮嘱我保密,这次只给我涨了薪”
职场中,一般当领导找你谈话时,心里总是会涌起两种心理活动:问责和表扬。不过很多人第一反应就是有点担心害怕,其次才会想有什么好事临到我了! 一位职场网友分享说,有天领导忽然找她谈话,当时心…...
Android 如何启用user版本的adb源码分析
Android调试桥(ADB, Android Debug Bridge)是一个Android命令行工具,包含在SDK 平台工具包中,adb可以用于连接Android设备,或者模拟器,实现对设备的控制,比如安装和调试应用。和Appium一样,adb也是基于C/S架…...
linux phpstudy 重启命令
[rootLinuxWeb phpstudy]# ./system/phpstudyctl restart 查看命令 1) phpstudy -start 启动小皮面板 2) phpstudy -stop 停止小皮面板 3) phpstudy -restart 重启小皮面板 4) phpstudy -status 查询面板状态 5) phpstudy -in…...
台式电脑屏幕亮度怎么调节?让你的眼睛更舒适!
在日常使用台式电脑时,调节屏幕亮度是一项常见的需求。不同的环境和个人偏好可能需要不同的亮度设置。因此,了解台式电脑屏幕亮度怎么调节是非常重要的。本文将介绍三种常见的方法,帮助您轻松调节台式电脑屏幕亮度,以满足您的需求…...
打造安全的 Linux 环境:实用配置指南
唠唠闲话 一开始接触服务器,我只是把它当博客的托管网站,源文件用 GitHub 备份,所以网站被黑了也没啥关系。但随着使用深入,网站逐渐加入我的日常工作流中,而且有了使用更多服务的需求。在这种情况下,服务…...
神经网络有哪些算法
神经网络算法是人工智能领域的重要组成部分,它通过模拟人类神经系统的结构和功能,实现对复杂问题的处理和分析。以下是对神经网络算法的详细概述,包括常见的算法和它们的特点、应用等,力求达到约2500字的篇幅。 一、神经网络算法概述 神经网络算法是一种基于人工神经元的…...
计算机网络期末试题
第一章 概述 一. 单选题(共13题,36.4分) 1. (单选题) 因特网起源于( )网络。 A. ARPANETB. EthernetC. CATVD. CERNET 我的答案: A:ARPANET;正确答案: A:ARPANET; 2.8分 2. (单选题)人们把( )年作为因特网的诞…...
Unity学习笔记---图层
渲染层级 1,调整Sprite Renderer中的Order in Layer可以调整图层层级。 2,在Edit--Project Setting--Graphics中,调整TransParency Sort Mode为Custom Axis, 并将TransParency Sort Axis中的Z值默认的1改为0,将Y改为…...
【简单探索微软Edge】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...
YOLOv5独家改进:backbone改进 | 微软新作StarNet:超强轻量级Backbone | CVPR 2024
💡💡💡创新点:star operation(元素乘法)在无需加宽网络下,将输入映射到高维非线性特征空间的能力,这就是StarNet的核心创新,在紧凑的网络结构和较低的能耗下展示了令人印象深刻的性能和低延迟 💡💡💡如何跟YOLOv5结合:替代YOLOv5的backbone 收录 YOL…...
概率密度函数pdf的某种解释与洞察
1.一个想法实验 我在想一个数,姑且称之为X,介于0和10之间(含0和10)。如果我不告诉你别的,你会想象X = 0的概率是多少?X = 4?假设我对任何特定的数字都没有偏好,你会想象十一个整数0,1,2,.….,10也是一样。因为所有的概率加起来必须是1,所以逻辑上的结论是给11个选项…...
零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?
一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...
synchronized 学习
学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...
【WiFi帧结构】
文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成:MAC头部frame bodyFCS,其中MAC是固定格式的,frame body是可变长度。 MAC头部有frame control,duration,address1,address2,addre…...
2025年能源电力系统与流体力学国际会议 (EPSFD 2025)
2025年能源电力系统与流体力学国际会议(EPSFD 2025)将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会,EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...
基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解
JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用,结合SQLite数据库实现联系人管理功能,并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能,同时可以最小化到系统…...
处理vxe-table 表尾数据是单独一个接口,表格tableData数据更新后,需要点击两下,表尾才是正确的
修改bug思路: 分别把 tabledata 和 表尾相关数据 console.log() 发现 更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行 升级↑:async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...
腾讯云V3签名
想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...
Python 高级应用10:在python 大型项目中 FastAPI 和 Django 的相互配合
无论是python,或者java 的大型项目中,都会涉及到 自身平台微服务之间的相互调用,以及和第三发平台的 接口对接,那在python 中是怎么实现的呢? 在 Python Web 开发中,FastAPI 和 Django 是两个重要但定位不…...
