【GPT4O 开启多模态新时代!】
系列文章目录
GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用!
不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求
文章目录
- 系列文章目录
- 什么是GPT-4o?
- 一、GPT-40 的新功能
- 二、背景故事
- 1.主要特点与功能:
- 2.可用性和用户访问:
- 3.增强智能与高级工具的普及
- 抢先体验
- Mac APP多模态原生体验
- 各项指标遥遥领先
- Sam Altman对GPT-40的评价
- 总结

什么是GPT-4o?
OpenAl刚刚发布了 GPT-4o,它是一款超级AI模型,它不仅能读懂你的文字,还能听懂你的声音,看懂你的图像和视频,然后为你生成各种形式的输出。不管是写文章、听声音还是看视频,GPT-4o都能轻松应对。GPT-4o(“o”代表“全能”)是一种能够处理文本、音频和视频输入,并生成文本、音频和图像输出的综合模型
它的速度比 GPT4-turbo 快2 倍,价格便宜 50%! – 根据传统的基准测试,GPT-40 在文本、推理和编码智能方面的性能达到了 GPT-4Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。
一、GPT-40 的新功能
- GPT-40 的新功能
- 体验 GPT-4 级别的智能从模型和网页获取响应
- 分析数据并创建图表
- 讨论拍摄的照片
- 上传文件以获取摘要、写作或分析帮助·发现并使用 GPT 和 GPT 商店
- 通过“记忆”构建更有帮助的体验
二、背景故事
1.主要特点与功能:
- 模型优势:GPT-40 是最新的旗舰模型,具有 GPT-4级别的智能,但速度更快,且在文本、语音和视觉方面的能力得到了显著提升。、
- 图像理解与讨论:GPT-40 在理解和讨论用户分享的图像方面表现优于任何现有模型。例如,用户可以拍摄不同语言的菜单,与 GPT-40 对话以翻译、了解食物的历史和重要性,以及获取推荐。
- 即将推出的语音模式:未来的改进将支持更自然的实时语音对话和通过实时视频与 ChatGPT 对话的能力。例如,用户可以在观看现场体育赛事时,请求 ChatGPT解释规则。计划在未来几周内以 alpha 版本推出新的语音模式,并向 Plus 用户提供早期访问。
2.可用性和用户访问:
- 多语言支持:GPT-40 的语言能力在质量和速度上均有改进,现在 ChatGPT 支持超过 50 种语言的注册、登录、用户设置等。
- 用户层次:目前正向 ChatGPT Plus 和团队用户推出 GPT-40,企业用户即将可用。同时也开始向 ChatGPT Free 用户推出,但有使用限制。Plus 用户的消息限制是 Free 用户的5倍团队和企业用户则有更高的限制。
3.增强智能与高级工具的普及
- 使命与目标:使先进的 AI 工具能够为尽可能多的人提供服务。每周有超过一亿人使用ChatGPT。在未来几周,我们将开始向 ChatGPT Free 用户推出更多智能和高级工具。
抢先体验
可以直接使用GPT-4o,感受这一全能AI的强大功能。

对于免费用户,GPT-4o也在逐步开放使用中,大家可以保持关注,随时准备迎接这款超级AI的到来!LangGPT社群的已经有许多小伙伴获得了免费使用资格。点开模型选项时能够看到 GPT-4o 模型即可。

Mac APP多模态原生体验
要原生较好的体验 GPT-4o 的能力可以使用 mac 客户端,OpenAI 已经推出 Mac 上使用的电脑桌面端,但当前需要有使用权限。
官网上没有提供 Mac APP的下载链接,我为大家找找到了 APP 下载链接:
https://t.co/MhliG30zMa
安装好后需要登录 ChatGPT 账号使用

当然 如果出现了Coming soon 那就没办法了 等权限呗

各项指标遥遥领先
1,GPT-40 就是之前在在 LMSys 竞技场上测试了一个版本 即 im-also-a-good-gpt2-chatbot
下面是测试结果


Sam Altman对GPT-40的评价
- 在Sam Altman的博客文章“GPT-40”中,他强调了两个主要的更新和观点:
- 1.使强大的AI工具免费或低成本提供给用户:
- 0penAl的使命之一是向用户提供强大而高效的AI工具,且基本免费,如ChatGPT,并且没有广告等干扰。
- 0penAl最初的设想是创造A1,并利用它为世界带来种种益处。现在的情形更多的是0penAl创造AI后,其他人将使用这些AI创造出让所有人受益的惊人成果
- 尽管0penAl是一家商业机构,会发现许多收费的产品和服务,但其目标是向全球数十亿用户提供免费的、卓越的AI服务。
- 2.新的语音(及视频)模式是前所未有的计算机界面体验:
·新的语音和视频模式被描述为最好的计算机界面,给人一种如同电影中AI的感觉,这种体验是真实而令人惊讶的。- 达到接近人类水平的响应速度和表达能力,带来了重大的改变。与计算机的交互从未感觉如此自然。
- 新系统的快速、智能、有趣、自然和有用的特性,让与计算机的对话变得前所未有的自然,访问用户信息、代表用户采取行动等功能,Sam Altman展望了一个通过添加个性化选项、充满激动人心的未来,我们能够使用计算机做更多以前无法想象的事情。
- 1.使强大的AI工具免费或低成本提供给用户:
总结
- 最后,Sam Altman特别感谢团队为实现这些成就所投入的巨大努力。
更详细的功能介绍和展示:https://openai.com/index/hello-gpt-4o/
相关链接—https://xiaohu.ai/c/developer/paper — 链接-
相关文章:
【GPT4O 开启多模态新时代!】
系列文章目录 GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用! 不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求 文章目录 系列文章目录什么是GPT-4o?一、GPT-40 的新功能二、…...
HTTP协议及Python实现
最近的项目需要频繁在前后端之间传输数据,本篇主要介绍HTTP协议以及数据传输方法。 1 HTTP协议 1.1 http协议简介 HTTP(Hypertext Transfer Protocol)是一种用于传输超文本数据的应用层协议。它是万维网上数据交换的基础,定义了客户端和服务器之间进行通…...
【机器学习】逻辑化讲清PCA主成分分析
碎碎念:小编去年数学建模比赛的时候真的理解不了主成分分析中的“主成分”的概念!!但是,时隔两年,在机器学习领域我又行了,终于搞明白了!且看正文!再分享一个今天听到的播客中非常触…...
Vue常见的指令
Vue.js 提供了许多内置指令,这些指令可以在模板中用于处理元素的显示、行为等。以下是 Vue.js 中常见的 7 个指令及其详细代码示例: 1、v-bind:用于属性绑定,可以动态更新 HTML 属性。 html<template> <div> <img…...
【Ansible】ansible-playbook剧本
playbook 是ansible的脚本 playbook的组成 1)Tasks:任务;通过tasks 调用ansible 的模板将多个操作组织在一个playbook中运行 2)Variables:变量 3)Templates:模板 4)Handles…...
Linux的命令
; 昨天学习了七个命令,分别是:cd命令(切换目录)、pwd命令(当前目录)、mkdir命令(创建目录)、touch命令(创建文件)、date命令(显…...
No known conditions for “./lib/locale/lang/zh-cn“ entry in “element-plus“ pa
yarn的安装和卸载 npm install -g yarn npm uninstall yarn -g //yarn卸载 改用yarn卸载试试 先安装yarn npm install -g yarn 卸载掉原来的element-plus yarn remove element-plus 重新安装原有的element-plus版本 yarn add element-plus2.3.1 低版本页面引用为 i…...
实验名称:TCP 连接管理
目录 前言 TCP报文段格式 TCP建立连接 TCP释放连接 实验目的 实验原理 实验步骤 1. 启动WireShark,设置抓包状态 2. 访问指定服务器 ,通过Wireshark抓取通信数据报文 3. 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录 实验…...
go语言map底层及扩容机制原理详解(上)
底层数据结构-哈希表 go语言map的底层数据结构是哈希表:通过哈希表来存储键值对,通过hash函数把键值对散列到一个个桶(bucket)中。 什么是哈希表? 在顺序结构以及平衡树中,元素与其的存储位置之间没有对应关系,因此…...
互联网职场说 | “领导找我谈话,原来是给我涨薪,但却只涨了200,还偷偷叮嘱我保密,这次只给我涨了薪”
职场中,一般当领导找你谈话时,心里总是会涌起两种心理活动:问责和表扬。不过很多人第一反应就是有点担心害怕,其次才会想有什么好事临到我了! 一位职场网友分享说,有天领导忽然找她谈话,当时心…...
Android 如何启用user版本的adb源码分析
Android调试桥(ADB, Android Debug Bridge)是一个Android命令行工具,包含在SDK 平台工具包中,adb可以用于连接Android设备,或者模拟器,实现对设备的控制,比如安装和调试应用。和Appium一样,adb也是基于C/S架…...
linux phpstudy 重启命令
[rootLinuxWeb phpstudy]# ./system/phpstudyctl restart 查看命令 1) phpstudy -start 启动小皮面板 2) phpstudy -stop 停止小皮面板 3) phpstudy -restart 重启小皮面板 4) phpstudy -status 查询面板状态 5) phpstudy -in…...
台式电脑屏幕亮度怎么调节?让你的眼睛更舒适!
在日常使用台式电脑时,调节屏幕亮度是一项常见的需求。不同的环境和个人偏好可能需要不同的亮度设置。因此,了解台式电脑屏幕亮度怎么调节是非常重要的。本文将介绍三种常见的方法,帮助您轻松调节台式电脑屏幕亮度,以满足您的需求…...
打造安全的 Linux 环境:实用配置指南
唠唠闲话 一开始接触服务器,我只是把它当博客的托管网站,源文件用 GitHub 备份,所以网站被黑了也没啥关系。但随着使用深入,网站逐渐加入我的日常工作流中,而且有了使用更多服务的需求。在这种情况下,服务…...
神经网络有哪些算法
神经网络算法是人工智能领域的重要组成部分,它通过模拟人类神经系统的结构和功能,实现对复杂问题的处理和分析。以下是对神经网络算法的详细概述,包括常见的算法和它们的特点、应用等,力求达到约2500字的篇幅。 一、神经网络算法概述 神经网络算法是一种基于人工神经元的…...
计算机网络期末试题
第一章 概述 一. 单选题(共13题,36.4分) 1. (单选题) 因特网起源于( )网络。 A. ARPANETB. EthernetC. CATVD. CERNET 我的答案: A:ARPANET;正确答案: A:ARPANET; 2.8分 2. (单选题)人们把( )年作为因特网的诞…...
Unity学习笔记---图层
渲染层级 1,调整Sprite Renderer中的Order in Layer可以调整图层层级。 2,在Edit--Project Setting--Graphics中,调整TransParency Sort Mode为Custom Axis, 并将TransParency Sort Axis中的Z值默认的1改为0,将Y改为…...
【简单探索微软Edge】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...
YOLOv5独家改进:backbone改进 | 微软新作StarNet:超强轻量级Backbone | CVPR 2024
💡💡💡创新点:star operation(元素乘法)在无需加宽网络下,将输入映射到高维非线性特征空间的能力,这就是StarNet的核心创新,在紧凑的网络结构和较低的能耗下展示了令人印象深刻的性能和低延迟 💡💡💡如何跟YOLOv5结合:替代YOLOv5的backbone 收录 YOL…...
概率密度函数pdf的某种解释与洞察
1.一个想法实验 我在想一个数,姑且称之为X,介于0和10之间(含0和10)。如果我不告诉你别的,你会想象X = 0的概率是多少?X = 4?假设我对任何特定的数字都没有偏好,你会想象十一个整数0,1,2,.….,10也是一样。因为所有的概率加起来必须是1,所以逻辑上的结论是给11个选项…...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...
TDengine 快速体验(Docker 镜像方式)
简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能,本节首先介绍如何通过 Docker 快速体验 TDengine,然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker,请使用 安装包的方式快…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...
【入坑系列】TiDB 强制索引在不同库下不生效问题
文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...
转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
如何为服务器生成TLS证书
TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...
Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)
引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...
PL0语法,分析器实现!
简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...
MySQL 8.0 OCP 英文题库解析(十三)
Oracle 为庆祝 MySQL 30 周年,截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。 从今天开始,将英文题库免费公布出来,并进行解析,帮助大家在一个月之内轻松通过OCP认证。 本期公布试题111~120 试题1…...
