【GPT4O 开启多模态新时代!】
系列文章目录
GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用!
不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求
文章目录
- 系列文章目录
- 什么是GPT-4o?
- 一、GPT-40 的新功能
- 二、背景故事
- 1.主要特点与功能:
- 2.可用性和用户访问:
- 3.增强智能与高级工具的普及
- 抢先体验
- Mac APP多模态原生体验
- 各项指标遥遥领先
- Sam Altman对GPT-40的评价
- 总结

什么是GPT-4o?
OpenAl刚刚发布了 GPT-4o,它是一款超级AI模型,它不仅能读懂你的文字,还能听懂你的声音,看懂你的图像和视频,然后为你生成各种形式的输出。不管是写文章、听声音还是看视频,GPT-4o都能轻松应对。GPT-4o(“o”代表“全能”)是一种能够处理文本、音频和视频输入,并生成文本、音频和图像输出的综合模型
它的速度比 GPT4-turbo 快2 倍,价格便宜 50%! – 根据传统的基准测试,GPT-40 在文本、推理和编码智能方面的性能达到了 GPT-4Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。
一、GPT-40 的新功能
- GPT-40 的新功能
- 体验 GPT-4 级别的智能从模型和网页获取响应
- 分析数据并创建图表
- 讨论拍摄的照片
- 上传文件以获取摘要、写作或分析帮助·发现并使用 GPT 和 GPT 商店
- 通过“记忆”构建更有帮助的体验
二、背景故事
1.主要特点与功能:
- 模型优势:GPT-40 是最新的旗舰模型,具有 GPT-4级别的智能,但速度更快,且在文本、语音和视觉方面的能力得到了显著提升。、
- 图像理解与讨论:GPT-40 在理解和讨论用户分享的图像方面表现优于任何现有模型。例如,用户可以拍摄不同语言的菜单,与 GPT-40 对话以翻译、了解食物的历史和重要性,以及获取推荐。
- 即将推出的语音模式:未来的改进将支持更自然的实时语音对话和通过实时视频与 ChatGPT 对话的能力。例如,用户可以在观看现场体育赛事时,请求 ChatGPT解释规则。计划在未来几周内以 alpha 版本推出新的语音模式,并向 Plus 用户提供早期访问。
2.可用性和用户访问:
- 多语言支持:GPT-40 的语言能力在质量和速度上均有改进,现在 ChatGPT 支持超过 50 种语言的注册、登录、用户设置等。
- 用户层次:目前正向 ChatGPT Plus 和团队用户推出 GPT-40,企业用户即将可用。同时也开始向 ChatGPT Free 用户推出,但有使用限制。Plus 用户的消息限制是 Free 用户的5倍团队和企业用户则有更高的限制。
3.增强智能与高级工具的普及
- 使命与目标:使先进的 AI 工具能够为尽可能多的人提供服务。每周有超过一亿人使用ChatGPT。在未来几周,我们将开始向 ChatGPT Free 用户推出更多智能和高级工具。
抢先体验
可以直接使用GPT-4o,感受这一全能AI的强大功能。

对于免费用户,GPT-4o也在逐步开放使用中,大家可以保持关注,随时准备迎接这款超级AI的到来!LangGPT社群的已经有许多小伙伴获得了免费使用资格。点开模型选项时能够看到 GPT-4o 模型即可。

Mac APP多模态原生体验
要原生较好的体验 GPT-4o 的能力可以使用 mac 客户端,OpenAI 已经推出 Mac 上使用的电脑桌面端,但当前需要有使用权限。
官网上没有提供 Mac APP的下载链接,我为大家找找到了 APP 下载链接:
https://t.co/MhliG30zMa
安装好后需要登录 ChatGPT 账号使用

当然 如果出现了Coming soon 那就没办法了 等权限呗

各项指标遥遥领先
1,GPT-40 就是之前在在 LMSys 竞技场上测试了一个版本 即 im-also-a-good-gpt2-chatbot
下面是测试结果


Sam Altman对GPT-40的评价
- 在Sam Altman的博客文章“GPT-40”中,他强调了两个主要的更新和观点:
- 1.使强大的AI工具免费或低成本提供给用户:
- 0penAl的使命之一是向用户提供强大而高效的AI工具,且基本免费,如ChatGPT,并且没有广告等干扰。
- 0penAl最初的设想是创造A1,并利用它为世界带来种种益处。现在的情形更多的是0penAl创造AI后,其他人将使用这些AI创造出让所有人受益的惊人成果
- 尽管0penAl是一家商业机构,会发现许多收费的产品和服务,但其目标是向全球数十亿用户提供免费的、卓越的AI服务。
- 2.新的语音(及视频)模式是前所未有的计算机界面体验:
·新的语音和视频模式被描述为最好的计算机界面,给人一种如同电影中AI的感觉,这种体验是真实而令人惊讶的。- 达到接近人类水平的响应速度和表达能力,带来了重大的改变。与计算机的交互从未感觉如此自然。
- 新系统的快速、智能、有趣、自然和有用的特性,让与计算机的对话变得前所未有的自然,访问用户信息、代表用户采取行动等功能,Sam Altman展望了一个通过添加个性化选项、充满激动人心的未来,我们能够使用计算机做更多以前无法想象的事情。
- 1.使强大的AI工具免费或低成本提供给用户:
总结
- 最后,Sam Altman特别感谢团队为实现这些成就所投入的巨大努力。
更详细的功能介绍和展示:https://openai.com/index/hello-gpt-4o/
相关链接—https://xiaohu.ai/c/developer/paper — 链接-
相关文章:
【GPT4O 开启多模态新时代!】
系列文章目录 GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用! 不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求 文章目录 系列文章目录什么是GPT-4o?一、GPT-40 的新功能二、…...
HTTP协议及Python实现
最近的项目需要频繁在前后端之间传输数据,本篇主要介绍HTTP协议以及数据传输方法。 1 HTTP协议 1.1 http协议简介 HTTP(Hypertext Transfer Protocol)是一种用于传输超文本数据的应用层协议。它是万维网上数据交换的基础,定义了客户端和服务器之间进行通…...
【机器学习】逻辑化讲清PCA主成分分析
碎碎念:小编去年数学建模比赛的时候真的理解不了主成分分析中的“主成分”的概念!!但是,时隔两年,在机器学习领域我又行了,终于搞明白了!且看正文!再分享一个今天听到的播客中非常触…...
Vue常见的指令
Vue.js 提供了许多内置指令,这些指令可以在模板中用于处理元素的显示、行为等。以下是 Vue.js 中常见的 7 个指令及其详细代码示例: 1、v-bind:用于属性绑定,可以动态更新 HTML 属性。 html<template> <div> <img…...
【Ansible】ansible-playbook剧本
playbook 是ansible的脚本 playbook的组成 1)Tasks:任务;通过tasks 调用ansible 的模板将多个操作组织在一个playbook中运行 2)Variables:变量 3)Templates:模板 4)Handles…...
Linux的命令
; 昨天学习了七个命令,分别是:cd命令(切换目录)、pwd命令(当前目录)、mkdir命令(创建目录)、touch命令(创建文件)、date命令(显…...
No known conditions for “./lib/locale/lang/zh-cn“ entry in “element-plus“ pa
yarn的安装和卸载 npm install -g yarn npm uninstall yarn -g //yarn卸载 改用yarn卸载试试 先安装yarn npm install -g yarn 卸载掉原来的element-plus yarn remove element-plus 重新安装原有的element-plus版本 yarn add element-plus2.3.1 低版本页面引用为 i…...
实验名称:TCP 连接管理
目录 前言 TCP报文段格式 TCP建立连接 TCP释放连接 实验目的 实验原理 实验步骤 1. 启动WireShark,设置抓包状态 2. 访问指定服务器 ,通过Wireshark抓取通信数据报文 3. 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录 实验…...
go语言map底层及扩容机制原理详解(上)
底层数据结构-哈希表 go语言map的底层数据结构是哈希表:通过哈希表来存储键值对,通过hash函数把键值对散列到一个个桶(bucket)中。 什么是哈希表? 在顺序结构以及平衡树中,元素与其的存储位置之间没有对应关系,因此…...
互联网职场说 | “领导找我谈话,原来是给我涨薪,但却只涨了200,还偷偷叮嘱我保密,这次只给我涨了薪”
职场中,一般当领导找你谈话时,心里总是会涌起两种心理活动:问责和表扬。不过很多人第一反应就是有点担心害怕,其次才会想有什么好事临到我了! 一位职场网友分享说,有天领导忽然找她谈话,当时心…...
Android 如何启用user版本的adb源码分析
Android调试桥(ADB, Android Debug Bridge)是一个Android命令行工具,包含在SDK 平台工具包中,adb可以用于连接Android设备,或者模拟器,实现对设备的控制,比如安装和调试应用。和Appium一样,adb也是基于C/S架…...
linux phpstudy 重启命令
[rootLinuxWeb phpstudy]# ./system/phpstudyctl restart 查看命令 1) phpstudy -start 启动小皮面板 2) phpstudy -stop 停止小皮面板 3) phpstudy -restart 重启小皮面板 4) phpstudy -status 查询面板状态 5) phpstudy -in…...
台式电脑屏幕亮度怎么调节?让你的眼睛更舒适!
在日常使用台式电脑时,调节屏幕亮度是一项常见的需求。不同的环境和个人偏好可能需要不同的亮度设置。因此,了解台式电脑屏幕亮度怎么调节是非常重要的。本文将介绍三种常见的方法,帮助您轻松调节台式电脑屏幕亮度,以满足您的需求…...
打造安全的 Linux 环境:实用配置指南
唠唠闲话 一开始接触服务器,我只是把它当博客的托管网站,源文件用 GitHub 备份,所以网站被黑了也没啥关系。但随着使用深入,网站逐渐加入我的日常工作流中,而且有了使用更多服务的需求。在这种情况下,服务…...
神经网络有哪些算法
神经网络算法是人工智能领域的重要组成部分,它通过模拟人类神经系统的结构和功能,实现对复杂问题的处理和分析。以下是对神经网络算法的详细概述,包括常见的算法和它们的特点、应用等,力求达到约2500字的篇幅。 一、神经网络算法概述 神经网络算法是一种基于人工神经元的…...
计算机网络期末试题
第一章 概述 一. 单选题(共13题,36.4分) 1. (单选题) 因特网起源于( )网络。 A. ARPANETB. EthernetC. CATVD. CERNET 我的答案: A:ARPANET;正确答案: A:ARPANET; 2.8分 2. (单选题)人们把( )年作为因特网的诞…...
Unity学习笔记---图层
渲染层级 1,调整Sprite Renderer中的Order in Layer可以调整图层层级。 2,在Edit--Project Setting--Graphics中,调整TransParency Sort Mode为Custom Axis, 并将TransParency Sort Axis中的Z值默认的1改为0,将Y改为…...
【简单探索微软Edge】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...
YOLOv5独家改进:backbone改进 | 微软新作StarNet:超强轻量级Backbone | CVPR 2024
💡💡💡创新点:star operation(元素乘法)在无需加宽网络下,将输入映射到高维非线性特征空间的能力,这就是StarNet的核心创新,在紧凑的网络结构和较低的能耗下展示了令人印象深刻的性能和低延迟 💡💡💡如何跟YOLOv5结合:替代YOLOv5的backbone 收录 YOL…...
概率密度函数pdf的某种解释与洞察
1.一个想法实验 我在想一个数,姑且称之为X,介于0和10之间(含0和10)。如果我不告诉你别的,你会想象X = 0的概率是多少?X = 4?假设我对任何特定的数字都没有偏好,你会想象十一个整数0,1,2,.….,10也是一样。因为所有的概率加起来必须是1,所以逻辑上的结论是给11个选项…...
RTOS实时操作系统核心机制与工程实践解析
1. RTOS基础概念与适用场景解析实时操作系统(Real-Time Operating System)是嵌入式开发中经常遇到的核心组件。作为一名在工业控制领域摸爬滚打多年的工程师,我见过太多项目因为RTOS选型不当而导致的灾难性后果。与通用操作系统不同ÿ…...
信号处理基础:时域与频域分析详解
1. 信号分析的双重视角:时域与频域 作为一名在信号处理领域工作多年的工程师,我经常需要向新人解释时域和频域的关系。简单来说,时域就像观察一个人的日常行为记录,而频域则像是给这个人做了一次全面的体检报告。两者描述的是同一…...
Linux内核中的cgroups技术详解
Linux内核中的cgroups技术详解 引言 cgroups(Control Groups)是Linux内核中用于限制、记录和隔离进程组资源使用的机制。它为容器技术、资源管理和服务质量保证提供了基础。cgroups允许管理员精细地控制系统资源的分配,确保关键任务获得足够的…...
从防御者视角看攻击:我用AntSword复现了一次真实的Webshell入侵,并总结了5条防护建议
从防御者视角拆解Webshell攻击链:基于AntSword的实战防护指南 当服务器日志里突然出现异常的PHP文件访问记录,或是网站目录下凭空多出一个陌生的shell.php时,很多运维团队才意识到防线早已被突破。去年某电商平台的用户数据泄露事件ÿ…...
Sen2Cor批处理实战:从L1C到L2A,如何确保你的大气校正结果不受处理基线影响?
Sen2Cor批处理实战:处理基线对L2A大气校正结果的影响解析 第一次用Sen2Cor处理完200景Sentinel-2数据后,我发现同一地区的NDVI值在不同时期竟然出现了断崖式下跌——不是植被变化,而是处理基线在作祟。这个教训让我意识到,批量大气…...
基于hadoop+spark+hive的音乐推荐系统设计与实现
前言随着数字化音乐资源的迅猛增长,传统音乐推荐方式在满足用户个性化需求方面渐显乏力。本研究基于 Python 展开,致力于设计并实现一个音乐推荐系统。通过整合协同过滤算法、数据挖掘技术以及机器学习算法,对用户的音乐偏好和行为进行深入剖…...
快速原型:用快马AI十分钟搭建clawhub skill技能分享平台Demo
最近在尝试做一个技能分享平台的原型,正好用InsCode(快马)平台快速搭建了一个clawhub skill的demo。整个过程比想象中顺利很多,特别适合需要快速验证产品想法的时候使用。 用户系统搭建 从最基础的注册登录开始,用平台内置的模板快速生成了表…...
威纶通MT8102iE触摸屏中文用户名显示不全?手把手教你用EasyBuilder Pro V6.09.01.357s搞定
威纶通MT8102iE触摸屏中文用户名显示异常的深度解决方案 在工业自动化控制系统中,人机界面(HMI)作为操作人员与设备交互的重要窗口,其用户体验直接影响着生产效率。威纶通(Weintek)MT8102iE作为一款广泛应用于工业场景的触摸屏,其用户管理功能…...
发票识别小助手:用OCR文字识别镜像自动读取发票信息
发票识别小助手:用OCR文字识别镜像自动读取发票信息 1. 项目背景与价值 在日常财务工作中,发票信息录入是一项耗时且容易出错的任务。传统的人工录入方式不仅效率低下,还容易因疲劳导致数据错误。OCR(光学字符识别)技…...
告别死记硬背:用GitHub笔记和实战思维重新理解电路与电子学
告别死记硬背:用GitHub笔记和实战思维重新理解电路与电子学 电路与电子学这门课,常常让计算机专业的学生又爱又恨。爱的是它揭示了计算机硬件底层的奥秘,恨的是那些繁琐的公式和抽象的概念。但问题真的出在课程本身吗?或许我们需…...
