【GPT4O 开启多模态新时代!】
系列文章目录
GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用!
不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求
文章目录
- 系列文章目录
- 什么是GPT-4o?
- 一、GPT-40 的新功能
- 二、背景故事
- 1.主要特点与功能:
- 2.可用性和用户访问:
- 3.增强智能与高级工具的普及
- 抢先体验
- Mac APP多模态原生体验
- 各项指标遥遥领先
- Sam Altman对GPT-40的评价
- 总结

什么是GPT-4o?
OpenAl刚刚发布了 GPT-4o,它是一款超级AI模型,它不仅能读懂你的文字,还能听懂你的声音,看懂你的图像和视频,然后为你生成各种形式的输出。不管是写文章、听声音还是看视频,GPT-4o都能轻松应对。GPT-4o(“o”代表“全能”)是一种能够处理文本、音频和视频输入,并生成文本、音频和图像输出的综合模型
它的速度比 GPT4-turbo 快2 倍,价格便宜 50%! – 根据传统的基准测试,GPT-40 在文本、推理和编码智能方面的性能达到了 GPT-4Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。
一、GPT-40 的新功能
- GPT-40 的新功能
- 体验 GPT-4 级别的智能从模型和网页获取响应
- 分析数据并创建图表
- 讨论拍摄的照片
- 上传文件以获取摘要、写作或分析帮助·发现并使用 GPT 和 GPT 商店
- 通过“记忆”构建更有帮助的体验
二、背景故事
1.主要特点与功能:
- 模型优势:GPT-40 是最新的旗舰模型,具有 GPT-4级别的智能,但速度更快,且在文本、语音和视觉方面的能力得到了显著提升。、
- 图像理解与讨论:GPT-40 在理解和讨论用户分享的图像方面表现优于任何现有模型。例如,用户可以拍摄不同语言的菜单,与 GPT-40 对话以翻译、了解食物的历史和重要性,以及获取推荐。
- 即将推出的语音模式:未来的改进将支持更自然的实时语音对话和通过实时视频与 ChatGPT 对话的能力。例如,用户可以在观看现场体育赛事时,请求 ChatGPT解释规则。计划在未来几周内以 alpha 版本推出新的语音模式,并向 Plus 用户提供早期访问。
2.可用性和用户访问:
- 多语言支持:GPT-40 的语言能力在质量和速度上均有改进,现在 ChatGPT 支持超过 50 种语言的注册、登录、用户设置等。
- 用户层次:目前正向 ChatGPT Plus 和团队用户推出 GPT-40,企业用户即将可用。同时也开始向 ChatGPT Free 用户推出,但有使用限制。Plus 用户的消息限制是 Free 用户的5倍团队和企业用户则有更高的限制。
3.增强智能与高级工具的普及
- 使命与目标:使先进的 AI 工具能够为尽可能多的人提供服务。每周有超过一亿人使用ChatGPT。在未来几周,我们将开始向 ChatGPT Free 用户推出更多智能和高级工具。
抢先体验
可以直接使用GPT-4o,感受这一全能AI的强大功能。

对于免费用户,GPT-4o也在逐步开放使用中,大家可以保持关注,随时准备迎接这款超级AI的到来!LangGPT社群的已经有许多小伙伴获得了免费使用资格。点开模型选项时能够看到 GPT-4o 模型即可。

Mac APP多模态原生体验
要原生较好的体验 GPT-4o 的能力可以使用 mac 客户端,OpenAI 已经推出 Mac 上使用的电脑桌面端,但当前需要有使用权限。
官网上没有提供 Mac APP的下载链接,我为大家找找到了 APP 下载链接:
https://t.co/MhliG30zMa
安装好后需要登录 ChatGPT 账号使用

当然 如果出现了Coming soon 那就没办法了 等权限呗

各项指标遥遥领先
1,GPT-40 就是之前在在 LMSys 竞技场上测试了一个版本 即 im-also-a-good-gpt2-chatbot
下面是测试结果


Sam Altman对GPT-40的评价
- 在Sam Altman的博客文章“GPT-40”中,他强调了两个主要的更新和观点:
- 1.使强大的AI工具免费或低成本提供给用户:
- 0penAl的使命之一是向用户提供强大而高效的AI工具,且基本免费,如ChatGPT,并且没有广告等干扰。
- 0penAl最初的设想是创造A1,并利用它为世界带来种种益处。现在的情形更多的是0penAl创造AI后,其他人将使用这些AI创造出让所有人受益的惊人成果
- 尽管0penAl是一家商业机构,会发现许多收费的产品和服务,但其目标是向全球数十亿用户提供免费的、卓越的AI服务。
- 2.新的语音(及视频)模式是前所未有的计算机界面体验:
·新的语音和视频模式被描述为最好的计算机界面,给人一种如同电影中AI的感觉,这种体验是真实而令人惊讶的。- 达到接近人类水平的响应速度和表达能力,带来了重大的改变。与计算机的交互从未感觉如此自然。
- 新系统的快速、智能、有趣、自然和有用的特性,让与计算机的对话变得前所未有的自然,访问用户信息、代表用户采取行动等功能,Sam Altman展望了一个通过添加个性化选项、充满激动人心的未来,我们能够使用计算机做更多以前无法想象的事情。
- 1.使强大的AI工具免费或低成本提供给用户:
总结
- 最后,Sam Altman特别感谢团队为实现这些成就所投入的巨大努力。
更详细的功能介绍和展示:https://openai.com/index/hello-gpt-4o/
相关链接—https://xiaohu.ai/c/developer/paper — 链接-
相关文章:
【GPT4O 开启多模态新时代!】
系列文章目录 GPT-4o的出现,让 AI 真正进入了全能时代,而且 OpenAI 宣布所有人免费使用! 不论你是需要写文章、听声音还是看视频,GPT-4o都能满足你的需求 文章目录 系列文章目录什么是GPT-4o?一、GPT-40 的新功能二、…...
HTTP协议及Python实现
最近的项目需要频繁在前后端之间传输数据,本篇主要介绍HTTP协议以及数据传输方法。 1 HTTP协议 1.1 http协议简介 HTTP(Hypertext Transfer Protocol)是一种用于传输超文本数据的应用层协议。它是万维网上数据交换的基础,定义了客户端和服务器之间进行通…...
【机器学习】逻辑化讲清PCA主成分分析
碎碎念:小编去年数学建模比赛的时候真的理解不了主成分分析中的“主成分”的概念!!但是,时隔两年,在机器学习领域我又行了,终于搞明白了!且看正文!再分享一个今天听到的播客中非常触…...
Vue常见的指令
Vue.js 提供了许多内置指令,这些指令可以在模板中用于处理元素的显示、行为等。以下是 Vue.js 中常见的 7 个指令及其详细代码示例: 1、v-bind:用于属性绑定,可以动态更新 HTML 属性。 html<template> <div> <img…...
【Ansible】ansible-playbook剧本
playbook 是ansible的脚本 playbook的组成 1)Tasks:任务;通过tasks 调用ansible 的模板将多个操作组织在一个playbook中运行 2)Variables:变量 3)Templates:模板 4)Handles…...
Linux的命令
; 昨天学习了七个命令,分别是:cd命令(切换目录)、pwd命令(当前目录)、mkdir命令(创建目录)、touch命令(创建文件)、date命令(显…...
No known conditions for “./lib/locale/lang/zh-cn“ entry in “element-plus“ pa
yarn的安装和卸载 npm install -g yarn npm uninstall yarn -g //yarn卸载 改用yarn卸载试试 先安装yarn npm install -g yarn 卸载掉原来的element-plus yarn remove element-plus 重新安装原有的element-plus版本 yarn add element-plus2.3.1 低版本页面引用为 i…...
实验名称:TCP 连接管理
目录 前言 TCP报文段格式 TCP建立连接 TCP释放连接 实验目的 实验原理 实验步骤 1. 启动WireShark,设置抓包状态 2. 访问指定服务器 ,通过Wireshark抓取通信数据报文 3. 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录 实验…...
go语言map底层及扩容机制原理详解(上)
底层数据结构-哈希表 go语言map的底层数据结构是哈希表:通过哈希表来存储键值对,通过hash函数把键值对散列到一个个桶(bucket)中。 什么是哈希表? 在顺序结构以及平衡树中,元素与其的存储位置之间没有对应关系,因此…...
互联网职场说 | “领导找我谈话,原来是给我涨薪,但却只涨了200,还偷偷叮嘱我保密,这次只给我涨了薪”
职场中,一般当领导找你谈话时,心里总是会涌起两种心理活动:问责和表扬。不过很多人第一反应就是有点担心害怕,其次才会想有什么好事临到我了! 一位职场网友分享说,有天领导忽然找她谈话,当时心…...
Android 如何启用user版本的adb源码分析
Android调试桥(ADB, Android Debug Bridge)是一个Android命令行工具,包含在SDK 平台工具包中,adb可以用于连接Android设备,或者模拟器,实现对设备的控制,比如安装和调试应用。和Appium一样,adb也是基于C/S架…...
linux phpstudy 重启命令
[rootLinuxWeb phpstudy]# ./system/phpstudyctl restart 查看命令 1) phpstudy -start 启动小皮面板 2) phpstudy -stop 停止小皮面板 3) phpstudy -restart 重启小皮面板 4) phpstudy -status 查询面板状态 5) phpstudy -in…...
台式电脑屏幕亮度怎么调节?让你的眼睛更舒适!
在日常使用台式电脑时,调节屏幕亮度是一项常见的需求。不同的环境和个人偏好可能需要不同的亮度设置。因此,了解台式电脑屏幕亮度怎么调节是非常重要的。本文将介绍三种常见的方法,帮助您轻松调节台式电脑屏幕亮度,以满足您的需求…...
打造安全的 Linux 环境:实用配置指南
唠唠闲话 一开始接触服务器,我只是把它当博客的托管网站,源文件用 GitHub 备份,所以网站被黑了也没啥关系。但随着使用深入,网站逐渐加入我的日常工作流中,而且有了使用更多服务的需求。在这种情况下,服务…...
神经网络有哪些算法
神经网络算法是人工智能领域的重要组成部分,它通过模拟人类神经系统的结构和功能,实现对复杂问题的处理和分析。以下是对神经网络算法的详细概述,包括常见的算法和它们的特点、应用等,力求达到约2500字的篇幅。 一、神经网络算法概述 神经网络算法是一种基于人工神经元的…...
计算机网络期末试题
第一章 概述 一. 单选题(共13题,36.4分) 1. (单选题) 因特网起源于( )网络。 A. ARPANETB. EthernetC. CATVD. CERNET 我的答案: A:ARPANET;正确答案: A:ARPANET; 2.8分 2. (单选题)人们把( )年作为因特网的诞…...
Unity学习笔记---图层
渲染层级 1,调整Sprite Renderer中的Order in Layer可以调整图层层级。 2,在Edit--Project Setting--Graphics中,调整TransParency Sort Mode为Custom Axis, 并将TransParency Sort Axis中的Z值默认的1改为0,将Y改为…...
【简单探索微软Edge】
🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...
YOLOv5独家改进:backbone改进 | 微软新作StarNet:超强轻量级Backbone | CVPR 2024
💡💡💡创新点:star operation(元素乘法)在无需加宽网络下,将输入映射到高维非线性特征空间的能力,这就是StarNet的核心创新,在紧凑的网络结构和较低的能耗下展示了令人印象深刻的性能和低延迟 💡💡💡如何跟YOLOv5结合:替代YOLOv5的backbone 收录 YOL…...
概率密度函数pdf的某种解释与洞察
1.一个想法实验 我在想一个数,姑且称之为X,介于0和10之间(含0和10)。如果我不告诉你别的,你会想象X = 0的概率是多少?X = 4?假设我对任何特定的数字都没有偏好,你会想象十一个整数0,1,2,.….,10也是一样。因为所有的概率加起来必须是1,所以逻辑上的结论是给11个选项…...
Nginx慢速HTTP攻击防护:超时配置与内核级加固实战
1. 这不是误报:当Nginx日志里反复出现“client timed out”时,你面对的已是真实攻击面“检测到目标主机可能存在缓慢的HTTP拒绝服务攻击”——这条告警在安全扫描报告里出现时,很多运维同学第一反应是:又一个误报。毕竟Nginx跑得稳…...
Speechless:3分钟完成微博PDF备份的终极解决方案
Speechless:3分钟完成微博PDF备份的终极解决方案 【免费下载链接】Speechless 把新浪微博的内容,导出成 PDF 文件进行备份的 Chrome Extension。 项目地址: https://gitcode.com/gh_mirrors/sp/Speechless 你是否曾担心珍贵的微博记忆会突然消失&…...
如何用Python快速接入Taotoken并调用多模型API完成数据清洗任务
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 如何用Python快速接入Taotoken并调用多模型API完成数据清洗任务 对于需要处理客户数据的开发者而言,数据清洗与结构化是…...
如何免费使用ColabFold进行蛋白质结构预测:面向新手的终极指南
如何免费使用ColabFold进行蛋白质结构预测:面向新手的终极指南 【免费下载链接】ColabFold Making Protein folding accessible to all! 项目地址: https://gitcode.com/gh_mirrors/co/ColabFold ColabFold蛋白质结构预测是生物信息学领域的一项革命性技术&a…...
AI模型受限发布机制解析:Gated Release原理与实践
我不能按照您的要求生成关于“TAI #200: Anthropic’s Mythos Capability Step Change and Gated Release”的博文内容。 原因如下: 该标题中出现的 “TAI” (通常指 The AI Index 或 Technical AI Safety 相关报告编号)、 “Anthro…...
AI-Shoujo HF Patch完整安装教程:3步解锁游戏全部潜力
AI-Shoujo HF Patch完整安装教程:3步解锁游戏全部潜力 【免费下载链接】AI-HF_Patch Automatically translate, uncensor and update AI-Shoujo! 项目地址: https://gitcode.com/gh_mirrors/ai/AI-HF_Patch AI-Shoujo HF Patch是AI-Shoujo游戏玩家的必备增强…...
拯救者工具箱:如何用开源工具完全掌控你的联想游戏本性能
拯救者工具箱:如何用开源工具完全掌控你的联想游戏本性能 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit 你是否…...
手机上还有免费编辑pdf文本的软件?!
说的就是这款软件:pdfgear 适合哪些朋友:平板电脑、手机轻度办公用户。 这款软件算是为数不多良心软件了。 支持常见的pdf批注:高亮、删除线、下划线等。 主要还有一个很好的功能就是文字编辑功能:不需要切换word就能直接对pdf进行…...
3分钟掌握视频硬字幕提取:本地化OCR工具快速生成SRT字幕
3分钟掌握视频硬字幕提取:本地化OCR工具快速生成SRT字幕 【免费下载链接】video-subtitle-extractor 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内…...
完全自由操作系统的构建秘密:从可验证构建到信任链转移
1. 项目概述:探寻“完全自由”操作系统的内核秘密最近在技术社区里,一个话题反复被提起:“一套完全自由的操作系统都有这个秘密”。这听起来像是一个谜语,又像是一个宣言。作为一个在系统软件领域摸爬滚打了十几年的老手ÿ…...
