新火种AI|GPT-5前瞻!GPT-5将具备哪些新能力?
作者:小岩
编辑:彩云
Sam Altman在整个AI领域,乃至整个科技领域都被看作是极具影响力的存在,而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感,他甚至被《时代》杂志评为“2023年度CEO”。
也正因此, Sam Altman的一条推文,瞬间就可以成为轰动整个AI行业的信号,特别是当这条推文还与万众期待的“GPT-5”有关的时候。
2023年平安夜,Sam Altman在社交平台大胆公布了2024年的雄心壮志。他所发表的关键词不仅涵盖了2024年OpenAI的整体规划,更契合了用户的迫切需求。这其中包括:
AGI(请耐心等待)
GPT-5
更好的语音模式
更高的费率限制
更好的GPT
更好的推理
对工作/行为程度的控制
视频
个性化
更好的浏览
“使用OpenAi登录”
开放源代码
Sam Altman透露,OpenAI计划在接下来的一年内实现多个令人瞩目的里程碑。其中所涉及到的内容,不仅仅一次简单的技术更新,更是一场至关重要的AI变革。当然,最受关注的,还是GPT-5。
AI领域的开源与闭源之争:类似于Android与IOS之争。
对于AI界来说,大家除了关心 GPT-5能否在技术壁垒上有所突破,更关心一个重点:GPT-5能否实现开源?
大模型的开源和闭源之争一直是行业内争论的焦点,这种争论,与移动互联网时代的Android与IOS之争有异曲同工之妙。有意思的是,各个AI大厂对于开源还是闭源的选择也不尽相同。
目前拔得头筹的OpenAI的GPT-4和百度的文心一言都坚持闭源,Meta选择了开源的道路,相继面向“学术研究用途”开源了LLaMA和LLaMA-2模型。百川智能则兼具开源和闭源,在学术领域选择了开源,使用7B和13B两种尺寸的大模型;商业探索上将53B闭源,以保护商业利益和技术的竞争优势。
GPT的闭源,为OpenAI带来了可观的收入。据The Information报道,OpenAI CEO Sam Altman对员工表示,公司正以每年13亿美元(约合人民币94.93亿元)的速度产生收入,平均每月收入超过1亿美元,相较于去年全年2800万美元增长超过450倍,达4542%。这个数据也比3个月前预期的年收入高30 %。这也让2023年成为OpenAI公司成立8年来,收入增长最快的一年。而这些,恰恰是GPT-4闭源所带来的。
关键词:GPT-5能实现开源吗?
那么,GPT-5能实现开源吗?未必。
对于商业模式,OpenAI曾在官网中明确指出“打算继续免费提供ChatGPT”,但也会选择从付费的高级服务的用户和企业中获得收入。而且,虽然OpenAI嘴上说着“不指望在近期内盈利”,但考虑到开发和提供大模型的高成本,生存问题仍然是其不得不面对的挑战。
此外,尽管OpenAI实现了快速增长,但背后的行业成本却不容忽略。根据公开信息显示,2022 年,OpenAI开发GPT-4,仅训练成本支出约5.4亿美元。2023年4月,OpenAI每天为ChatGPT支付的运营成本约694.4万美元(其中主要是电费) ,年化运营成本约为2.5亿美元,综合年化成本可能超过13亿美元。毫无疑问,OpenAI依旧处于亏损阶段。
所以,倘若没有商业化的维持,OpenAI恐怕很快会迎来破产。更重要的是,已经通过GPT-4闭源尝到甜头,获得大量收入的OpenAI,显然没有充足的理由将GPT-5完全开源,这无异于自毁壁垒,在大模型赛道的竞逐中丧失领先优势。从这个层面来说。GPT-5实现开源的概率不大。
即便Sam Altman在推文中将“开源”标注成了关键词,但更多的也只是在迎合行业的呼声,我们还不能将其解读为“企业2024年的发展目标”。
不过,“部分开源”的可能性并非没有。GPT-5完全开源的可能性虽然比较小,但是为了GPT相关生态建设,对与GPT相关的工具集提供开源的可能性却很高。或许,OpenAI会通过为较少部分提供开源的方式,为开发者的开发,调试,分享提供便利。
未来的GPT-5,究竟会具备哪些新能力?
近日,艾伦人工智能研究所发布了Unified-IO 2,它的发布极具意义,因为它可以帮助我们更好的预判GPT-5的能力。
为什么这么说呢?Unified与ChatGPT之间存在着怎样的关系?
事实上,早在2022年6月,艾伦人工智能研究所就推出了第一代Unified-IO,它是首批能够处理图像和语言的多模态模型之一。大约在同一时间,OpenAI正在内部测试GPT-4,并在2023年3月正式发布。所以,Unified-IO可以看作是对于未来大规模AI模型的前瞻。换句话说,因为Unified-IO 2的出现,我们可以大致预判一点:OpenAI可能正在内部测试GPT-5,并很有可能在几个月后发布。
艾伦人工智能研究所推出的Unified-IO 2是第一个可以处理和生成文本,图像,音频,视频和动作序列的模型。这个新的高级人工智能模型使用几十亿个数据点进行训练,虽然模型大小只有7B,却展现出迄今为止最广泛的多模态能力。它的训练数据包括:10亿个图像-文本对,1 万亿个文本标记,1.8亿个视频剪辑,1.3亿张带文本的图像,300万个3D资产和100万个机器人代理运动序列。研究团队将总共120多个数据集组合成一个600 TB的包,涵盖220个视觉,语言,听觉和动作任务。Unified-IO 2采用编码器-解码器架构,并进行了一些更改,以稳定训练并有效利用多模态信号。
模型可以回答问题,根据指令撰写文本、以及分析文本内容;可以识别图像内容,提供图像描述,执行图像处理任务,并根据文本描述创建新图像;可以根据描述或说明生成音乐或声音,以及分析视频并回答有关视频的问题。此外,通过使用机器人数据进行训练,Unified-IO 2还可以为机器人系统生成动作,例如将指令转换为机器人的动作序列。由于多模态训练,它还可以处理不同的模态,例如,在图像上标记某个音轨使用的乐器等。
总体而言,Unified-IO 2在超过35个基准测试中表现良好,包括图像生成和理解,自然语言理解,视频和音频理解以及机器人操作。在大多数任务中,它能够比肩专用模型,甚至更胜一筹。在图像任务的GRIT基准测试中,Unified-IO 2获得了目前的最高分。通过这些,我们也可以更好的窥见未来GPT-5的模样。
对于AI发展而言,科技生态与商业化是缺一不可的核心要素。技术和应用的发展需要商业化提供必要的支持和保障;而商业化的成功也离不开生态环境的建设。两者之间必须相辅相成,有机结合。希望在未来发布的GPT-5中,OpenAI可以起到先导作用,率先实现生态与商业化之间的平衡。
相关文章:

新火种AI|GPT-5前瞻!GPT-5将具备哪些新能力?
作者:小岩 编辑:彩云 Sam Altman在整个AI领域,乃至整个科技领域都被看作是极具影响力的存在,而2023年OpenAI无限反转的宫斗事件更是让Sam Altman刷足了存在感,他甚至被《时代》杂志评为“2023年度CEO”。 也正因此&…...

安防视频监控系统EasyCVR设备分组中在线/离线数量统计的开发与实现
安防视频监控EasyCVR系统具备较强的兼容性,它可以支持国标GB28181、RTSP/Onvif、RTMP,以及厂家的私有协议与SDK,如:海康ehome、海康sdk、大华sdk、宇视sdk、华为sdk、萤石云sdk、乐橙sdk等。EasyCVR平台可覆盖多类型的设备接入&am…...

spring cloud之集成sentinel
写在前面 源码 。 本文一起看下spring cloud的sentinel组件的使用。 1:准备 1.1:理论 对于一个系统来说,最重要的就是高可用,那么如何实现高可用呢?你可能会说,集群部署不就可以了,但事实并…...
让车辆做到“耳听八方”,毫米波雷达芯片与系统设计
摘要: 毫米波雷达,是指工作在毫米波波段(一般为30~300GHz频域,波长1~10mm)探测的雷达。毫米波雷达体积小、质量轻、空间分辨率高,穿透“雾烟灰”的能力强,还具备全天候全天时工作的优势。在智能网联汽车体系中,毫米波雷达是系统感知层不可或缺的重要硬件,能让智能驾…...

Python如何实现数据驱动的接口自动化测试
大家在接口测试的过程中,很多时候会用到对CSV的读取操作,本文主要说明Python3对CSV的写入和读取。下面话不多说了,来一起看看详细的介绍吧。 1、需求 某API,GET方法,token,mobile,email三个参数 token为必填项mobil…...

高级分布式系统-第15讲 分布式机器学习--联邦学习
高级分布式系统汇总:高级分布式系统目录汇总-CSDN博客 联邦学习 两种常见的架构:客户-服务器架构和对等网络架构 联邦学习在传统的分布式机器学习基础上的变化。 传统的分布式机器学习:在数据中心或计算集群中使用并行训练,因为…...

小程序基础学习(事件处理)
原理:组件内部设置点击事件,然后冒泡到页面捕获点击事件 在组件内部设置点击事件 处理点击事件,并告诉页面 页面捕获点击事件 页面处理点击事件 组件代码 <!--components/my-info/my-info.wxml--> <view class"title"…...

网络协议与攻击模拟_01winshark工具简介
一、TCP/IP协议簇 网络接口层(没有特定的协议) 物理层:PPPOE宽带拨号(应用场景:宽带拨号,运营商切网过来没有固定IP就需要拨号,家庭带宽一般都采用的是拨号方式)数据链路层网络层…...

【linux学习笔记】网络
目录 【linux学习笔记】网络检查、监测网络ping-向网络主机发送特殊数据包traceroute-跟踪网络数据包的传输路径netstat-检查网络设置及相关统计数据 通过网络传输文件ftp 【linux学习笔记】网络 检查、监测网络 ping-向网络主机发送特殊数据包 最基本的网络连接命令就是pin…...
JUC-线程中断机制和LockSupport
线程中断机制 概念 java提供了一种用于停止线程的协商机制-中断。称为中断标识协商机制。 常用API public void interrupt() 仅仅让线程的中断标志位设置为true。不进行其他操作。public boolean isInterrupted() 获取中断标志位的状态。public static boolean interrupted…...

哈希表与哈希算法(Python系列30)
在讲哈希表数据结构和哈希算法之前,我想先刨析一下数组和python中的列表 首先来讲一下数组,我想在这提出一个疑问: 为什么数组通过索引查询数据的时间复杂度为O(1),也就是不管数组有多大,算法的执行时间都是不变的。…...

『 C++ 』AVL树详解 ( 万字 )
🦈STL容器类型 在STL的容器中,分为几种容器: 序列式容器(Sequence Containers): 这些容器以线性顺序存储元素,保留了元素的插入顺序。 支持随机访问,因此可以使用索引或迭代器快速访问任何位置的元素。 主要的序列式…...

Python下载安装pip方法与步骤_pip国内镜像
前提:下载安装好 python 打开命令提示符winR->cmd(不需要进入 python,直接在终端输入指令执行即可,也可以再 pycharm 终端执行命令)加入要安装ipython,需要执行以下命令: pip install **<…...

自动化测试框架pytest系列之基础概念介绍(一)
如果你要打算学习自动化测试 ,无论是web自动化、app自动化还是接口自动化 ,在学习的道路上,你几乎会遇到pytest这个测试框架,因为自动化编写没有测试框架,根本玩不了 。 如果你已经是一位自动化测试人员 ,…...

编码技巧:如何在Golang中高效解析和生成XML
编码技巧:如何在Golang中高效解析和生成XML 引言Golang中的XML基础解析XML文件生成XML文件错误处理和调试高级技巧和最佳实践总结 引言 在当今数据驱动的编程世界中,有效地处理各种数据格式是每个开发人员必备的技能之一。其中,XMLÿ…...
24校招,帆书测试开发工程师一面
前言 樊高读书是帆书的前身,我之前还看过他们的书,缘分闭环了 时间:25min 平台:飞书视频面试 过程 自我介绍为啥从后端转测试?通过实习经历,对测试有什么了解?讲一下游戏测试经历负责什么业…...
Java 方法以及在计算机内部的调用问题
修饰符 返回值类型 方法名( 形参列表 ){ 方法体代码(需要执行的功能代码) return 返回值; } 方法在内种没有先后顺序,但是不能把一个方法定义在另一个方法中。 方法的返回值类型写void(无返回申明)时,方法内不能使用return返回数…...

【算法与数据结构】343、LeetCode整数拆分
文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:博主做这道题的时候一直在思考,如何找到 k k k个正整数, k k k究竟为多少合适。…...

中级Python面试问题
文章目录 专栏导读1、xrange 和 range 函数有什么区别?2、什么是字典理解?举个例子3、元组理解吗?如果是,怎么做,如果不是,为什么?4、 列表和元组的区别?5、浅拷贝和深拷贝有什么区别…...

Lede(OpenWrt)安装和双宽带叠加
文章目录 一、Lede介绍1. 简介2. 相关网站 二、Lede安装1. 编译环境2. SHELL编译步骤3. 腾讯云自动化助手 三、Lede配置1. 电信接口配置2. 联通接口配置3. 多线多播配置4. 网速测试效果 一、Lede介绍 1. 简介 LEDE是一个专为路由器和嵌入式设备设计的自由和开源的操作系统。 …...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

stm32G473的flash模式是单bank还是双bank?
今天突然有人stm32G473的flash模式是单bank还是双bank?由于时间太久,我真忘记了。搜搜发现,还真有人和我一样。见下面的链接:https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...

【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...

Zustand 状态管理库:极简而强大的解决方案
Zustand 是一个轻量级、快速和可扩展的状态管理库,特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。 核心优势对比 基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

基于ASP.NET+ SQL Server实现(Web)医院信息管理系统
医院信息管理系统 1. 课程设计内容 在 visual studio 2017 平台上,开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的 综合运用 c#.net 知识,在 vs 2017 平台上,进行 ASP.NET 应用程序和简易网站的开发;初步熟悉开发一…...
macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用
文章目录 问题现象问题原因解决办法 问题现象 macOS启动台(Launchpad)多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显,都是Google家的办公全家桶。这些应用并不是通过独立安装的…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...

初学 pytest 记录
安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...
Python 包管理器 uv 介绍
Python 包管理器 uv 全面介绍 uv 是由 Astral(热门工具 Ruff 的开发者)推出的下一代高性能 Python 包管理器和构建工具,用 Rust 编写。它旨在解决传统工具(如 pip、virtualenv、pip-tools)的性能瓶颈,同时…...

面向无人机海岸带生态系统监测的语义分割基准数据集
描述:海岸带生态系统的监测是维护生态平衡和可持续发展的重要任务。语义分割技术在遥感影像中的应用为海岸带生态系统的精准监测提供了有效手段。然而,目前该领域仍面临一个挑战,即缺乏公开的专门面向海岸带生态系统的语义分割基准数据集。受…...