当前位置: 首页 > news >正文

OpenAI的GPT已达极限,更看好AI Agent

日前,比尔盖茨发表文章表示:AI Agent不仅会改变人与电脑的互动方式,或许还将颠覆软件行业,引领自输入命令到点击图标以来的最大计算机革命。

在数字化和技术创新的浪潮中,AI Agent作为一种前沿技术,正开启广泛的应用前景和无限的机遇。这些机遇不仅表现在提升工作效率和业务自动化上,也体现在为用户提供个性化服务和改善客户体验方面。

随着生成式AI技术的不断发展和成熟,AI Agent在推动新产品和服务的创新、探索新的商业模式方面发挥着越来越重要的作用。

如果你对这篇文章感兴趣,而且你想要了解更多关于AI领域的实战技巧,可以关注「神州问学」公众号。在这里,你可以看到最新最热的AIGC领域的干货文章和前沿资讯。

智能体技术相关发展


自2023年3月16日起,微软发布了Microsoft 365 Copilot,这一事件在业界引起了巨大反响,标志着基于大型语言模型(LLM)的应用开发范式的兴起,成为了当今行业共识的Agent理念的一个里程碑。 

值得注意的是,Agent的概念早在此前就已经存在,最早可追溯至20世纪50年代。1995年,Wooldridge和Jennings将AI Agent定义为一种计算机系统,该系统处于特定环境中,能够独立行动以实现其设计目标,并提出了AI Agent应具备自主性、反应性、社会能力和主动性四大属性。 

2010年以后,大模型开始初现雏形。2016年AlphaGo在围棋比赛中击败世界冠军,2018年谷歌推出了基于Transformer模型的BERT,2019年AlphaStar在电子竞技游戏《星际争霸2》中达到宗师级别并超越全球99.8%的玩家。紧接着,2022年ChatGPT-3及3.5的发布,以及随后ChatGPT的火爆流行,为AI Agent在大模型时代的发展提供了新的机遇。

大语言模型在智能体应用中的发展前景引人关注。随着AI技术的飞速进步,LLM不仅在理解和生成自然语言方面表现出色,而且在作为智能代理参与决策支持、自动化任务处理和个性化服务方面展现了巨大潜力。这些发展不仅推动了人机交互的边界,还为各行各业提供了创新解决方案,开辟了新的商业机会和研究方向。

2023年,大模型的发展呈现出爆炸式增长。自1月以来,全球范围内推出了众多LLM,包括LLaMA, BLOOM, StableLM, ChatGLM等众多开源大模型。借助这些模型,诸如AutoGPT, MetaGPT等多种自主智能体得以诞生。

2023年6月,OpenAI Safety团队负责人Lilian Weng发表了题为《LLM Powered Autonomous Agents》的文章,提出了一个新的Agent定义:大模型+记忆+规划技能+工具使用。11月6日,OpenAI在DevDay活动中发布了官方Agent开发框架Assistant API,旨在帮助开发者更高效便捷地基于GPT模型开发Agent。 

图片

数据来源:神州数码《生成式AI企业应用落地技术白皮书》

从创业角度看,Agent的开发大致分为两类:一种是提供可重复使用的Agent框架,降低未来开发的复杂性,着重于模块化、适配性和协作能力的优化创新;另一种则是深入垂直领域,成为领域专家,利用行业特定数据和流程提供更精准有效的服务。 

目前,Agent的开发进展在国际上主要集中在美国,因其拥有成熟的技术基础设施和充足的高端芯片资源,以OpenAI为代表的企业处于技术领先地位。相比之下,欧盟、英国、加拿大和日本等其他国家的大模型应用仍处于试验阶段。

在国内,一些科技公司已经产出了数个知名大模型,因此孕育而生的Agent智能体应用也开始逐渐进入大众视野。例如百度将文心大模型应用到智能搜索,自动驾驶;阿里将通义千问模型应用到高德地图,优酷,盒马等产品。华为将其盘古模型应用到智能气象,语音识别等。一家叫面壁智能的创业也公司推出了他们的AI Agent产品ChatDev,可以在短时间内完成一个软件或者一个小游戏的开发,所需要做的,只是提供给它一个要求。

图片

AI Agent应用


对于企业来说,成功的Agent产品的核心在于提高工作效率,这不仅意味着提升工作质量,还包括节省时间成本。分析市面上现有的Agent类产品,我们发现它们在企业环境中的适用场景主要包括:

  1. 简化日常工作流程:企业部门间的对接常常涉及大量文档制作,虽然这不需要复杂技术支持,但却耗费大量时间。如果引入对话式Agent来理解部门需求并自动生成相应文档,就能极大地减轻团队的负担,使他们能更专注于核心工作。

  2. 数据库访问优化:企业可以利用大型模型的文本解读能力,整合和提取数据中的关键信息。这样,企业无需手动整合碎片化信息,极大提升数据调用的效率。

  3. 编程辅助:Agent可以帮助程序员快速完成框架搭建和基础功能模板的编写,从而使程序员可以直接进入更细节的编程工作,显著减少编程工作量。

对于普通消费者而言,Agent的发展带来了更多的便利,类似于苹果的Siri和微软的Cortana。这些工具可以根据用户的需求独立搜索和调用各种信息和应用程序。虽然目前这些Agent主要处理较简单的任务,但在大型语言模型的支持下,它们未来将拥有更强大的能力,解决日常生活中的各种问题,成为每个人量身定制的私人助理。

图片

AI Agent挑战


在当前阶段,Agent的开发仍面临着众多挑战。尽管大型语言模型在对话方面的表现令人印象深刻,但将它们应用于具体的工作任务时,人们常常感觉它们像“人工智障”。这表明,要使大型模型商业化,关键在于理解并准确处理业务需求。 

在ToB业务中,AI Agent的应用受到API质量和生态系统不足的影响,尤其是在中国市场。API的匮乏和低质量导致实际应用效果与预期有显著差距。此外,试图用单一模型解决所有领域问题在理解深度上往往不足。 

AI Agent的落地效果也受限于应用场景的封闭程度。在封闭场景(如出行预订)中,得益于丰富的API和可穷举的问题,AI Agent表现出色。而在开放场景(如法律助手)中,由于新知识的频繁出现和API的不完善,实际应用面临更多挑战。理想的应用场景应选择那些拥有丰富的垂直领域数据、封闭且问题可穷举的环境。 

在训练方面,主要问题之一是高质量数据的缺乏。大型模型的训练数据主要来自网络文本,但在商业领域,许多案例数据不会完全公开。成功案例成为企业的商业机密,而失败案例也很少被企业分享。甚至许多行业经验还未被记录为文本。此外,为了更好地适应企业运作,训练模型需要大量关于流程的信息,而这些信息中含有的众多标准在不同行业中又有所不同,这使得模型训练变得更加困难。 

因此,针对特定领域的垂直行业模型的建立迫在眉睫。在法律、医疗、金融等专业性高、数据庞大的领域,建立这些行业模型是AI落地的关键。能够构建并掌握这些垂直行业模型的公司将获得强大的竞争优势。

人工智能信任、风险和安全管理(TRiSM)面临着一系列挑战。其中之一是Agent可能会接触到敏感信息和关键基础设施,因此需要有效的保护措施。同时,为了确保决策过程的透明度和可解释性,采用明确的决策制定流程变得尤为重要。此外,缺乏人类监督可能会降低减轻或纠正人工智能错误的能力。这是因为没有人类参与的情况下,AI系统的决策可能无法得到及时的校正或监控。

另一方面,关于人工智能的监管政策也成为了热门话题。特别是关于代理权的问题,早期的监管提案倾向于对自主行为者实施严格的规定和责任。这种监管环境的变化可能会对AI的发展和应用产生重大影响。同时,组织内部对于Agent的抵制也不容忽视,这主要源于员工对被AI替代的恐惧。

AI Agent的发展演化


Multi-Agent领域正向多Agent合作的框架发展。大模型能够从多角度讨论问题,如果为每个Agent定义不同身份,如经理、程序员、测试员等,可以更有效挖掘专业内容。这种多Agent结合能使大模型进行更深层次的计算和思考,更好地解决复杂任务。同时,使用不同大模型担任团队中的不同角色,可以集合各种优势。

图片

多模态方面,大模型正向理解非文字形式发展。这能力主要包括解析视觉信息,通常需大量文字描述。具备多模态处理能力的Agent可以增强对环境的感知,对自动驾驶、机器人等与现实世界互动的应用至关重要。但目前,非文字模态的编码器能力和规模还远不及语言模型。未来,可能出现一开始就结合多种模态语料训练的多模态大模型,或者等视觉模态编码器的能力提升,与大语言模型并驾齐驱时,结合使用将带来突破性发展。

图片

未来Agent或许还将实现如何大模型般的自我进化功能,如果人类可以自我进化出相应的分工体系,或许Agent也能自我设计出更加适合Agent协作的组织架构以便更好的完成复杂任务。

结语


从长远来看,AI Agent将会形成更深层次的智能连接,但目前AI Agent的技术尚未成熟,还需要一定的时间发展,不过Agent时代若是已经正在赶来,那么在接下来的几年里,它将彻底改变我们的生活方式,让我们一同期待。

相关文章:

OpenAI的GPT已达极限,更看好AI Agent

日前,比尔盖茨发表文章表示:AI Agent不仅会改变人与电脑的互动方式,或许还将颠覆软件行业,引领自输入命令到点击图标以来的最大计算机革命。 在数字化和技术创新的浪潮中,AI Agent作为一种前沿技术,正开启…...

【C/C++】详解 assert() 断言(什么是assert? assert有什么作用?)

目录 一、前言 二、什么是 assert ? 三、assert 的用法 四、assert 案例解析 五、assert 断言的使用原则 六、共勉 一、前言 在编写程序过程中,尤其是调试代码时,往往需要一个提醒代码漏洞/Bug的小助手,以便于程序员及时修改和完善代码…...

[C++]20:unorderedset和unorderedmap结构和封装。

unorderedset和unorderedmap结构和封装 一.哈希表&#xff1a;1.直接定址法&#xff1a;2.闭散列的开放定址法&#xff1a;1.基本结构&#xff1a;2.insert3.find4.erase5.补充&#xff1a;6.pair<k,v> k的数据类型&#xff1a; 3.开散列的拉链法/哈希桶&#xff1a;1.基…...

ARM 汇编指令:(六) B 跳转指令

目录 一.B 和 BL 1.B/BL指令的语法格式 2.示例解析 一.B 和 BL 跳转指令 B 使程序跳转到指定的地址执行程序。指令 BL 将下一条指令的地址复制到 R14&#xff08;即返回地址连接寄存器 LR&#xff09;寄存器中&#xff0c;然后跳转到指定地址运行程序。 1.B/B…...

​​SQLiteC/C++接口详细介绍之sqlite3类(十一)

返回目录&#xff1a;SQLite—免费开源数据库系列文章目录 上一篇&#xff1a;​​SQLiteC/C接口详细介绍之sqlite3类&#xff08;十&#xff09; 下一篇&#xff1a;​​SQLiteC/C接口详细介绍之sqlite3类&#xff08;十二&#xff09;&#xff08;未发表&#xff09; 33.sq…...

百度智能云+SpringBoot=AI对话【人工智能】

百度智能云SpringBootAI对话【人工智能】 前言版权推荐百度智能云SpringBootAI对话【人工智能】效果演示登录AI对话 项目结构后端开发pom和propertiessql_table和entitydao和mapperservice和implconfig和utilLoginController和ChatController 前端开发css和jslogin.html和chat.…...

第二十七节 Java 多态

本章主要为大家介绍java多态的概念&#xff0c;以及便于理解的多态简单例子。 Java 多态 多态是同一个行为具有多个不同表现形式或形态的能力。 多态性是对象多种表现形式的体现。 比如我们说"宠物"这个对象&#xff0c;它就有很多不同的表达或实现&#xff0c;比…...

基于Springboot的员工健康管理系统(有报告)。Javaee项目,springboot项目。

演示视频&#xff1a; 基于Springboot的员工健康管理系统&#xff08;有报告&#xff09;。Javaee项目&#xff0c;springboot项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构…...

[论文精读]Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection

论文网址&#xff1a;[2304.08876] 用于定向微小目标检测的动态粗到细学习 (arxiv.org) 论文代码&#xff1a;https://github.com/ChaselTsui/mmrotate-dcfl 英文是纯手打的&#xff01;论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误&…...

Selenium WebDriver 中用于查找网页元素的两个方法

这里提供了 Selenium WebDriver 中用于查找元素的两个方法&#xff1a;find_element() 和 find_elements()。 find_element(byid, value: Optional[str] None) → selenium.webdriver.remote.webelement.WebElement 这个方法用于查找满足指定定位策略&#xff08;By strategy&…...

python 常用装饰器

文章目录 property的介绍与使用作用使用场景装饰方法防止属性被修改 实现setter和getter的行为 staticmethod 与 classmethod作用代码示例 两者区别使用区别代码演示 abstractmethod参考资料 property的介绍与使用 python的property是python的一种装饰器&#xff0c;是用来修饰…...

深入解析MySQL日志系统:Binlog、Undo Log和Redo Log

在数据库系统中&#xff0c;日志文件扮演着至关重要的角色&#xff0c;它们不仅保证了数据的完整性和一致性&#xff0c;还支持了数据的恢复、复制和审计等功能。MySQL数据库中最核心的日志系统包括二进制日志&#xff08;Binlog&#xff09;、回滚日志&#xff08;Undo Log&am…...

强森算法求两点最短路径的基本流程及代码实现

对于强森算法,给定的一个图中,算法首先会构造一个新的节点s,然后从新构造的这个节点引出多条边分别连通图中的每一个节点,这些边的长度一开始是被设置为0的,然后使用贝尔曼-福德算法进行计算,算出从s到图中每一个节点的最短路径。 而在运行贝尔曼-福德算法的过程中如果发…...

数据结构入门篇 之 【双链表】的实现讲解(附完整实现代码及顺序表与线性表的优缺点对比)

一日读书一日功&#xff0c;一日不读十日空 书中自有颜如玉&#xff0c;书中自有黄金屋 一、双链表 1、双链表的结构 2、双链表的实现 1&#xff09;、双向链表中节点的结构定义 2&#xff09;、初始化函数 LTInit 3&#xff09;、尾插函数 LTPushBack 4&#xff09;、头…...

什么是零日攻击?

一、零日攻击的概念 零日攻击是指利用零日漏洞对系统或软件应用发动的网络攻击。 零日漏洞也称零时差漏洞&#xff0c;通常是指还没有补丁的安全漏洞。由于零日漏洞的严重级别通常较高&#xff0c;所以零日攻击往往也具有很大的破坏性。 目前&#xff0c;任何安全产品或解决方案…...

阿里云2025届春招实习生招聘

投递时间&#xff1a;2024年2月1日-2026年3月1日 岗位职责 负责大型客户“上云”&#xff0c;"用云"技术平台开发。 开发云迁移运维技术工具&#xff0c;帮助阿里云服务团队&&企业客户和服务商自主、高效的完成云迁移。 开发云运维技术工具&#xff0c;帮助…...

简单了解多线程

并发和并行 并发&#xff1a; 在同一时刻&#xff0c;多个指令在单一CPU上交替指向 并行&#xff1a;在同一时刻&#xff0c;多个指令在多个CPU上同时执行 2核4线程&#xff0c;4核8线程&#xff0c;8核16线程&#xff0c;16核32线程 基础实现线程的方式 Thread :继承类 &…...

GEE对上传并读取CSV文件

首先在Assets中上传csv csv格式如下所示&#xff1a; 上传好了之后&#xff0c;来看看这个表能否显示 var table ee.FeatureCollection("projects/a-flyllf0313/assets/dachang_2022"); var sortedTable table.sort(id); // 替换 propertyName 为你想要排序的属性…...

vulnhub-----SickOS靶机

文章目录 1.信息收集2.curl命令反弹shell提权利用POC 1.信息收集 ┌──(root㉿kali)-[~/kali/vulnhub/sockos] └─# arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:10:3c:9b, IPv4: 10.10.10.10 Starting arp-scan 1.9.8 with 256…...

slab分配器

什么是slab分配器&#xff1f; 用户态程序可以使用malloc及其在C标准库中的相关函数申请内存&#xff1b;内核也需要经常分配内存&#xff0c;但无法使用标准库函数&#xff1b;linux内核中&#xff0c;伙伴分配器是一种页分配器&#xff0c;是以页为单位的&#xff0c;但这个…...

智慧医疗能源事业线深度画像分析(上)

引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

ES6从入门到精通:前言

ES6简介 ES6&#xff08;ECMAScript 2015&#xff09;是JavaScript语言的重大更新&#xff0c;引入了许多新特性&#xff0c;包括语法糖、新数据类型、模块化支持等&#xff0c;显著提升了开发效率和代码可维护性。 核心知识点概览 变量声明 let 和 const 取代 var&#xf…...

Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以?

Golang 面试经典题&#xff1a;map 的 key 可以是什么类型&#xff1f;哪些不可以&#xff1f; 在 Golang 的面试中&#xff0c;map 类型的使用是一个常见的考点&#xff0c;其中对 key 类型的合法性 是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

黑马Mybatis

Mybatis 表现层&#xff1a;页面展示 业务层&#xff1a;逻辑处理 持久层&#xff1a;持久数据化保存 在这里插入图片描述 Mybatis快速入门 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6501c2109c4442118ceb6014725e48e4.png //logback.xml <?xml ver…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出&#xff1a;JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中&#xff0c;随机数的生成看似简单&#xff0c;却隐藏着许多玄机。无论是生成密码、加密密钥&#xff0c;还是创建安全令牌&#xff0c;随机数的质量直接关系到系统的安全性。Jav…...

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架&#xff0c;支持"一次开发&#xff0c;多端部署"&#xff0c;可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务&#xff0c;为旅游应用带来&#xf…...

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式&#xff1a;dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一&#xff0c;腐蚀跟膨胀属于反向操作&#xff0c;膨胀是把图像图像变大&#xff0c;而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...

Xen Server服务器释放磁盘空间

disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南&#xff1a;从入门到实战 一、Grunt 是什么&#xff1f; Grunt是一个基于 Node.js 的前端自动化任务运行器&#xff0c;主要用于自动化执行项目开发中重复性高的任务&#xff0c;例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换

目录 关键点 技术实现1 技术实现2 摘要&#xff1a; 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式&#xff08;自动驾驶、人工驾驶、远程驾驶、主动安全&#xff09;&#xff0c;并通过实时消息推送更新车…...