OpenAI的GPT已达极限,更看好AI Agent
日前,比尔盖茨发表文章表示:AI Agent不仅会改变人与电脑的互动方式,或许还将颠覆软件行业,引领自输入命令到点击图标以来的最大计算机革命。
在数字化和技术创新的浪潮中,AI Agent作为一种前沿技术,正开启广泛的应用前景和无限的机遇。这些机遇不仅表现在提升工作效率和业务自动化上,也体现在为用户提供个性化服务和改善客户体验方面。
随着生成式AI技术的不断发展和成熟,AI Agent在推动新产品和服务的创新、探索新的商业模式方面发挥着越来越重要的作用。
如果你对这篇文章感兴趣,而且你想要了解更多关于AI领域的实战技巧,可以关注「神州问学」公众号。在这里,你可以看到最新最热的AIGC领域的干货文章和前沿资讯。
智能体技术相关发展
自2023年3月16日起,微软发布了Microsoft 365 Copilot,这一事件在业界引起了巨大反响,标志着基于大型语言模型(LLM)的应用开发范式的兴起,成为了当今行业共识的Agent理念的一个里程碑。
值得注意的是,Agent的概念早在此前就已经存在,最早可追溯至20世纪50年代。1995年,Wooldridge和Jennings将AI Agent定义为一种计算机系统,该系统处于特定环境中,能够独立行动以实现其设计目标,并提出了AI Agent应具备自主性、反应性、社会能力和主动性四大属性。
2010年以后,大模型开始初现雏形。2016年AlphaGo在围棋比赛中击败世界冠军,2018年谷歌推出了基于Transformer模型的BERT,2019年AlphaStar在电子竞技游戏《星际争霸2》中达到宗师级别并超越全球99.8%的玩家。紧接着,2022年ChatGPT-3及3.5的发布,以及随后ChatGPT的火爆流行,为AI Agent在大模型时代的发展提供了新的机遇。
大语言模型在智能体应用中的发展前景引人关注。随着AI技术的飞速进步,LLM不仅在理解和生成自然语言方面表现出色,而且在作为智能代理参与决策支持、自动化任务处理和个性化服务方面展现了巨大潜力。这些发展不仅推动了人机交互的边界,还为各行各业提供了创新解决方案,开辟了新的商业机会和研究方向。
2023年,大模型的发展呈现出爆炸式增长。自1月以来,全球范围内推出了众多LLM,包括LLaMA, BLOOM, StableLM, ChatGLM等众多开源大模型。借助这些模型,诸如AutoGPT, MetaGPT等多种自主智能体得以诞生。
2023年6月,OpenAI Safety团队负责人Lilian Weng发表了题为《LLM Powered Autonomous Agents》的文章,提出了一个新的Agent定义:大模型+记忆+规划技能+工具使用。11月6日,OpenAI在DevDay活动中发布了官方Agent开发框架Assistant API,旨在帮助开发者更高效便捷地基于GPT模型开发Agent。
数据来源:神州数码《生成式AI企业应用落地技术白皮书》
从创业角度看,Agent的开发大致分为两类:一种是提供可重复使用的Agent框架,降低未来开发的复杂性,着重于模块化、适配性和协作能力的优化创新;另一种则是深入垂直领域,成为领域专家,利用行业特定数据和流程提供更精准有效的服务。
目前,Agent的开发进展在国际上主要集中在美国,因其拥有成熟的技术基础设施和充足的高端芯片资源,以OpenAI为代表的企业处于技术领先地位。相比之下,欧盟、英国、加拿大和日本等其他国家的大模型应用仍处于试验阶段。
在国内,一些科技公司已经产出了数个知名大模型,因此孕育而生的Agent智能体应用也开始逐渐进入大众视野。例如百度将文心大模型应用到智能搜索,自动驾驶;阿里将通义千问模型应用到高德地图,优酷,盒马等产品。华为将其盘古模型应用到智能气象,语音识别等。一家叫面壁智能的创业也公司推出了他们的AI Agent产品ChatDev,可以在短时间内完成一个软件或者一个小游戏的开发,所需要做的,只是提供给它一个要求。
AI Agent应用
对于企业来说,成功的Agent产品的核心在于提高工作效率,这不仅意味着提升工作质量,还包括节省时间成本。分析市面上现有的Agent类产品,我们发现它们在企业环境中的适用场景主要包括:
-
简化日常工作流程:企业部门间的对接常常涉及大量文档制作,虽然这不需要复杂技术支持,但却耗费大量时间。如果引入对话式Agent来理解部门需求并自动生成相应文档,就能极大地减轻团队的负担,使他们能更专注于核心工作。
-
数据库访问优化:企业可以利用大型模型的文本解读能力,整合和提取数据中的关键信息。这样,企业无需手动整合碎片化信息,极大提升数据调用的效率。
-
编程辅助:Agent可以帮助程序员快速完成框架搭建和基础功能模板的编写,从而使程序员可以直接进入更细节的编程工作,显著减少编程工作量。
对于普通消费者而言,Agent的发展带来了更多的便利,类似于苹果的Siri和微软的Cortana。这些工具可以根据用户的需求独立搜索和调用各种信息和应用程序。虽然目前这些Agent主要处理较简单的任务,但在大型语言模型的支持下,它们未来将拥有更强大的能力,解决日常生活中的各种问题,成为每个人量身定制的私人助理。
AI Agent挑战
在当前阶段,Agent的开发仍面临着众多挑战。尽管大型语言模型在对话方面的表现令人印象深刻,但将它们应用于具体的工作任务时,人们常常感觉它们像“人工智障”。这表明,要使大型模型商业化,关键在于理解并准确处理业务需求。
在ToB业务中,AI Agent的应用受到API质量和生态系统不足的影响,尤其是在中国市场。API的匮乏和低质量导致实际应用效果与预期有显著差距。此外,试图用单一模型解决所有领域问题在理解深度上往往不足。
AI Agent的落地效果也受限于应用场景的封闭程度。在封闭场景(如出行预订)中,得益于丰富的API和可穷举的问题,AI Agent表现出色。而在开放场景(如法律助手)中,由于新知识的频繁出现和API的不完善,实际应用面临更多挑战。理想的应用场景应选择那些拥有丰富的垂直领域数据、封闭且问题可穷举的环境。
在训练方面,主要问题之一是高质量数据的缺乏。大型模型的训练数据主要来自网络文本,但在商业领域,许多案例数据不会完全公开。成功案例成为企业的商业机密,而失败案例也很少被企业分享。甚至许多行业经验还未被记录为文本。此外,为了更好地适应企业运作,训练模型需要大量关于流程的信息,而这些信息中含有的众多标准在不同行业中又有所不同,这使得模型训练变得更加困难。
因此,针对特定领域的垂直行业模型的建立迫在眉睫。在法律、医疗、金融等专业性高、数据庞大的领域,建立这些行业模型是AI落地的关键。能够构建并掌握这些垂直行业模型的公司将获得强大的竞争优势。
人工智能信任、风险和安全管理(TRiSM)面临着一系列挑战。其中之一是Agent可能会接触到敏感信息和关键基础设施,因此需要有效的保护措施。同时,为了确保决策过程的透明度和可解释性,采用明确的决策制定流程变得尤为重要。此外,缺乏人类监督可能会降低减轻或纠正人工智能错误的能力。这是因为没有人类参与的情况下,AI系统的决策可能无法得到及时的校正或监控。
另一方面,关于人工智能的监管政策也成为了热门话题。特别是关于代理权的问题,早期的监管提案倾向于对自主行为者实施严格的规定和责任。这种监管环境的变化可能会对AI的发展和应用产生重大影响。同时,组织内部对于Agent的抵制也不容忽视,这主要源于员工对被AI替代的恐惧。
AI Agent的发展演化
Multi-Agent领域正向多Agent合作的框架发展。大模型能够从多角度讨论问题,如果为每个Agent定义不同身份,如经理、程序员、测试员等,可以更有效挖掘专业内容。这种多Agent结合能使大模型进行更深层次的计算和思考,更好地解决复杂任务。同时,使用不同大模型担任团队中的不同角色,可以集合各种优势。
多模态方面,大模型正向理解非文字形式发展。这能力主要包括解析视觉信息,通常需大量文字描述。具备多模态处理能力的Agent可以增强对环境的感知,对自动驾驶、机器人等与现实世界互动的应用至关重要。但目前,非文字模态的编码器能力和规模还远不及语言模型。未来,可能出现一开始就结合多种模态语料训练的多模态大模型,或者等视觉模态编码器的能力提升,与大语言模型并驾齐驱时,结合使用将带来突破性发展。
未来Agent或许还将实现如何大模型般的自我进化功能,如果人类可以自我进化出相应的分工体系,或许Agent也能自我设计出更加适合Agent协作的组织架构以便更好的完成复杂任务。
结语
从长远来看,AI Agent将会形成更深层次的智能连接,但目前AI Agent的技术尚未成熟,还需要一定的时间发展,不过Agent时代若是已经正在赶来,那么在接下来的几年里,它将彻底改变我们的生活方式,让我们一同期待。
相关文章:

OpenAI的GPT已达极限,更看好AI Agent
日前,比尔盖茨发表文章表示:AI Agent不仅会改变人与电脑的互动方式,或许还将颠覆软件行业,引领自输入命令到点击图标以来的最大计算机革命。 在数字化和技术创新的浪潮中,AI Agent作为一种前沿技术,正开启…...

【C/C++】详解 assert() 断言(什么是assert? assert有什么作用?)
目录 一、前言 二、什么是 assert ? 三、assert 的用法 四、assert 案例解析 五、assert 断言的使用原则 六、共勉 一、前言 在编写程序过程中,尤其是调试代码时,往往需要一个提醒代码漏洞/Bug的小助手,以便于程序员及时修改和完善代码…...

[C++]20:unorderedset和unorderedmap结构和封装。
unorderedset和unorderedmap结构和封装 一.哈希表:1.直接定址法:2.闭散列的开放定址法:1.基本结构:2.insert3.find4.erase5.补充:6.pair<k,v> k的数据类型: 3.开散列的拉链法/哈希桶:1.基…...
ARM 汇编指令:(六) B 跳转指令
目录 一.B 和 BL 1.B/BL指令的语法格式 2.示例解析 一.B 和 BL 跳转指令 B 使程序跳转到指定的地址执行程序。指令 BL 将下一条指令的地址复制到 R14(即返回地址连接寄存器 LR)寄存器中,然后跳转到指定地址运行程序。 1.B/B…...

SQLiteC/C++接口详细介绍之sqlite3类(十一)
返回目录:SQLite—免费开源数据库系列文章目录 上一篇:SQLiteC/C接口详细介绍之sqlite3类(十) 下一篇:SQLiteC/C接口详细介绍之sqlite3类(十二)(未发表) 33.sq…...

百度智能云+SpringBoot=AI对话【人工智能】
百度智能云SpringBootAI对话【人工智能】 前言版权推荐百度智能云SpringBootAI对话【人工智能】效果演示登录AI对话 项目结构后端开发pom和propertiessql_table和entitydao和mapperservice和implconfig和utilLoginController和ChatController 前端开发css和jslogin.html和chat.…...
第二十七节 Java 多态
本章主要为大家介绍java多态的概念,以及便于理解的多态简单例子。 Java 多态 多态是同一个行为具有多个不同表现形式或形态的能力。 多态性是对象多种表现形式的体现。 比如我们说"宠物"这个对象,它就有很多不同的表达或实现,比…...

基于Springboot的员工健康管理系统(有报告)。Javaee项目,springboot项目。
演示视频: 基于Springboot的员工健康管理系统(有报告)。Javaee项目,springboot项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构…...

[论文精读]Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection
论文网址:[2304.08876] 用于定向微小目标检测的动态粗到细学习 (arxiv.org) 论文代码:https://github.com/ChaselTsui/mmrotate-dcfl 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误&…...
Selenium WebDriver 中用于查找网页元素的两个方法
这里提供了 Selenium WebDriver 中用于查找元素的两个方法:find_element() 和 find_elements()。 find_element(byid, value: Optional[str] None) → selenium.webdriver.remote.webelement.WebElement 这个方法用于查找满足指定定位策略(By strategy&…...
python 常用装饰器
文章目录 property的介绍与使用作用使用场景装饰方法防止属性被修改 实现setter和getter的行为 staticmethod 与 classmethod作用代码示例 两者区别使用区别代码演示 abstractmethod参考资料 property的介绍与使用 python的property是python的一种装饰器,是用来修饰…...
深入解析MySQL日志系统:Binlog、Undo Log和Redo Log
在数据库系统中,日志文件扮演着至关重要的角色,它们不仅保证了数据的完整性和一致性,还支持了数据的恢复、复制和审计等功能。MySQL数据库中最核心的日志系统包括二进制日志(Binlog)、回滚日志(Undo Log&am…...
强森算法求两点最短路径的基本流程及代码实现
对于强森算法,给定的一个图中,算法首先会构造一个新的节点s,然后从新构造的这个节点引出多条边分别连通图中的每一个节点,这些边的长度一开始是被设置为0的,然后使用贝尔曼-福德算法进行计算,算出从s到图中每一个节点的最短路径。 而在运行贝尔曼-福德算法的过程中如果发…...

数据结构入门篇 之 【双链表】的实现讲解(附完整实现代码及顺序表与线性表的优缺点对比)
一日读书一日功,一日不读十日空 书中自有颜如玉,书中自有黄金屋 一、双链表 1、双链表的结构 2、双链表的实现 1)、双向链表中节点的结构定义 2)、初始化函数 LTInit 3)、尾插函数 LTPushBack 4)、头…...

什么是零日攻击?
一、零日攻击的概念 零日攻击是指利用零日漏洞对系统或软件应用发动的网络攻击。 零日漏洞也称零时差漏洞,通常是指还没有补丁的安全漏洞。由于零日漏洞的严重级别通常较高,所以零日攻击往往也具有很大的破坏性。 目前,任何安全产品或解决方案…...
阿里云2025届春招实习生招聘
投递时间:2024年2月1日-2026年3月1日 岗位职责 负责大型客户“上云”,"用云"技术平台开发。 开发云迁移运维技术工具,帮助阿里云服务团队&&企业客户和服务商自主、高效的完成云迁移。 开发云运维技术工具,帮助…...

简单了解多线程
并发和并行 并发: 在同一时刻,多个指令在单一CPU上交替指向 并行:在同一时刻,多个指令在多个CPU上同时执行 2核4线程,4核8线程,8核16线程,16核32线程 基础实现线程的方式 Thread :继承类 &…...

GEE对上传并读取CSV文件
首先在Assets中上传csv csv格式如下所示: 上传好了之后,来看看这个表能否显示 var table ee.FeatureCollection("projects/a-flyllf0313/assets/dachang_2022"); var sortedTable table.sort(id); // 替换 propertyName 为你想要排序的属性…...

vulnhub-----SickOS靶机
文章目录 1.信息收集2.curl命令反弹shell提权利用POC 1.信息收集 ┌──(root㉿kali)-[~/kali/vulnhub/sockos] └─# arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:10:3c:9b, IPv4: 10.10.10.10 Starting arp-scan 1.9.8 with 256…...

slab分配器
什么是slab分配器? 用户态程序可以使用malloc及其在C标准库中的相关函数申请内存;内核也需要经常分配内存,但无法使用标准库函数;linux内核中,伙伴分配器是一种页分配器,是以页为单位的,但这个…...

智慧医疗能源事业线深度画像分析(上)
引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...
ES6从入门到精通:前言
ES6简介 ES6(ECMAScript 2015)是JavaScript语言的重大更新,引入了许多新特性,包括语法糖、新数据类型、模块化支持等,显著提升了开发效率和代码可维护性。 核心知识点概览 变量声明 let 和 const 取代 var…...
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以?
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以? 在 Golang 的面试中,map 类型的使用是一个常见的考点,其中对 key 类型的合法性 是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

黑马Mybatis
Mybatis 表现层:页面展示 业务层:逻辑处理 持久层:持久数据化保存 在这里插入图片描述 Mybatis快速入门 ` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...
基于Uniapp开发HarmonyOS 5.0旅游应用技术实践
一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来…...

OPENCV形态学基础之二腐蚀
一.腐蚀的原理 (图1) 数学表达式:dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一,腐蚀跟膨胀属于反向操作,膨胀是把图像图像变大,而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...
Xen Server服务器释放磁盘空间
disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...
Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换
目录 关键点 技术实现1 技术实现2 摘要: 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式(自动驾驶、人工驾驶、远程驾驶、主动安全),并通过实时消息推送更新车…...