科技云报到:AI Agent打了个响指,商业齿轮加速转动
科技云报到原创。
3月16日,百度旗下文心大模型4.5和文心大模型X1正式发布。目前,两款模型已在文心一言官网上线,免费向用户开放。
同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。
无独有偶,OpenAI宣布GPT-4.5/5将很快陆续发布,且免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。不仅如此,字节跳动、阿里云等企业也纷纷下调旗下大模型产品价格。
降价和免费时代的来临无疑将加速AI技术的普及和应用落地,越来越多的企业和开发者开始尝试将AI技术应用到各个领域,从而催生出大量创新应用和商业模式,AI Agent(智能体)就是其中之一。
近日,AI智能体企业Manus AI表示,7天来,Manus使用申请等候名单增加到两百万人。3月12日,OpenAI正式发布了一系列全新的Agent(智能体)开发组件,旨在通过自动化工具和标准化接口降低开发门槛,显著缩短智能体应用的开发周期。
这一系列围绕智能体的技术发布,从侧面说明AI智能体目前已经达到了爆发的临界点。伴随各大科技公司在智能体领域不断加码,2025年有望成为真正的AI智能体商业爆发元年。
想象一下,未来只需简单一个指令,智能体便能领悟并执行复杂的任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。这不再是好莱坞科幻电影中的场景,而是正逐步走进现实的AI智能体时代。

早在2023年11月,微软创始人比尔·盖茨就发文表示,智能体不仅会改变每个人与计算机交互的方式,还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。OpenAI首席执行官山姆·奥特曼也曾在多个场合表示:构建庞大AI模型的时代已经结束,AI智能体才是未来的真正挑战。
类比智能电动汽车,犹如其在新能源技术应用和里程焦虑之间寻找到某种平衡的增程路线一样,AI智能体让人工智能进入了“增程模式”,在AI技术和行业应用之间尽可能达成新的平衡。
被看好的AI智能体
作为人工智能领域的一个重要概念,学术界和产业界对AI智能体提出了各种定义。大致来说,一个AI智能体应具备类似人类的思考和规划能力,并具备一定的技能以便与环境和人类进行交互,完成特定的任务。
或许把AI智能体类比成计算机环境中的数字人,我们会更好理解——数字人的大脑就是大语言模型或是人工智能算法,能够处理信息、在实时交互中做出决策;感知模块就相当于眼睛、耳朵等感官,用来获得文本、声音、图像等不同环境状态的信息;记忆和检索模块则像神经元,用来存储经验、辅助决策;行动执行模块则是四肢,用来执行大脑做出的决策。
长久以来,人类一直在追求更加“类人”甚至“超人”的人工智能,而智能体被认为是实现这一追求的有效手段。近些年,随着大数据和计算能力的提升,各种深度学习大模型得到了迅猛发展。这为开发新一代AI智能体提供了巨大支撑,并在实践中取得了较为显著的进展。
比如,谷歌DeepMind人工智能系统展示了用于机器人的AI智能体“RoboCat”;亚马逊云科技推出了Amazon Bedrock智能体,可以自动分解企业AI应用开发任务等等。Bedrock中的智能体能够理解目标、制定计划并采取行动。新的记忆保留功能允许智能体随时间记住并从互动中学习,实现更复杂、更长期运行和更具适应性的任务。
这些AI智能体的核心是人工智能算法,包括机器学习、深度学习、强化学习、人工神经网络等技术。通过这些算法,AI智能体可以从大量数据中学习并改进自身的性能,不断优化自己的决策和行为,还可以根据环境变化做出灵活地调整,适应不同场景和任务。
目前,AI智能体已在不少场景中得到应用,如客服、编程、内容创作、知识获取、财务、手机助手、工业制造等。AI智能体的出现,标志着人工智能从简单的规则匹配和计算模拟向更高级别的自主智能迈进,促进了生产效率的提升和生产方式的变革,开辟了人们认识和改造世界的新境界。
随着以通信、感知、计算为一体的“通感算”网络的构建,未来包括智能汽车、机器人、无人机、低空飞行器等在内的更广泛AI智能体将以前所未有的规模实现接入,通过将各类智能体互联互通,不断扩张单一智能体的能力边界,并借助多智能体的智慧涌现,实现智能体的大规模、高效协作与交互,从而完成从单体智能向群体智能的跃迁。
AI应用技术趋势的底层逻辑
随着大模型技术的落地带来的成本降低,使得自动化的智能技术正在成为核心方向,大模型的产品形态形成了从Chatbot到Copilot再到智能体的趋势和方向。
在此背景下,AI应用技术的三大底层逻辑正在浮现。
第一重底层逻辑是从智能体到AGI。对比在移动互联网时代奠定的App生态,当前需要在AI时代奠定一个AGI应用生态。从智能体发展看,人类在逐步强化程序的自动化、智能化程度,在智能体的尝试中,应用厂商结合深度学习等算法、知识图谱、RPA等技术实现了部分的自动化,其核心是在存量知识的基础上,实现由程序自主解决部分问题。
随着基础模型能力的进一步提升,智能体在任务规划中的灵活性,在知识吸收运用的效率方面的上限或将进一步提升。在当前的基础模型能力下,若将智能体与工作流进一步结合,在工作流程中嵌入AI实现部分问题的智能+自动化解决,智能体实用性或将进一步改善,商业化或将进一步加速。
第二重底层逻辑是大语言模型推动智能体进入新阶段。AI智能体经历了从符号智能体、反应智能体,到基于强化学习的智能体、具有迁移学习和元学习的智能体,到基于大语言模型的智能体的阶段,智能体通过与外部环境之间的互动来提升自己的智能。
第三重底层逻辑是多路径共同提升智能体整体智能化水平。“大模型+智能体”是通向AGI的路径之一。智能体用来描述表现出智能行为并具有自主性、反应性、主动性和社交能力的人工实体,能够使用传感器感知周围环境、做出决策,然后使用执行器采取行动,具备以上特征的智能体是实现AGI的关键一步。

AI智能体爆发元年已至?
2025年是否真的会如业界预测的那样成为“AI智能体爆发元年”?
业内专家将人工智能发展类比自动驾驶技术的分级,划分为L1-L5五个阶段:聊天机器人、推理、智能体、创新者、组织者。
第一阶段聊天机器人已经实现了。第二个阶段就是现在的大模型推理能力,第三就是智能体。可以把智能体分成两大类,一类是生成内容的智能体。一类是进行操作的智能体。操作智能体,又可以分为在数字世界进行操作的智能体和在物理世界进行操作的智能体。第四是随着智能体不断发展,需要更多的创新。第五组织者主要是指大模型、智能体、创新者多了之后,需要用AI对社会的管理模式进行重新设计与协调。
按照上述5个阶段划分,目前基本上处于智能体与创新者这两个阶段的转换过程中。未来每个人可能在生活和工作中有多个智能体。比如随时监测个人健康的智能体,会定期将健康数据汇总并给出健康建议。点餐智能体不需要你向它发出点餐指令,就可以根据你的饮食规律以及分享健康监测智能体中的数据,自行安排何时需要点餐,当你想要吃饭时外卖已经在门口了。每个人还可以有多个数字人智能体,比如帮你处理日常事务的数字人。
2025年,AI最重要的几个发展方向现在已经比较清晰。一是继续推进通用人工智能(AGI),在预训练受限之后,后训练的潜力逐渐体现出来。二是智能体大发展,行业智能体将会风起云涌。三是VLA大模型和具身智能将会有大发展。四是多模态融合趋势将会更加明显。
潜在风险不容忽视
AI智能体通过模拟和扩展人类的认知能力,有望广泛应用于医疗、交通、金融及国防等多个领域。有学者推测,到2030年,人工智能将助推全球生产总值增长12%左右。
不过,在看到AI智能体飞速发展的同时,也要看到其面临的技术风险、伦理和隐私等问题。一群证券交易机器人通过高频买卖合约便在纳斯达克等证券交易所短暂地抹去了1万亿美元的价值,世界卫生组织使用的聊天机器人提供了过时的药品审核信息,美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由ChatGPT凭空捏造……这些真实发生的案例表明,AI智能体带来的隐患不容小觑。
因为AI智能体可以自主决策,又能通过与环境交互施加对物理世界的影响,其一旦失控将给人类社会带来极大威胁。哈佛大学教授齐特雷恩认为,这种不仅能与人交谈,还能在现实世界中行动的AI智能体,是“数字与模拟、比特与原子之间跨越血脑屏障的一步”,应当引起警觉。
首先,AI智能体在提供服务的过程中会收集大量数据,用户需要确保数据安全,防止隐私泄露。
其次,AI智能体的自主性越强,越有可能在复杂或未预见的情境中做出不可预测或不当的决策。AI智能体的运行逻辑可能使其在实现特定目标过程中出现有害偏差,其带来的安全隐患不容忽视。用更加通俗的话来说,就是在一些情况下,AI智能体可能只捕捉到目标的字面意思,没有理解目标的实质意思,从而做出了一些错误的行为。
再次,AI大语言模型本身具备的“黑箱”和“幻觉”问题也会增加出现操作异常的频率。还有一些“狡猾”的AI智能体能够成功规避现有的安全措施,相关专家指出,如果一个AI智能体足够先进,它就能够识别出自己正在接受测试。目前已经发现一些AI智能体能够识别安全测试并暂停不当行为,这将导致识别对人类危险算法的测试系统失效。
此外,由于目前并无有效的AI智能体退出机制,一些AI智能体被创造后可能无法被关闭。这些无法被停用的AI智能体,最终可能会在一个与最初启动它们时完全不同的环境中运行,彻底背离其最初用途。AI智能体也可能会以不可预见的方式相互作用,造成意外事故。
为此,人类目前需尽快从AI智能体开发生产、应用部署后的持续监管等方面全链条着手,及时制定相关法律法规,规范AI智能体行为,从而更好地预防AI智能体带来的风险、防止失控现象的发生。
展望未来,AI智能体有望成为下一代人工智能的关键载体,它将不仅改变我们与机器交互的方式,更有可能重塑整个社会的运作模式,正成为推动人工智能转化过程中的一道新齿轮。
【关于科技云报到】
企业级IT领域Top10新媒体。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。
相关文章:
科技云报到:AI Agent打了个响指,商业齿轮加速转动
科技云报到原创。 3月16日,百度旗下文心大模型4.5和文心大模型X1正式发布。目前,两款模型已在文心一言官网上线,免费向用户开放。 同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用AP…...
【蓝桥杯python研究生组备赛】005 数学与简单DP
题目1 01背包 有 N 件物品和一个容量是 V 的背包。每件物品只能使用一次。 第 i 件物品的体积是 vi,价值是 wi。 求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。 输出最大价值。 输入格式 第一行两个整数&a…...
Chapter 4-16. Troubleshooting Congestion in Fibre Channel Fabrics
Show FCS Ie Example 4-17 shows the NX-OS command show fcs ie on Cisco MDS switches. 例 4-17 显示了 Cisco MDS 交换机上的 NX-OS 命令 show fcs ie。 Example 4-17 NX-OS command show fcs ie on Cisco MDS switches MDS9706-C# show fcs ie IE List for VSAN: 20 --…...
抖音视频数据获取实战:从API调用到热门内容挖掘
在短视频流量为王的时代,掌握抖音热门视频数据已成为内容运营、竞品分析及营销决策的关键。本文将手把手教你通过抖音开放平台API获取视频详情数据,并提供完整的代码实现及商业化应用思路。 一、抖音API权限申请与核心接口 抖音API需企业资质认证&…...
大白话读懂java对象创建的过程
1. java对象创建流程(大白话版) 咱们java对象被创建的过程大致如下,即: 在 JVM 中对象的创建,从⼀个 new 指令开始: 首先检查这个指令的参数是否能在常量池中定位到⼀个类的符号引用检查这个符号引用代表…...
Ubutu20.04安装docker与docker-compose
系统:20.04.6 LTS (Focal Fossa)" 1.配置apt源(在/etc/apt/sources.list中输入以下内容) # deb cdrom:[Ubuntu 20.04.6 LTS _Focal Fossa_ - Release amd64 (20230316)]/ focal main restricted deb http://mirrors.aliyun.com/ubuntu/ focal main restricted …...
AI图像理解技术的演进
在CLIP等现代多模态模型出现之前,早期的图生文技术主要依赖人工标注的ImageNet等数据集,但其技术路线与当前方法存在本质差异。 一、传统图生文技术的标注依赖 ImageNet的核心地位 在2012-2020年间,ImageNet的1,400万张人工标注图像ÿ…...
STM32 —— MCU、MPU、ARM、FPGA、DSP
在嵌入式系统中,MCU、MPU、ARM、FPGA和DSP是核心组件,各自在架构、功能和应用场景上有显著差异。以下从专业角度详细解析这些概念: 一、 MCU(Microcontroller Unit,微控制器单元) 核心定义 集成系统芯片&a…...
aiosignal
文章目录 安装 一、关于 aiosignal Github : https://github.com/aio-libs/aiosignal官方文档:https://aiosignal.aio-libs.org/gitter聊天:https://gitter.im/aio-libs/Lobby许可证 : Apache 2 aiosignal 管理 asyncio 项目中回调的项目。 Signal是已…...
在 VSCode 远程开发环境下使用 Git 常用命令
在日常开发过程中,无论是单人项目还是团队协作,Git 都是版本管理的利器。尤其是在使用 VSCode 连接远程服务器进行代码开发时,Git 不仅能帮助你管理代码版本,还能让多人协作变得更加高效。本文将介绍一些常用的 Git 命令ÿ…...
电脑节电模式怎么退出 分享5种解决方法
在使用电脑的过程中,许多用户为了节省电力,通常会选择开启电脑的节能模式。然而,在需要更高性能或进行图形密集型任务时,节能模式可能会限制系统的性能表现。这时,了解如何正确地关闭或调整节能设置就显得尤为重要了。…...
kubernetes高级实战
一、模拟企业环境进行一个实战部署 [rootmaster node]# kubectl apply -f pod-tomcat.yaml pod/tomcat-test created [rootmaster node]# kubectl get pods NAME READY STATUS RESTARTS AGE tomcat-test 2/2 Running 0 2s [rootmaster node]…...
【Java】——程序逻辑控制(构建稳健代码的基石)
🎁个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:【Java】内容概括 文章目录: 一.顺序结构二.分支结构1.if 语句1.1 语法格式11.2 语法格式21.3 语法格式3 …...
QT编程之PCM音频处理
一、高级播放接口(未压缩编码的音频文件) QMediaPlayer 支持MP3/WMA等压缩格式及网络流媒体播放,集成媒体控制(播放/暂停/进度调节)需设置QAudioOutput指定输出设备,支持播放速度调节(setPl…...
卫星互联网智慧杆:开启智能城市新时代
哇哦!在当下这个数字化浪潮正以雷霆万钧之势席卷全球的超酷时代,智慧城市建设已然成为世界各国你追我赶、竞相发力的核心重点领域啦!而咱们的卫星互联网智慧杆,作为一项完美融合了卫星通信与物联网顶尖技术的创新结晶,…...
Numpy broadcasting规则
Numpy的broadcast操作是为了将两个不同形状的数组,通过一系列规则,变换成形状相同的数组,从而使得它们之间可以进行按元素进行的计算。 Broadcasting的机制并不复杂,只要记住以下几条规则就可以了: 1. 顺序。首先&am…...
掌握 Shopee 商品数据:用爬虫解锁无限商机
在电商的浩瀚宇宙中,Shopee 宛如一颗璀璨星辰,吸引着无数卖家与买家在此汇聚。对于电商从业者、市场调研人员或是数据分析师而言,获取 Shopee 店铺的商品信息就如同掌握了开启财富之门的钥匙。而爬虫技术,正是帮助我们高效获取这些…...
Qt-QChart实现折线图
一、介绍场景 动态查看数据变化,或者了解数据发展趋势,让数据可以形象直观展现出来,这里推荐使用折线图的方式展现,本文抛砖引玉,简单实现一个实例,效果图如下: 二、实现步骤 1、charts组件 …...
取消Win10锁屏界面上显示的天气、市场和广告的操作
要取消Win10锁屏界面上显示的天气、市场和广告,您可以按照以下步骤操作: 方法一:更改锁屏界面设置 打开“设置”: 点击“开始”菜单,然后点击齿轮状的“设置”图标。 进入“个性化”: 在“设置”窗口中&a…...
IoT设备测试:从协议到硬件的全栈验证体系与实践指南
一、引言:IoT技术浪潮下的质量挑战 根据IDC预测,到2027年全球IoT设备数量将突破290亿台,涵盖智能家居、工业物联网(IIoT)、智慧城市、车联网等场景。然而,IoT系统的复杂性远超传统嵌入式设备——硬件异构性…...
大白话详细解读React框架的diffing算法
1. Diffing 算法是什么? Diffing 算法是 React 用来比较虚拟 DOM(Virtual DOM)树的一种算法。它的作用是找出前后两次渲染之间的差异(diff),然后只更新这些差异部分,而不是重新渲染整个页面。 …...
自然语言处理入门
第一章 自然语言处理入门 1 什么是自然语言处理 【什么是人工智能,分别对应哪几个领域】 AI是模仿甚至超越人的某项机能,NLP、CV、ASR NLP是机器理解并生成人类语言2 自然语言处理的发展简史 1950 -- 图灵提出“机器能思考吗”,划时代性的…...
Arduino示例代码讲解:Pitch follower 跟随
Arduino示例代码讲解:Pitch follower 跟随 Pitch follower代码功能代码逐行解释1. 注释部分功能:硬件连接:2. `setup()` 函数3. `loop()` 函数硬件连接**扬声器连接**:**光敏电阻连接**:**Arduino板**:运行结果修改建议视频讲解Pitch follower 这段代码是一个Arduino示例…...
从TouchDriver Pro到Touchdriver G1,Weart触觉手套全系解析:XR交互的“真实触感”如何实现?
Weart旗下的Touchdriver Pro触觉手套和Touchdriver G1触觉手套,凭借其技术创新,为用户带来了全新的触觉体验。Touchdriver Pro触觉手套通过多模态触觉反馈技术,提供力反馈、纹理渲染和温度提示,让用户在虚拟环境中感受到真实的触觉…...
华为OD机试-阿里巴巴找黄金宝箱(I)-双指针(Java 2023 B卷 100分)
题目描述 阿里巴巴在去砍柴的路上发现了强盗集团的藏宝地,藏宝地有编号从 0 到 N 的箱子,每个箱子上贴有一个数字。黄金宝箱满足排在它之前的所有箱子数字和等于排在它之后的所有箱子数字和。第一个箱子左边部分的数字和定义为 0;最后一个宝箱右边部分的数字和定义为 0。请…...
ubuntu20如何升级nginx到最新版本(其它版本大概率也可以)
前言: Nginx非常常用,所以在网络安全方面备受“关注”。其漏洞非常多,要经常保持软件更新版本才能更好的保证安全。但是Ubuntu官网适配nginx非常慢,所以nginx官方也会推出针对主流Linux操作系统的包管理工具安装方式。 步骤&…...
排序算法实现:插入排序与希尔排序
目录 一、引言 二、代码整体结构 三、宏定义与头文件 四、插入排序函数(Insertsort) 函数作用 代码要点分析 五、希尔排序函数(ShellSort) 函数作用 代码要点分析 六、打印数组函数(PrintSort&#x…...
UDP协议原理
UDP协议原理 本篇介绍 在前面使用UDP编程时已经基本了解了UDP的工作模式,也知道了UDP有三个特点: 无连接不可靠面向数据报 但是当时并没有具体谈论为什么UDP有以上三个特点,基于这个原因,本篇就会针对这三个原因进行介绍 UDP…...
EtherCAT转Modbus网关如何在倍福plc组态快速配置
EtherCAT转Modbus网关如何在倍福plc组态快速配置 在工业控制领域,EtherCAT和Modbus是两种常见的总线通信协议。EtherCAT以其高速的数据传输和灵活的网络配置被广泛应用于高性能自动化控制系统中,而Modbus则因其简单、稳定且兼容性强而被许多设备所支持。…...
如何设计大模型意图识别?
环境: 大模型 问题描述: 如何设计大模型意图识别? 解决方案: 1. 意图识别定义与核心任务 定义:意图识别(Intent Recognition)是从用户输入(文本、语音等)中解析其核…...
