当前位置: 首页 > article >正文

一篇大模型Agents工作流优化最新综述

过去人们总希望一个LLM直接把任务做完现在一个更现实的方向正在浮现——针对不同任务设计不同工作流并让系统在执行前、执行中乃至执行后持续优化这条链路。近日Rensselaer Polytechnic InstituteRPI与IBM Research联合发布Workflow Optimization for LLM Agents最新综述系统讨论了一个正在受到越来越多关注的方向**如何为LLM Agents自动设计、选择、生成、修改并评估工作流结构。Figure 1: 工作流优化概览图展示从静态优化到动态适应的完整谱系上图展示了论文的核心框架Agentic Computation Graph (ACG)作为统一抽象涵盖从静态模板优化到动态运行时适应的全谱系方法。核心概念三个关键对象与分类维度上表清晰定位了本综述与现有工作如规划、工具学习、多智能体协作等综述的区别本文将工作流结构本身作为主要优化对象而非仅关注代理能力或应用场景。Table 1: 本综述与相关综述的定位对比论文提出了区分工作流优化的三个核心对象2.1 三个关键对象ACG Template (Ḡ): 可复用的可执行规范包含节点、边、参数、调度策略和可编辑动作Realized Graph (G_run): 特定运行实际使用的工作流结构可能是模板的实例化或子图Execution Trace (τ): 执行过程中产生的状态、动作、观察和成本序列2.2 分类维度GDT与GPM论文提出了两个轻量级描述符来分类方法Graph Determination Time (GDT): 结构决定的时间点offline: 部署前优化可复用模板pre-execution: 执行前生成特定运行的图in-execution: 执行过程中动态修改结构Graph Plasticity Mode (GPM): 推理时结构可变性none: 结构固定select: 从固定超图中选择子图generate: 执行前生成新结构edit: 执行中添加、删除或重连结构静态工作流优化离线模板搜索静态方法在部署前优化可复用的工作流模板优点是易于检查、约束和基准测试缺点是面对分布偏移时可能显得僵化。Table 2: 代表性核心静态工作流优化方法对比3.1 离线模板搜索代表性方法通过搜索离散设计空间发现优质模板关键方法:AFlow: 使用MCTS搜索类型化算子图结合LLM引导扩展与可执行评估ADAS: 在代码空间搜索元代理提出可运行的代理系统并迭代改进VFlow: 结合硬件验证器的多层级验证语法、功能正确性、可综合性Maestro: 交替进行图编辑与节点配置更新支持数字分数和反思文本反馈3.2 节点级优化在固定脚手架内优化局部组件DSPy: 将LLM管道视为模块组合编译优化提示和示例OPRO/EvoPrompt/CAPO: 使用进化算法或LLM作为优化器搜索最佳提示Optima: 生成、排序、选择多智能体交互轨迹以优化协作效率3.3 可验证性设计静态优化特别适合集成验证MermaidFlow: 使用结构化Mermaid中间表示结合静态有效性检查VFlow: 将多层级验证语法、功能、硬件约束集成到搜索循环中动态工作流优化运行时适应动态方法在推理时确定部分工作流结构适用于任务异构性强、需要自适应的场景。Table 3: 代表性核心动态工作流优化方法对比4.1 选择与剪枝Select/Prune最轻量的动态形式保持超图固定运行时决定激活哪些部分Adaptive Graph Pruning: 学习任务和代理嵌入剪枝通信边和代理DAGP: 基于估计的查询难度进行难度感知的图剪枝AgentDropout: 动态消除冗余代理和通信链接以优化token效率4.2 执行前生成Pre-execution Generation针对特定输入生成工作流结构Assemble Your Crew: 自回归采样角色和边生成查询条件化的DAGG-Designer: 使用变分图自编码器学习图生成器FlowReasoner: 使用RL训练查询级元代理从算子库生成工作流Workflow-R1: 将工作流构建重塑为多轮决策过程使用分组think-act序列的RL优化4.3 执行中编辑In-execution Editing最灵活的形式将结构变化作为运行时动作DyFlow: 设计师与执行器交替基于中间反馈修订子目标AgentConductor: 生成YAML拓扑→执行→基于有效性/成本反馈重新生成拓扑MetaGen: 基于矛盾、失败和成本信号训练免费地演化角色和拓扑EvoFlow: 维护多样化工作流种群在线进化反馈信号与更新机制不同方法使用不同的反馈信号指导结构优化关键洞见: 信号类型决定了安全的动作粒度。强验证器支持激进的图变异文本反馈适合提出修改建议但需外部验证器确认。评估与报告结构作为一等公民论文指出当前文献常将工作流结构视为实现细节而非评估对象提出了结构感知评估框架Table 4: 工作流优化研究中的代表性评估资源6.1 最小报告协议论文提出了工作流优化论文应遵循的最小报告标准Table 5: 建议的最小报告协议核心要求:工作流表示: 代码/DSL/图IR/模式约束结构设置: 静态vs动态GDT/GPM可编辑动作图级指标: 节点数、深度、宽度、通信量、编辑次数、结构方差鲁棒性测试: 复述不变性、工具故障注入、API漂移、严格预算限制成本指标: 每次成功的成本cost-per-success比原始成本更具信息量设计权衡与实践指南基于对77篇文献的综述论文提供了实用的设计决策框架7.1 何时静态足够当满足三个条件时静态优化通常足够算子空间足够受限可搜索评估器足够可信能区分候选方案部署工作负载足够重复值得优化可复用模板适用场景: API稳定的代码生成、具有强外部工具链的硬件生成。7.2 动态方法的选择谱系根据任务异构性选择动态程度选择/剪枝: 当实例主要差异在难度、通信预算或所需模型强度时执行前生成: 当不同查询需要真正不同的分解、通信模式或算子序列时执行中编辑: 当环境交互性强部分执行 reveals 单次计划无法预知的信息时如工具故障恢复7.3 实用混合配方Table 8: 背景框架、脚手架和强基线建议流程:从约束静态脚手架或小算子库开始建立基线只有当轨迹分析揭示结构性失效模式而非纯局部指令错误时添加图级搜索在异构部署条件下优先使用运行时选择/剪枝而非完整工作流生成仅在环境不确定性高的场景中保留执行中编辑找到有效设计后通过静态稀疏化或运行时剪枝压缩通信学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

一篇大模型Agents工作流优化最新综述

过去,人们总希望一个LLM直接把任务做完;现在,一个更现实的方向正在浮现——针对不同任务设计不同工作流,并让系统在执行前、执行中乃至执行后持续优化这条链路。 近日,Rensselaer Polytechnic Institute(RP…...

指挥OpenClaw抓取数据折腾了一夜,我终于想到了邪修玩法

这段时间玩小龙虾玩得真上头,突然想起之前一直想要统计公众号的数据。 这工作交给小龙虾妥妥能胜任啊!但是吧……实际上执行出来的结果却不是这样的。 因为小白本地使用的是OpenClawAtomgit的方案,Atomgit主打一个不费一分钱,免…...

DeepSeek-Coder-V2终极指南:如何免费打造你的专属AI编程助手

DeepSeek-Coder-V2终极指南:如何免费打造你的专属AI编程助手 【免费下载链接】DeepSeek-Coder-V2 DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 项目地址: https://gitcode.com/GitHub_Trending/de/DeepSeek-Coder-V2 …...

从“动态规划”到“强化学习”:贝尔曼方程的前世今生与核心思想

从“动态规划”到“强化学习”:贝尔曼方程的前世今生与核心思想 1953年,美国数学家理查德贝尔曼在兰德公司研究导弹防御系统时,面对复杂的多阶段决策问题,提出了一个革命性的数学工具——动态规划。这个诞生于冷战背景下的理论&am…...

Windows ISO制作与补丁集成自动化工具实战指南:从手动操作到批量部署的效率革命

Windows ISO制作与补丁集成自动化工具实战指南:从手动操作到批量部署的效率革命 【免费下载链接】Win_ISO_Patching_Scripts Win_ISO_Patching_Scripts 项目地址: https://gitcode.com/gh_mirrors/wi/Win_ISO_Patching_Scripts 在数字化时代,系统…...

掌握PingFangSC字体配置优化:面向全平台开发者的专业指南

掌握PingFangSC字体配置优化:面向全平台开发者的专业指南 【免费下载链接】PingFangSC PingFangSC字体包文件、苹果平方字体文件,包含ttf和woff2格式 项目地址: https://gitcode.com/gh_mirrors/pi/PingFangSC 比传统方案提升30%效率的跨平台适配…...

导入MotorCAD API(需先安装MotorCAD的Python接口)

基于Motorcad的4极6槽 内转子采用内插式磁钢 3000rpm 输出转矩 2.6Nm 效率93%外径 94mm 轴向长度70mm 功率800w 直流母线380V 永磁同步电机(永磁直流无刷)模型(PMSM或者是BLDC) 最近捣鼓了个小功率PMSM模型,用MotorCAD搭了个4极6槽内插式的&a…...

3张表搞定财务BP工作!财务BP必须会的3张表

做了这么多年财务数据分析,我发现国内很多公司的财务BP,还停留在自己造表的阶段。每人一套表,格式五花八门,数据口径对不上。结果就是BP花大量时间在拉表、对数的琐事上,真正花在业务分析和决策支持上的时间少之又少。…...

C语言基础:LiuJuan20260223Zimage嵌入式开发入门

C语言基础:LiuJuan20260223Zimage嵌入式开发入门 1. 学习目标与前置知识 如果你是刚开始接触嵌入式开发的C语言初学者,这篇文章就是为你准备的。我们将从最基础的C语言语法开始,一步步带你了解如何在嵌入式环境中使用C语言进行开发。不需要…...

大厂高薪抢手!文科生如何抓住AI时代机遇,实现职业逆袭?

大厂纷纷高薪招聘文科生,引发社会关注。文科生凭借沟通、叙事、逻辑等优势,在大模型理解人类价值观、企业品牌宣传等方面发挥作用。高校也调整专业设置,培养跨学科人才。文章建议文科生根据自身专业,向文案策划、品牌宣传、法务、…...

智慧树自动化学习工具终极指南:解放双手,高效完成课程学习

智慧树自动化学习工具终极指南:解放双手,高效完成课程学习 【免费下载链接】fuckZHS 自动刷智慧树课程的脚本 项目地址: https://gitcode.com/gh_mirrors/fu/fuckZHS 智慧树自动化学习工具是一款专为智慧树平台设计的Python脚本,能够帮…...

突破Wallpaper Engine资源壁垒:RePKG工具全方位应用指南

突破Wallpaper Engine资源壁垒:RePKG工具全方位应用指南 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 一、RePKG:解锁创意资源的技术钥匙 在数字创意领域…...

2.2.2.3 Spark实战:词频统计

本次实战涵盖了Spark词频统计(WordCount)的两种主流实现方式。首先,利用Scala在spark-shell中完成从读取文件、flatMap分词、map映射到reduceByKey聚合的完整流程,并实现结果的降序排序。其次,针对Spark 3.3.2版本的需…...

Infinity Pro书签迁移终极指南:从JSON文件到本地缓存的完整操作流程

Infinity Pro书签迁移终极指南:从JSON文件到本地缓存的完整操作流程 作为一名长期使用Infinity Pro的开发者,我深知书签迁移的痛点。每次换设备或重装系统,那些精心整理的技术资源库都要重新配置。本文将分享一套经过实战验证的迁移方案&…...

告别卡顿!用SwiftFormer在iPhone上5分钟部署实时图像识别App(附完整代码)

在iPhone上5分钟部署SwiftFormer图像识别App的实战指南 从理论到实践:为什么选择SwiftFormer 去年夏天,我在为一个时尚电商客户开发AR试衣功能时,第一次被移动端视觉模型的性能问题难住。当时使用的模型在iPhone 12上每帧处理需要近200ms&…...

从rdt1.0到rdt3.0:可靠数据传输协议的演进与发送接收端FSM解析

1. 可靠数据传输协议的前世今生 第一次接触可靠数据传输协议(Reliable Data Transfer,简称rdt)是在十多年前的一个网络编程项目里。当时为了确保数据能准确无误地传输,我翻遍了各种资料,最终在《计算机网络&#xff1a…...

BiliTools:B站资源高效管理与下载完全指南

BiliTools:B站资源高效管理与下载完全指南 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools BiliTools是一…...

新手零基础入门:通过快马生成burpsuite超详细安装图解教程

作为一名网络安全新手,第一次接触BurpSuite时确实容易被各种专业术语和复杂的安装步骤吓到。今天我就用最直白的方式,手把手带你完成BurpSuite的安装,让你轻松迈出Web安全测试的第一步。 什么是BurpSuite?为什么需要它&#xff1…...

3 月 21 日G-Star Gathering Day 武汉站活动精彩回顾

3 月 21 日,G-Star Gathering Day 武汉站在鄂港澳青创园顺利举办。来自 AI 与开源领域的开发者、创业者齐聚一堂,围绕 AI Agent、代码智能体、个人创业形态与真实落地场景展开分享与交流。这不仅是一场技术沙龙,更是一场关于 “AI 如何真正改…...

Real-ESRGAN-GUI:如何用AI双引擎将模糊图片一键变高清

Real-ESRGAN-GUI:如何用AI双引擎将模糊图片一键变高清 【免费下载链接】Real-ESRGAN-GUI Lovely Real-ESRGAN / Real-CUGAN GUI Wrapper 项目地址: https://gitcode.com/gh_mirrors/re/Real-ESRGAN-GUI 还在为模糊的老照片、低分辨率的动漫图片而烦恼吗&…...

效率提升:基于快马平台为dc=y103pc=类参数快速打造调试工具

效率提升:基于快马平台为dcy103&pc类参数快速打造调试工具 在日常开发中,我们经常需要处理各种URL参数,尤其是类似"dcy103&pctest"这样的查询字符串。手动解析和修改这些参数不仅效率低下,还容易出错。最近我在…...

光流法在气象雷达中的应用:从原理到外推实践

光流法在气象雷达中的应用:从原理到外推实践 气象雷达作为现代气象监测的核心工具,其回波数据蕴含着丰富的天气系统动态信息。如何从这些看似静态的图像序列中提取运动规律,进而预测未来短时内的天气变化,一直是气象学界和工程界关…...

零基础入门Python爬虫:借助快马AI生成你的第一个可运行爬虫脚本

今天想和大家分享一下我作为Python爬虫新手的学习经历。刚开始接触爬虫时,面对各种库和概念真的有点懵,直到发现了InsCode(快马)平台,它让我用自然语言描述需求就能生成可运行的代码,大大降低了入门门槛。 爬虫的基本原理 爬虫就像…...

新手入门指南:基于快马生成的代码理解设备配对功能实现

今天想和大家分享一个特别适合新手学习的设备配对功能实现案例。这个例子用最基础的HTML、CSS和原生JavaScript就能完成,特别适合刚接触前端开发的朋友理解交互逻辑。 项目结构设计 整个项目分为三个部分:两个模拟设备(用不同图标表示&#x…...

量子计算入门捷径:在快马平台用qorder实现第一个纠缠态实验

量子计算听起来很高深,但有了合适的工具和平台,入门其实比想象中简单。最近我在InsCode(快马)平台上尝试用qorder框架做了第一个量子纠缠实验,发现整个过程就像搭积木一样直观。下面分享我的学习笔记,希望能帮到同样想入门的朋友。…...

零基础入门AI开发:在快马平台亲手制作你的第一个口播智能体

最近在尝试入门AI开发,发现用InsCode(快马)平台做"旗博士口播智能体"特别适合零基础选手。这个项目不需要自己从头写代码,但能完整走通AI应用开发全流程,分享下我的学习笔记: 项目整体结构 整个项目分三部分&#xff1a…...

AI开发AI:借助快马多模型能力,迭代式构建你的智能健康管理Agent

最近在尝试开发一个健康管理AI助手,发现用传统方式写代码调试特别耗时。后来尝试了InsCode(快马)平台,发现用AI对话的方式迭代开发简直打开了新世界。记录下这个"用AI开发AI"的完整过程: 基础框架搭建 最开始只需要一个能交互的对话…...

计算机毕业设计springboot基于web的好文阅读网站的设计与实现 SpringBoot在线文学阅读与创作平台的设计与实现 基于Web的数字化阅读社区系统构建

计算机毕业设计springboot基于web的好文阅读网站的设计与实现xl6429gd (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着互联网技术的飞速发展和数字阅读习惯的普及&#xff0…...

如何突破Office功能限制?本地化激活方案全解析

如何突破Office功能限制?本地化激活方案全解析 【免费下载链接】ohook An universal Office "activation" hook with main focus of enabling full functionality of subscription editions 项目地址: https://gitcode.com/gh_mirrors/oh/ohook 当…...

从Simulink到实物:单闭环直流调速仿真如何指导真实的Arduino/STM32控制?

从Simulink到Arduino:如何将直流电机控制算法从仿真落地到真实硬件 当你第一次在Simulink中看到那个完美的电机转速响应曲线时,那种成就感是无可替代的。但很快,一个更迫切的问题出现了:这些漂亮的仿真结果,如何变成手…...