永结无间Ⅸ--你不需要LLM Agent
人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。
但您是否考虑过您是否真的需要它?
实际情况是,您不需要 Agentic Architecture,并且最好不要在您的业务中使用 Agentic Architecture。
1 分钟了解 LLM 代理和代理架构
在我深入探讨原因之前,让我们先快速了解一下 LLM 代理的含义。
从语义内核编排的角度来看,人工智能代理是一个模块化抽象,它可以拥有角色,可以响应用户输入执行操作,并且可以轻松地与其他代理通信。来源:微软开发者博客
本质上,Agent可以看作是一个使用LLM设计的自动机,可以执行以下操作:
- 扮演角色
- 弄清楚如何完成一项任务
- 执行任务
- 做决定
- 与其他代理商沟通
在代理架构中,您将拥有一大群这样的 LLM 代理,每个代理之间都有直接的沟通渠道,以完成一项复杂的任务。您通常需要植入一个经理角色的代理来确定任务是否已完成,或者您的代理是否会开始无休止地讨论周末计划或生活的意义。

示例:用于生成博客文章的 Agentic 架构
乍一看这听起来非常合乎逻辑。
事实上,大多数团队都是这样运作的。
所以有什么问题?
问题1:为什么你还没有它?
百万美元的创意通常始于解决我们自己的日常痛点。如果我们从未进一步实施它,通常意味着以下一项或多项是正确的:
- 我们不知道该怎么做。如果你不知道该怎么做,你很可能也不知道它是否已经正确实施。
- 我们没有时间/资源去做这件事。
- 我们实际上并不需要它。就像我不需要商用油炸锅来制作一批鸡翅一样。
底线:不要为了使用而使用技术。
如果您的团队已经考虑过一段时间是否需要 Agentic 架构,那么您可能还没有开始开发/采购它。在这种情况下,我建议您坚持下去,不要害怕错过。会有更好的架构/实现。
如果你不相信的话,那我们就继续下一个问题吧。
问题 2:依赖互联网讨论来解决业务问题
LLM 之所以令人惊叹,是因为他们所输入的数据量非常大。
OpenAI 使用以下信息来训练模型:(1) 互联网上公开的信息、(2) 从第三方获得许可的信息,以及 (3) 用户或人类训练师提供的信息。
虽然您可能在网上找到关于银行通常如何进行反洗钱 (AML) 检查的讨论,但您可能无法找到您的竞争对手或客户的竞争对手实际如何经营业务的实际审计线索。
换句话说,如果您想使用 LLM 代理来自动化您的业务流程,那么您将陷入这两个选项之间:
- 利用 Reddit 上的网络传闻来经营你的企业
- 使用精心策划的数据集来微调你自己的 LLM
LLM 微调值得在单独的博客文章中介绍。您和您的企业可能需要针对不同的业务流程微调多个模型。在服用红色药丸之前,请确保您已为这一旅程做好准备。
您可能会说,对于业务关键性较低且价值较低的任务,LLM 代理仍然是有效的选择。但在那时,当您可以直接将 LLM 与云提供商一起使用时,是否仍然值得投资设置和采用该框架?
问题 3:以创造力的名义将业务流程转变为掷骰子
大多数大模型语言项目都无法解决突破性的问题
是的,LLM 已被用于帮助探索核聚变的可能性。
但让我们现实一点,如果您正在考虑使用 LLM 代理来自动化部分业务流程,那么这些流程可能是您和您的团队以前执行过的。这意味着有一个协议/程序需要遵循,或者有完成这些任务的方法。
我们需要问自己的问题是:在执行任务时,我们真的需要 LLM 的创造力吗?或者我们真的希望 LLM 遵循以前的任务完成方式,并在此过程中的每个步骤中自动生成文本/图像?
如果我们真的想让 LLM 代理弄清楚如何执行任务,我们可能会看到每次执行的审计跟踪都富有创意。执行顺序会有所不同,中间输出格式可能不一致,有时,代理甚至可能需要很多轮才能获得不令人满意的结果。曾经清晰的协议将变得富有创意或统计上不可预测。
如果计划开始将 GenAI 更大规模地整合到业务中,那么让 LLM 按照规则行事通常会产生更可审计、调试和稳定的结果。如果是这样的话,LLM 代理会带来什么好处呢?我们不妨剪掉翅膀,选择 LLM 管道。
潜在解决方案:大模型语言(LLM) 管道
如果说数据科学的炒作教会了我们什么,那就是操作化的重要性。如果没有办法将尖端分析/技术集成到现有系统/流程中,那么一旦热潮消退,你就会发现自己陷入巨大的技术债务和孤岛之中。
尽管各种周期性炒作仍在继续,但数据工程、DevOps 和 MLOps 始终保持相关性,原因如下:它们都与透明度、稳健性和可靠性有关。我们也应该以这种方式考虑 LLM 的采用。
将你的 LLM 代理计划转换为经过充分记录和测试的 LLM 管道,每个管道包含原子步骤,每个步骤都具有定义的输入和输出数据结构。这让你能够真正思考在 GenAI 成为现实之前你是如何执行任务的。这还允许你调试 LLM 管道出错的地方。这最终将把原本庞大的 LLM 代理黑匣子缩小为概率口袋,因为你已经定义了高级工作流程和执行顺序。
欢迎前往我们的公众号,时事资讯
创作不易,觉得不错的话,点个赞吧!!!
相关文章:
永结无间Ⅸ--你不需要LLM Agent
人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。 但您是否考虑过您是否真的需要它? 实际情况是,您不需要 A…...
Simulink|基于粒子群算法的永磁同步电机多参数辨识
目录 主要内容 模型研究 结果一览 下载链接 主要内容 仿真程序参考文献《改进粒子群算法的永磁同步电机多参数辨识》,采用粒子群算法与simulink模型结合的方式,对永磁同步电机进行多参数辨识。程序以定子绕组电阻、d轴电感、q轴电感和永磁…...
程序如何自动点击亚马逊商户后台的“邀请评论”按钮
要在亚马逊上自动点击“邀请评论”按钮,可以使用自动化脚本来实现。由于你希望自动化操作,我提供一个示例代码,使用 Selenium WebDriver 来执行这个任务。Selenium 是一个流行的浏览器自动化工具,能够模拟用户操作,例如…...
大模型算法面试题(十八)
本系列收纳各种大模型面试题及答案。 1、P-tuning v2 思路、优缺点是什么 P-tuning v2是清华大学自然语言处理实验室(THUDM)等研究机构提出的一种新的预训练模型优化方法,主要关注如何通过动态构建任务相关的提示序列来引导预训练模型进行更…...
手机在网状态接口如何对接?(二)
一、什么是手机在网状态? 传入手机号码,查询该手机号的在网状态,返回内容有正常使用、停机、在网但不可用、不在网(销号/未启用/异常)、预销户等多种状态。 二、手机在网状态使用场景? 1.用户验证与联系…...
力扣-3232. 判断是否可以赢得数字游戏
给你一个 正整数 数组 nums。 Alice 和 Bob 正在玩游戏。在游戏中,Alice 可以从 nums 中选择所有个位数 或 所有两位数,剩余的数字归 Bob 所有。如果 Alice 所选数字之和 严格大于 Bob 的数字之和,则 Alice 获胜。 如果 Alice 能赢得这场游…...
Table SQL connectors以及FileSystem、JDBC connector
目录 Flink支持的连接器 如何使用连接器 FileSystem SQL Connector 文件格式 分区文件 Source 目录监控 元数据 Streaming Sink 滚动策略 文件合并 JDBC SQL Connector 依赖 如何创建JDBC表 连接器配置 案例 pom依赖 代码 测试 Flink的Table API和SQL…...
Animate软件基础:“分散到图层”创建的新图层
FlashASer:AdobeAnimate2021软件零基础入门教程https://zhuanlan.zhihu.com/p/633230084 FlashASer:实用的各种Adobe Animate软件教程https://zhuanlan.zhihu.com/p/675680471 FlashASer:Animate教程及作品源文件https://zhuanlan.zhihu.co…...
ffmpeg命令-Windows下常用最全
查询命令 参数 说明 -version 显示版本。 -formats 显示可用的格式(包括设备)。 -demuxers 显示可用的demuxers。 -muxers 显示可用的muxers。 -devices 显示可用的设备。 -codecs 显示libavcodec已知的所有编解码器。 -decoders 显示可用…...
反序列化漏洞靶机实战-serial
一.安装靶机 下载地址为https://download.vulnhub.com/serial/serial.zip,安装好后开启靶机,这里并不需要我们去登录,直接扫描虚拟机nat模式下c网段的ip,看看哪个的80端口开放,然后直接去访问 二.查找cookie 访问靶…...
医疗器械产品没有互联网连接,就不适用于网络安全要求吗?
医疗器械产品是否不适用于网络安全要求,需要考虑产品是否具有网络连接功能以进行电子数据交换或远程控制,以及是否采用储存媒介进行电子数据交换。详细解析如下: 一、医疗器械的网络安全要求不仅限于互联网连接 数据交换接口:医疗…...
可视掏耳勺安全吗?独家揭示六大风险弊病!
很多人习惯在洗漱完顺手拿一根棉签掏耳朵,但是棉签的表面直径大且粗糙,不易将耳朵深处的耳垢挖出,耳垢堆积在耳道深处长时间不清理会导致堵塞耳道,引起耳鸣甚至感染。而可视掏耳勺作为一种新型的挖耳工具,它的安全性也…...
JavaScript 变量声明var、let、const
在 JavaScript 中,var、let和const是用于声明变量的关键字。 let和const是JavaScript里相对较新的变量声明方式。 let用法类似于var,但是所声明的变量,只在let命令所在的代码块内有效。 const声明一个只读的常量。一旦声明,常量的…...
ipvlan: operation not supported 导致的POD不断重启
情况描述 接到反馈有一台虚拟机HA迁移了,需要检查一下上面业务是否正常,由于是K8S node节点,正常情况下重启会自动恢复的,不过抱着严谨的态度,上去看了一眼。 问题:发现docker运行正常,但是业…...
组蛋白乳酸化和RNA甲基化如何联动?请大数据把这个思路推给科研人
在细胞生物学中,基因表达调控是决定细胞功能与命运的核心过程之一。组蛋白作为修饰性蛋白,在调控基因转录中起着至关重要的作用。近年来,科学家们发现,组蛋白的多种化学修饰(如甲基化、乙酰化、磷酸化等)影…...
操作文件-Path
Java操作文件-Path Paths 参数说明 first:必选参数,表示路径的第一个组件。more:可选参数,表示路径的其他组件,可以传入多个。 创建路径对象 // 创建一个表示当前工作目录的Path对象 Path currentPath Paths.get…...
RAC(Teamcenter )开发,Bom行解包和打包的方法
1、打包 UnpackAllAction allAction new UnpackAllAction((AbstractBOMLineViewerApplication) currentApplication, "packAllAction"); new Thread(allAction).start();2、解包 UnpackCommand command new UnpackCommand(bomLine); command.executeModal();3、注…...
log4j2漏洞练习
log4j2 是Apache的一个java日志框架,我们借助它进行日志相关操作管理,然而在2021年末log4j2爆出了远程代码执行漏洞,属于严重等级的漏洞。apache log4j通过定义每一条日志信息的级别能够更加细致地控制日志生成地过程,受影响的版本…...
OpenEuler安装部署教程
目录 OpenEuler安装部署教程 MobaXterm一款全能的远程工具 yum安装软件 vim编辑器(了解) 防火墙 常用命令 网络工具netstat & telnet 进程管理工具top ps 磁盘free、fdisk 用户、组(了解) 权限(了解&am…...
Canto - hackmyvm
简介 靶机名称:Canto 难度:简单 靶场地址:https://hackmyvm.eu/machines/machine.php?vmCanto 本地环境 虚拟机:vitual box 靶场IP(Canto):192.168.130.53 windows_IP:192.1…...
IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
解锁数据库简洁之道:FastAPI与SQLModel实战指南
在构建现代Web应用程序时,与数据库的交互无疑是核心环节。虽然传统的数据库操作方式(如直接编写SQL语句与psycopg2交互)赋予了我们精细的控制权,但在面对日益复杂的业务逻辑和快速迭代的需求时,这种方式的开发效率和可…...
【项目实战】通过多模态+LangGraph实现PPT生成助手
PPT自动生成系统 基于LangGraph的PPT自动生成系统,可以将Markdown文档自动转换为PPT演示文稿。 功能特点 Markdown解析:自动解析Markdown文档结构PPT模板分析:分析PPT模板的布局和风格智能布局决策:匹配内容与合适的PPT布局自动…...
ETLCloud可能遇到的问题有哪些?常见坑位解析
数据集成平台ETLCloud,主要用于支持数据的抽取(Extract)、转换(Transform)和加载(Load)过程。提供了一个简洁直观的界面,以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...
在WSL2的Ubuntu镜像中安装Docker
Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包: for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...
Linux --进程控制
本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...
iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈
在日常iOS开发过程中,性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期,开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发,但背后往往隐藏着系统资源调度不当…...
LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf
FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...
C++ 设计模式 《小明的奶茶加料风波》
👨🎓 模式名称:装饰器模式(Decorator Pattern) 👦 小明最近上线了校园奶茶配送功能,业务火爆,大家都在加料: 有的同学要加波霸 🟤,有的要加椰果…...
基于江科大stm32屏幕驱动,实现OLED多级菜单(动画效果),结构体链表实现(独创源码)
引言 在嵌入式系统中,用户界面的设计往往直接影响到用户体验。本文将以STM32微控制器和OLED显示屏为例,介绍如何实现一个多级菜单系统。该系统支持用户通过按键导航菜单,执行相应操作,并提供平滑的滚动动画效果。 本文设计了一个…...
