当前位置: 首页 > news >正文

永结无间Ⅸ--你不需要LLM Agent

人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。

但您是否考虑过您是否真的需要它?

实际情况是,您不需要 Agentic Architecture,并且最好不要在您的业务中使用 Agentic Architecture。

1 分钟了解 LLM 代理和代理架构

在我深入探讨原因之前,让我们先快速了解一下 LLM 代理的含义。

从语义内核编排的角度来看,人工智能代理是一个模块化抽象,它可以拥有角色,可以响应用户输入执行操作,并且可以轻松地与其他代理通信。来源:微软开发者博客

本质上,Agent可以看作是一个使用LLM设计的自动机,可以执行以下操作:

  • 扮演角色
  • 弄清楚如何完成一项任务
  • 执行任务
  • 做决定
  • 与其他代理商沟通

在代理架构中,您将拥有一大群这样的 LLM 代理,每个代理之间都有直接的沟通渠道,以完成一项复杂的任务。您通常需要植入一个经理角色的代理来确定任务是否已完成,或者您的代理是否会开始无休止地讨论周末计划或生活的意义。


示例:用于生成博客文章的 Agentic 架构

乍一看这听起来非常合乎逻辑。

事实上,大多数团队都是这样运作的。

所以有什么问题?

问题1:为什么你还没有它?

百万美元的创意通常始于解决我们自己的日常痛点。如果我们从未进一步实施它,通常意味着以下一项或多项是正确的:

  • 我们不知道该怎么做。如果你不知道该怎么做,你很可能也不知道它是否已经正确实施。
  • 我们没有时间/资源去做这件事。
  • 我们实际上并不需要它。就像我不需要商用油炸锅来制作一批鸡翅一样。
底线:不要为了使用而使用技术。

如果您的团队已经考虑过一段时间是否需要 Agentic 架构,那么您可能还没有开始开发/采购它。在这种情况下,我建议您坚持下去,不要害怕错过。会有更好的架构/实现。

如果你不相信的话,那我们就继续下一个问题吧。

问题 2:依赖互联网讨论来解决业务问题

LLM 之所以令人惊叹,是因为他们所输入的数据量非常大。

OpenAI 使用以下信息来训练模型:(1) 互联网上公开的信息、(2) 从第三方获得许可的信息,以及 (3) 用户或人类训练师提供的信息。

虽然您可能在网上找到关于银行通常如何进行反洗钱 (AML) 检查的讨论,但您可能无法找到您的竞争对手或客户的竞争对手实际如何经营业务的实际审计线索。

换句话说,如果您想使用 LLM 代理来自动化您的业务流程,那么您将陷入这两个选项之间:

  • 利用 Reddit 上的网络传闻来经营你的企业
  • 使用精心策划的数据集来微调你自己的 LLM
LLM 微调值得在单独的博客文章中介绍。您和您的企业可能需要针对不同的业务流程微调多个模型。在服用红色药丸之前,请确保您已为这一旅程做好准备。

您可能会说,对于业务关键性较低且价值较低的任务,LLM 代理仍然是有效的选择。但在那时,当您可以直接将 LLM 与云提供商一起使用时,是否仍然值得投资设置和采用该框架?

问题 3:以创造力的名义将业务流程转变为掷骰子

大多数大模型语言项目都无法解决突破性的问题

是的,LLM 已被用于帮助探索核聚变的可能性。

但让我们现实一点,如果您正在考虑使用 LLM 代理来自动化部分业务流程,那么这些流程可能是您和您的团队以前执行过的。这意味着有一个协议/程序需要遵循,或者有完成这些任务的方法。

我们需要问自己的问题是:在执行任务时,我们真的需要 LLM 的创造力吗?或者我们真的希望 LLM 遵循以前的任务完成方式,并在此过程中的每个步骤中自动生成文本/图像?

如果我们真的想让 LLM 代理弄清楚如何执行任务,我们可能会看到每次执行的审计跟踪都富有创意。执行顺序会有所不同,中间输出格式可能不一致,有时,代理甚至可能需要很多轮才能获得不令人满意的结果。曾经清晰的协议将变得富有创意或统计上不可预测。

如果计划开始将 GenAI 更大规模地整合到业务中,那么让 LLM 按照规则行事通常会产生更可审计、调试和稳定的结果。如果是这样的话,LLM 代理会带来什么好处呢?我们不妨剪掉翅膀,选择 LLM 管道。

潜在解决方案:大模型语言(LLM) 管道

如果说数据科学的炒作教会了我们什么,那就是操作化的重要性。如果没有办法将尖端分析/技术集成到现有系统/流程中,那么一旦热潮消退,你就会发现自己陷入巨大的技术债务和孤岛之中。


尽管各种周期性炒作仍在继续,但数据工程、DevOps 和 MLOps 始终保持相关性,原因如下:它们都与透明度、稳健性和可靠性有关。我们也应该以这种方式考虑 LLM 的采用。

将你的 LLM 代理计划转换为经过充分记录和测试的 LLM 管道,每个管道包含原子步骤,每个步骤都具有定义的输入和输出数据结构。这让你能够真正思考在 GenAI 成为现实之前你是如何执行任务的。这还允许你调试 LLM 管道出错的地方。这最终将把原本庞大的 LLM 代理黑匣子缩小为概率口袋,因为你已经定义了高级工作流程和执行顺序。

​​​​​​​欢迎前往我们的公众号,时事资讯​​​​

创作不易,觉得不错的话,点个赞吧!!!

相关文章:

永结无间Ⅸ--你不需要LLM Agent

人们将目光锁定在下一个闪亮的事物上。FOMO 是人性的一部分。这也适用于企业。就像数据科学成为每个企业分析功能的热潮一样,Agentic Architecture 是大多数 AI 雷达上的热门目标。 但您是否考虑过您是否真的需要它? 实际情况是,您不需要 A…...

Simulink|基于粒子群算法的永磁同步电机多参数辨识

目录 主要内容 模型研究 结果一览 下载链接 主要内容 仿真程序参考文献《改进粒子群算法的永磁同步电机多参数辨识》,采用粒子群算法与simulink模型结合的方式,对永磁同步电机进行多参数辨识。程序以定子绕组电阻、d轴电感、q轴电感和永磁…...

程序如何自动点击亚马逊商户后台的“邀请评论”按钮

要在亚马逊上自动点击“邀请评论”按钮,可以使用自动化脚本来实现。由于你希望自动化操作,我提供一个示例代码,使用 Selenium WebDriver 来执行这个任务。Selenium 是一个流行的浏览器自动化工具,能够模拟用户操作,例如…...

大模型算法面试题(十八)

本系列收纳各种大模型面试题及答案。 1、P-tuning v2 思路、优缺点是什么 P-tuning v2是清华大学自然语言处理实验室(THUDM)等研究机构提出的一种新的预训练模型优化方法,主要关注如何通过动态构建任务相关的提示序列来引导预训练模型进行更…...

手机在网状态接口如何对接?(二)

一、什么是手机在网状态? 传入手机号码,查询该手机号的在网状态,返回内容有正常使用、停机、在网但不可用、不在网(销号/未启用/异常)、预销户等多种状态。 二、手机在网状态使用场景? 1.用户验证与联系…...

力扣-3232. 判断是否可以赢得数字游戏

给你一个 正整数 数组 nums。 Alice 和 Bob 正在玩游戏。在游戏中,Alice 可以从 nums 中选择所有个位数 或 所有两位数,剩余的数字归 Bob 所有。如果 Alice 所选数字之和 严格大于 Bob 的数字之和,则 Alice 获胜。 如果 Alice 能赢得这场游…...

Table SQL connectors以及FileSystem、JDBC connector

目录 Flink支持的连接器 如何使用连接器 FileSystem SQL Connector 文件格式 分区文件 Source 目录监控 元数据 Streaming Sink 滚动策略 文件合并 JDBC SQL Connector 依赖 如何创建JDBC表 连接器配置 案例 pom依赖 代码 测试 Flink的Table API和SQL…...

Animate软件基础:“分散到图层”创建的新图层

FlashASer:AdobeAnimate2021软件零基础入门教程https://zhuanlan.zhihu.com/p/633230084 FlashASer:实用的各种Adobe Animate软件教程https://zhuanlan.zhihu.com/p/675680471 FlashASer:Animate教程及作品源文件https://zhuanlan.zhihu.co…...

ffmpeg命令-Windows下常用最全

查询命令 参数 说明 -version 显示版本。 -formats 显示可用的格式(包括设备)。 -demuxers 显示可用的demuxers。 -muxers 显示可用的muxers。 -devices 显示可用的设备。 -codecs 显示libavcodec已知的所有编解码器。 -decoders 显示可用…...

反序列化漏洞靶机实战-serial

一.安装靶机 下载地址为https://download.vulnhub.com/serial/serial.zip,安装好后开启靶机,这里并不需要我们去登录,直接扫描虚拟机nat模式下c网段的ip,看看哪个的80端口开放,然后直接去访问 二.查找cookie 访问靶…...

医疗器械产品没有互联网连接,就不适用于网络安全要求吗?

医疗器械产品是否不适用于网络安全要求,需要考虑产品是否具有网络连接功能以进行电子数据交换或远程控制,以及是否采用储存媒介进行电子数据交换。详细解析如下: 一、医疗器械的网络安全要求不仅限于互联网连接 数据交换接口:医疗…...

可视掏耳勺安全吗?独家揭示六大风险弊病!

很多人习惯在洗漱完顺手拿一根棉签掏耳朵,但是棉签的表面直径大且粗糙,不易将耳朵深处的耳垢挖出,耳垢堆积在耳道深处长时间不清理会导致堵塞耳道,引起耳鸣甚至感染。而可视掏耳勺作为一种新型的挖耳工具,它的安全性也…...

JavaScript 变量声明var、let、const

在 JavaScript 中,var、let和const是用于声明变量的关键字。 let和const是JavaScript里相对较新的变量声明方式。 let用法类似于var,但是所声明的变量,只在let命令所在的代码块内有效。 const声明一个只读的常量。一旦声明,常量的…...

ipvlan: operation not supported 导致的POD不断重启

情况描述 接到反馈有一台虚拟机HA迁移了,需要检查一下上面业务是否正常,由于是K8S node节点,正常情况下重启会自动恢复的,不过抱着严谨的态度,上去看了一眼。 问题:发现docker运行正常,但是业…...

组蛋白乳酸化和RNA甲基化如何联动?请大数据把这个思路推给科研人

在细胞生物学中,基因表达调控是决定细胞功能与命运的核心过程之一。组蛋白作为修饰性蛋白,在调控基因转录中起着至关重要的作用。近年来,科学家们发现,组蛋白的多种化学修饰(如甲基化、乙酰化、磷酸化等)影…...

操作文件-Path

Java操作文件-Path Paths 参数说明 first:必选参数,表示路径的第一个组件。more:可选参数,表示路径的其他组件,可以传入多个。 创建路径对象 // 创建一个表示当前工作目录的Path对象 Path currentPath Paths.get…...

RAC(Teamcenter )开发,Bom行解包和打包的方法

1、打包 UnpackAllAction allAction new UnpackAllAction((AbstractBOMLineViewerApplication) currentApplication, "packAllAction"); new Thread(allAction).start();2、解包 UnpackCommand command new UnpackCommand(bomLine); command.executeModal();3、注…...

log4j2漏洞练习

log4j2 是Apache的一个java日志框架,我们借助它进行日志相关操作管理,然而在2021年末log4j2爆出了远程代码执行漏洞,属于严重等级的漏洞。apache log4j通过定义每一条日志信息的级别能够更加细致地控制日志生成地过程,受影响的版本…...

OpenEuler安装部署教程

目录 OpenEuler安装部署教程 MobaXterm一款全能的远程工具 yum安装软件 vim编辑器(了解) 防火墙 常用命令 网络工具netstat & telnet 进程管理工具top ps 磁盘free、fdisk 用户、组(了解) 权限(了解&am…...

Canto - hackmyvm

简介 靶机名称:Canto 难度:简单 靶场地址:https://hackmyvm.eu/machines/machine.php?vmCanto 本地环境 虚拟机:vitual box 靶场IP(Canto):192.168.130.53 windows_IP:192.1…...

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...

线程与协程

1. 线程与协程 1.1. “函数调用级别”的切换、上下文切换 1. 函数调用级别的切换 “函数调用级别的切换”是指:像函数调用/返回一样轻量地完成任务切换。 举例说明: 当你在程序中写一个函数调用: funcA() 然后 funcA 执行完后返回&…...

dedecms 织梦自定义表单留言增加ajax验证码功能

增加ajax功能模块&#xff0c;用户不点击提交按钮&#xff0c;只要输入框失去焦点&#xff0c;就会提前提示验证码是否正确。 一&#xff0c;模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

什么是库存周转?如何用进销存系统提高库存周转率?

你可能听说过这样一句话&#xff1a; “利润不是赚出来的&#xff0c;是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业&#xff0c;很多企业看着销售不错&#xff0c;账上却没钱、利润也不见了&#xff0c;一翻库存才发现&#xff1a; 一堆卖不动的旧货…...

华为OD机试-食堂供餐-二分法

import java.util.Arrays; import java.util.Scanner;public class DemoTest3 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseint a in.nextIn…...

项目部署到Linux上时遇到的错误(Redis,MySQL,无法正确连接,地址占用问题)

Redis无法正确连接 在运行jar包时出现了这样的错误 查询得知问题核心在于Redis连接失败&#xff0c;具体原因是客户端发送了密码认证请求&#xff0c;但Redis服务器未设置密码 1.为Redis设置密码&#xff08;匹配客户端配置&#xff09; 步骤&#xff1a; 1&#xff09;.修…...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

用机器学习破解新能源领域的“弃风”难题

音乐发烧友深有体会&#xff0c;玩音乐的本质就是玩电网。火电声音偏暖&#xff0c;水电偏冷&#xff0c;风电偏空旷。至于太阳能发的电&#xff0c;则略显朦胧和单薄。 不知你是否有感觉&#xff0c;近两年家里的音响声音越来越冷&#xff0c;听起来越来越单薄&#xff1f; —…...

破解路内监管盲区:免布线低位视频桩重塑停车管理新标准

城市路内停车管理常因行道树遮挡、高位设备盲区等问题&#xff0c;导致车牌识别率低、逃费率高&#xff0c;传统模式在复杂路段束手无策。免布线低位视频桩凭借超低视角部署与智能算法&#xff0c;正成为破局关键。该设备安装于车位侧方0.5-0.7米高度&#xff0c;直接规避树枝遮…...

Oracle11g安装包

Oracle 11g安装包 适用于windows系统&#xff0c;64位 下载路径 oracle 11g 安装包...