当前位置: 首页 > article >正文

YOLO-Master 与 YOLO 开始朴

AI Agent 时代的沙箱需求从 Copilot 到 Agent执行能力的质变在生成式 AI 的早期阶段应用主要以“Copilot”形式存在AI 仅作为辅助生成建议。然而随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter现为 Advanced Data Analysis的出现AI 开始扮演“Agent”的角色。Agent 被赋予了目标并能自主规划步骤、使用工具来达成目标。这种质变的核心在于代码执行Code Execution。为了回答“分析这层楼的销售数据并绘制趋势图”这样的请求LLM 不再只是生成一段 Python 代码文本而是需要在一个真实的 Python 环境中运行这段代码并获取绘图结果。同样为了“帮我预订一张去东京的机票”Agent 可能需要在一个无头浏览器Headless Browser中模拟用户点击。不可信代码的安全隐患当 LLM 生成代码并执行时这段代码在本质上是不可信的Untrusted。如果直接在应用服务器或用户的本地设备上运行将面临灾难性的安全风险系统破坏AI 生成的代码可能无意或恶意地包含 rm -rf / 等破坏性指令或者修改关键系统配置文件。数据泄露代码可能尝试读取环境变量中的 API Key或者扫描内网数据库将敏感数据发送到外部服务器。资源耗尽死循环或内存泄漏代码可能导致宿主机崩溃影响其他租户的服务。网络攻击恶意 Prompt 注入Prompt Injection可能诱导 AI 将执行环境作为跳板Jump Box对内部网络发起 DDoS 攻击或端口扫描。Agent 场景面临的独特挑战除了基础的安全性AI Agent 的交互特性还给沙箱环境带来了前所未有的工程挑战这也是传统沙箱如简单的 Docker 容器或虚拟机难以应对的状态保持与传统的“请求-响应”模式不同Agent 往往需要进行多轮对话。上一轮定义的变量如 df load_data()需要在下一轮df.plot()中继续可用。这就要求沙箱环境必须具备上下文记忆能力而非每次请求都重置环境。极速启动用户无法忍受每次交互都等待数秒甚至数十秒的虚拟机启动时间。为了保证流畅的对话体验Time to First Token沙箱必须具备毫秒级的冷启动能力。环境依赖多样性不同的 Agent 任务可能需要完全不同的依赖库如 Pandas、Scipy 用于数据分析Puppeteer 用于网页操作。沙箱需要支持灵活的自定义镜像或动态依赖加载同时不能影响启动速度。资源成本控制Agent 的调用往往具有稀疏性和突发性例如一天只用几次但一次用很久。长期运行独占的虚拟机VM成本高昂且资源利用率低而传统的 FaaS 虽然便宜但往往缺乏状态保持能力。如何在低成本和高性能之间找到平衡点是一个巨大的挑战。因此构建一个沙箱Sandbox——一个与宿主机、内网以及其他用户数据严格隔离同时具备高性能、低成本、有状态的封闭执行环境——成为了 AI Agent 沙箱落地的前提条件。AgentRun Sandbox专为 Agent 设计的工程化方案为了解决上述挑战我们推出了 AgentRun Sandbox。这是一个以高代码为核心开放生态、灵活组装的一站式 Agentic AI 基础设施平台。AgentRun 并非从零构建传统的虚拟机集群而是基于阿里云函数计算FC这一强大的 Serverless 底座构建。通过充分利用 Serverless 的按需付费、极致弹性以及免运维NoOps 特性AgentRun 解决了一直困扰沙箱领域的成本与效率难题并在此基础上通过工程化封装提供了面向 Agent 场景的专业能力。为什么选择函数计算作为 Sandbox Infra在构建 Agent 沙箱时我们坚定地选择了函数计算FC作为底层基础设施这主要基于以下核心优势的考量强安全隔离 沙箱的核心诉求是安全。函数计算底层采用神龙裸金属与 RunD 安全容器技术每个执行环境都运行在独立的 MicroVM 中。这种基于虚拟化技术的内核级隔离相比传统的 Docker 容器隔离具有更高的安全性能有效防止恶意代码逃逸为不可信代码执行提供了坚实屏障。极致弹性与冷启动优化 Agent 的调用往往具有突发性。函数计算具备毫秒级的弹性伸缩能力结合 RunD 技术对启动速度的极致优化使得沙箱能够在数秒甚至毫秒内完成创建和启动。这不仅满足了高并发场景下的需求也保证了 Agent 交互的流畅性避免了传统虚拟机启动慢带来的延迟感。成本效益自建虚拟机集群通常需要为峰值流量预留资源导致低谷期资源浪费。函数计算采用按需付费Pay-as-you-go模式且 AgentRun 利用了 FC 的空闲自动回收机制真正做到了“有请求才计费”。对于稀疏调用的 Agent 场景这种模式能显著降低基础设施成本。免运维 基于 Serverless 架构开发者无需关心底层服务器的操作系统补丁、网络配置及集群维护。AgentRun 团队可以将精力集中在沙箱的核心逻辑与业务体验上而非底层基础设施的繁琐运维。会话能力函数计算围绕 AI Agent Sandbox 场景推出了会话亲和、隔离以及管理能力。在一次会话生命周期内相同会话的请求均会被亲和路由到同一个实例中并独占该实例保证了会话交互的连续性、上下文完整性以及多租安全性同时提供完整的管理接口来主动对会话生命周期进行控制降低了开发门槛。AgentRun 的核心运行机制传统的 Serverless 通常是无状态的难以满足 Code Interpreter 这类需要上下文保持的场景。AgentRun 借助函数计算的会话产品能力在无状态的计算底座上构建了有状态、会话级的沙箱体验。1. 沙箱请求亲和AgentRun 允许开发者显式地创建一个具有生命周期的执行环境解决了传统 Serverless“用完即走”导致的上下文丢失问题。会话亲和AgentRun 依赖函数计算会话亲和机制。当开发者创建沙箱后AgentRun 会维护一个唯一的 SessionID。后续所有携带该 ID 的请求都会被精准路由到同一个底层的计算实例。这意味着用户在第一步定义的 df pd.read_csv(...) 对象在第二步 df.plot() 时依然存在于内存中完美复刻本地开发体验。MCP 协议原生支持针对模型上下文协议Model Context Protocol, MCPAgentRun 提供了 MCP SSE 及 MCP Streamable HTTP 会话亲和支持。AgentRun 可以直接作为 MCP 网关让 LLM 与外部工具的交互更加顺滑。2. 多层次安全隔离在多租户 SaaS 平台中安全性是 AgentRun 的基石。计算隔离AgentRun 利用底层基础设施的神龙裸金属与 RunD 安全容器技术确保每个沙箱实例在内核级别进行隔离。通过强制将会话并发度设置为 1AgentRun 保证租户 A 的进程空间、内存数据与租户 B 物理分离防止容器逃逸。网络隔离网络隔离完全由用户控制。用户可以根据安全需求灵活配置选择开启或关闭沙箱的公网访问权限或者将沙箱接入指定的 VPC 网络环境从而在满足业务连通性的同时防止恶意代码对内网发起攻击。3. 灵活的生命周期控制AgentRun 通过函数计算的会话能力接管了底层计算资源的生命周期为上层应用提供精细化管理自动闲置回收Idle Timeout为了通过 Serverless 架构降低成本AgentRun 支持设置空闲超时例如 5 分钟。如果 Agent 在这段时间内没有新指令底层实例会自动销毁并停止计费完美适配 AI 交互“突发性强、稀疏度高”的特点。状态暂停与恢复即将上线针对长时间的任务间歇AgentRun 能够将沙箱的内存与磁盘状态快照保存在用户回归时通过快照快速恢复现场既节省成本又保留了上下文。4. 会话粒度存储隔离即将上线代码执行需要隔离数据存储更需要隔离。AgentRun 创新性地规划了会话粒度存储粘性。动态绑定AgentRun 允许用户为每个沙箱环境中动态分配一个存储挂载点的专属子目录。逻辑沙箱通过底层的挂载技术沙箱内部只能看到属于自己的 /workspace物理上无法访问其他租户的文件如 ../../tenant-b/secret.txt从文件系统层面根除了数据交叉风险。AgentRun 开箱即用的沙箱能力AgentRun 不仅提供了底层隔离环境还预置了经过工程化调优的标准化模版让开发者开箱即用Code Interpreter代码解释器预装 Python/Node.js/Java 等环境支持文件上传下载、数据分析、图表绘制及命令行操作。Browser User浏览器沙箱提供基于 CDP over WebSocket 协议的浏览器环境兼容 Puppeteer / Playwright让 Agent 能够安全地访问互联网进行网页操作。All In One集成了代码解释器与浏览器环境的全能型沙箱满足复杂 Agent 任务需求。这些模版镜像具备高度的灵活性AgentRun 未来将开放镜像定义允许用户基于标准镜像定制私有依赖库或安全策略。AgentRun 沙箱架构详解image.pngAgentRun 网关这是 AgentRun 的门户负责接收来自 AI Agent如 LangChain 应用、ChatGPT Plugin的 HTTP 请求除了标准的身份验证、鉴权以及协议转换如将 HTTP 转为 WebSocket之外其核心能力便是沙箱管理以及沙箱请求路由的功能它屏蔽了底层 Serverless 基础设施的复杂性实现了如下能力沙箱管理管理沙箱资源维护业务层沙箱 ID 与底层计算资源 SessionID 的映射关系状态维护监控沙箱的活跃状态基于沙箱超时配置以及底层资源情况及时对状态进行更新资源调度根据用户指定的计算规格CPU、Memory向底层申请相应的资源。函数计算沙箱环境主要由函数计算作为底层算力来承载沙箱的运行。AgentRun 利用函数计算提供的极致弹性能力实现在分钟内启动成三万个独立的沙箱环境每个环境都运行在独立的 MicroVM 中搭配自研开箱即用的沙箱镜像模版在功能以及性能上为用户提供了双重保障。典型工作流从指令到结果以“用户让 Agent 根据上传的 Excel 文件绘制图表”为例AgentRun 的工作流程如下。阶段一模板创建用户请求Agent 接收到用户指令后由 LLM 决策使用 Python 来实现该需求。Agent 工具调用AI Agent 会向 AgentRun 网关发送 Code Interpreter 沙箱模板的创建请求。模板创建AgentRun 网关会调用函数计算接口创建一个 Code 沙箱模板函数镜像配置为前文提到的自研 Code Interpreter 沙箱模板该函数需要同时配置会话亲和以及会话隔离。阶段二沙箱创建Agent 工具调用模板创建完成后Agent 继续进行沙箱创建创建时传入已有的模板 ID标识沙箱实例运行时的配置和镜像沙箱创建AgentRun 收到沙箱创建请求后会调用 FC 的 CreateSession 接口来创建一个沙箱实例该沙箱会有一个合适的闲置超时时间最长可存活 24h创建完成AgentRun 会保存 FC 返回的会话 ID并生成沙箱业务 ID 与之对应最终将沙箱业务 ID 返回给用户阶段三任务执行上传文件Agent 通过 Code Interpreter 的文件上传接口将 Excel 文件上传。若想将该文件持久化可以在创建沙箱时配置持久化存储 NAS将其挂到沙箱中并将文件上传到 NAS 挂载的目录上。绘制图表Agent 生成代码 import pandas as pd; df pd.read_excel(data.xlsx)并调用 Code Interpreter 的 run_code 接口执行代码。会话亲和Agent 所有发往 Code Interpreter 的请求中都必须带上对应的沙箱 ID 才能保证请求都路由到同一个沙箱实例。内存驻留代码执行完毕变量 df 驻留在内存中.二次代码执行Agent 根据数据列名生成绘图代码 df.plot()。再次发送代码运行请求上下文复用请求再次到达同一实例直接使用内存中的 df 对象进行绘图生成图片文件。结果回传图片被写入 NAS下载链接返回给 Agent。阶段四资源销毁空闲检测Agent 完成任务不再发送请求。自动回收达到 SessionIdleTimeout如 5 分钟后函数计算会自动销毁该沙箱实例此时除了持久化到 NAS 上的数据其余环境相关数据均被销毁。文件回收如果 NAS 上的文件是会话隔离的当用户会话结束后NAS 上文件需要进行主动或者定时自动清除。工作时序图image.pngAgentRun 的核心设计原则AgentRun 的工程化实践遵循以下五大核心原则这构成了其安全、高效、可扩展的基石原则一配置即代码AgentRun 将沙箱环境定义环境变量、资源规格、健康检查等封装为标准化模版。这种设计实现了沙箱配置的版本化管理使得 Agent 环境可以像代码一样进行复制和回滚。原则二会话即沙箱AgentRun 将“会话”作为沙箱的唯一实体。通过 SessionID 绑定底层的计算实例与上下文状态实现了真正的按需分配与状态保持。沙箱的创建与销毁完全独立于底层物理设施对用户透明。原则三生命周期可编程AgentRun 不仅提供创建Create和删除Delete接口还引入了“暂停”、“恢复”和“自动超时”机制。这种可编程性让上层应用能根据业务价值最大化资源利用率实现成本与性能的最优平衡。原则四网络接入标准化AgentRun 抹平了底层网络的差异提供标准化的 HTTP/WebSocket 接口并支持 Server-Sent EventsSSE。无论底层如何升级上层 Agent 沙箱始终通过标准的 Header 或 Cookie 携带 SessionID 进行交互降低了集成复杂度。原则五存储隔离细粒度化即将上线AgentRun 不仅支持模版粒度的文件系统共享同时也能够配置沙箱粒度目录级动态挂载。每个沙箱单独挂载一个目录从根源上杜绝了多租户环境下的数据越权访问风险。总结与展望AgentRun Sandbox 是 Serverless 技术在 AI Agent 领域的最佳工程化实践。碧史乘僚

相关文章:

YOLO-Master 与 YOLO 开始朴

AI Agent 时代的沙箱需求 从 Copilot 到 Agent:执行能力的质变 在生成式 AI 的早期阶段,应用主要以“Copilot”形式存在,AI 仅作为辅助生成建议。然而,随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter(现为 Advan…...

微服务可观测性建设

微服务可观测性建设:打造高效运维的基石 在数字化转型的浪潮中,微服务架构凭借其灵活性和可扩展性成为企业技术演进的主流选择。随着服务数量的激增和分布式系统的复杂性提升,传统的监控手段已难以满足运维需求。微服务可观测性建设应运而生…...

使用 Alertmanager 配置智能告警

在微服务与云原生架构盛行的当下,系统监控与告警管理成为保障业务稳定性的关键环节。Alertmanager作为Prometheus生态中的核心告警组件,通过灵活的配置和智能路由策略,能够将海量告警转化为精准的行动指令,帮助运维团队快速响应问…...

RGBW色彩转换器:嵌入式系统高保真白光增强方案

1. RGBW色彩转换器技术解析:面向嵌入式显示系统的高保真白光增强方案1.1 工程背景与设计动因在LED显示与智能照明嵌入式系统中,RGB三色LED驱动已成主流,但其在高亮度白光输出场景下存在固有缺陷:当需呈现高亮度中性白(…...

CopyOnWriteArrayList 实现原理

什么是CopyOnWriteArrayList?CopyOnWriteArrayList 是 Java 并发包 (java.util.concurrent) 中一个非常独特且重要的线程安全集合。与 Collections.synchronizedList 不同,CopyOnWriteArrayList 不依赖外部同步,而是通过内部机制实现并发控制…...

ADS1220_WE库详解:工业级24位ADC驱动与高精度传感器采集实现

1. ADS1220_WE 库深度技术解析:面向工业级高精度采集的 24 位四通道 ADC 驱动实现1.1 芯片级定位与工程价值ADS1220 是德州仪器(TI)推出的低功耗、高精度、24 位 Δ-Σ 型模数转换器,专为工业传感器信号调理场景设计。其核心价值不…...

VL6180X_WE中断驱动库:工业级ToF传感器低功耗实时方案

1. VL6180X_WE 库概述:面向工业级应用的增强型 ToF 传感器驱动 VL6180X_WE 是一款专为意法半导体(STMicroelectronics)VL6180X 飞行时间(Time-of-Flight, ToF)传感器设计的嵌入式 C 驱动库。该库并非从零构建&#xf…...

Adafruit ZeroI2S:面向Cortex-M0+/M4的零拷贝I2S音频驱动

1. 项目概述Adafruit ZeroI2S 是专为基于 SAMD21(Arduino Zero / Adafruit Metro M0 Express / Feather M0 Express)与 SAMD51(Adafruit Metro M4 Express / Feather M4 Express / ItsyBitsy M4 Express)微控制器的 Arduino 兼容开…...

Linux I/O 演进史:从管道到零拷贝,一篇串起个服务端核心原语撑

前言 在使用 kubectl get $KIND -o yaml 查看 k8s 资源时,输出结果中包含大量由集群自动生成的元数据(如 managedFields、resourceVersion、uid 等)。这些信息在实际复用 yaml 清单时需要手动清理,增加了额外的工作量。 使用 kube…...

-:RAG 入门-向量存储与企业级向量数据库 milvus匾

起因是我想在搞一些操作windows进程的事情时,老是需要右键以管理员身份运行,感觉很麻烦。就研究了一下怎么提权,顺手瞄了一眼Windows下用户态权限分配,然后也是感谢《深入解析Windows操作系统》这本书给我偷令牌的灵感吧&#xff…...

代码规范与团队协作效率

代码规范与团队协作效率:提升开发质量的关键 在软件开发中,代码规范与团队协作效率是决定项目成败的重要因素。统一的代码规范能减少维护成本,提高可读性,而高效的团队协作则能加速交付周期,降低沟通成本。尤其在多人…...

路由权限管理

路由权限管理:构建安全高效的前端架构 在现代前端开发中,路由权限管理是保障系统安全性和用户体验的核心环节。随着单页应用(SPA)的普及,前端路由的复杂性逐渐增加,如何动态控制用户访问权限成为开发者必须…...

使用 Python 设置 Excel 表格的行高与列宽

在技术领域,我们常常被那些闪耀的、可见的成果所吸引。今天,这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力,让我们得以一窥未来的轮廓。然而,作为在企业一线构建、部署和维护复杂系统的实践者,我们深知…...

计算机毕业设计:Python城市空气质量智能监测与预测平台 Django框架 可视化 数据分析 Prophet时间序列 大数据 大模型 深度学习(建议收藏)✅

博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与…...

Pharma RAG:企业知识库的架构革命

一、为什么制药行业的知识库问题比你想的严重 一名医学写作(Medical Writer)在准备 CTD 5.3.5.1(临床研究报告摘要)时,需要交叉引用: 3 份 Phase III CSR(临床研究报告),每份 800–2000 页 协议书修正案 5 个版本 统计分析报告(SAP)+ 列表表格(TLF)共 1200 张 竞…...

AI Agent Pharma:从 Copilot 到 Autonomous Pharma

当药物研发遇上 AI Agent,不是锦上添花,是游戏规则的重写。本文拆解架构、给出可跑的代码、聊聊那些 PPT 不会告诉你的坑。在这里插入图片描述 一、我为什么在写这篇文章 大概是 2023 年末,我们团队拿到了一个任务:帮某中型药企的研发部门"引入 AI"。预算不小,…...

CKKS 同态加密数学基础推导信

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库,以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中,为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具(如 iflow …...

从识别到创作:Hunyuan OCR与Z-Image-Turbo在NPU平台上的协同进化,重塑AI视觉工作流

1. 当OCR遇上图像生成:Hunyuan与Z-Image-Turbo的化学反应 第一次看到Hunyuan OCR和Z-Image-Turbo在同一个NPU平台上跑起来时,我正忙着处理一堆杂乱的产品说明书。这些文档有扫描件、手机拍摄的模糊照片,甚至还有手写批注的PDF。传统方案需要…...

Linpeas使用教程

在Kali Linux的权限提升工具库中,Linpeas(Linux Privilege Escalation Awesome Script)是一款专注于Linux系统本地权限提升的自动化脚本工具,隶属于“PEASS(Privilege Escalation Awesome Scripts SUITE)”…...

思博伦TCL并发测试避坑指南:HTTP/1.1配置与端口关联的最佳实践

思博伦TCL并发测试避坑指南:HTTP/1.1配置与端口关联的最佳实践 在性能测试领域,思博伦(Spirent)的TCL测试工具因其强大的功能和灵活性而备受推崇。然而,正是这种灵活性也带来了配置上的复杂性,特别是在HTTP…...

PEASS使用教程

在Kali Linux的权限提升工具生态中,PEASS(Privilege Escalation Awesome Scripts SUITE,权限提升优秀脚本套件)是一款覆盖Linux与Windows双平台的自动化权限提升扫描工具集。它通过整合Linpeas(Linux平台)与…...

winpeas使用教程

winpeas是PEASS(Privilege Escalation Awesome Scripts SUITE,权限提升优秀脚本套件)中的Windows平台专用模块,全称为Windows Privilege Escalation Awesome Script。它是一款专为Windows系统设计的自动化权限提升扫描工具&#x…...

Lynis使用教程

在Kali Linux的系统安全审计工具库中,Lynis是一款开源、跨平台的自动化安全审计工具,核心定位是“Linux/Unix系统深度安全扫描与合规性检查工具”。它通过对系统内核、软件配置、用户权限、服务状态、日志策略等维度进行全面检测,识别潜在的安…...

全球近7.6万台WatchGuard Firebox设备暴露高危漏洞CVE-2025-9242,远程攻击者无需认证即可执行代码

全球约有7.6万台WatchGuard Firebox网络安全设备暴露在公网上,且尚未修复高危漏洞CVE-2025-9242。远程攻击者无需任何身份验证,即可利用该漏洞执行恶意代码,风险极高。 WatchGuard Firebox T145 Network Security/Firewall Appliance - WGT14…...

数电小白必看:最小项在逻辑函数中的神奇作用(附实例解析)

数电小白必看:最小项在逻辑函数中的神奇作用(附实例解析) 数字电路设计就像搭积木,而最小项就是其中最基础的"乐高颗粒"。想象一下,你正在设计一个智能家居控制系统——如何用最简洁的逻辑实现"当有人移…...

PCL Viewer隐藏功能揭秘:利用ALT组合键实现立体显示和窗口管理的进阶技巧

PCL Viewer隐藏功能揭秘:利用ALT组合键实现立体显示和窗口管理的进阶技巧 在三维点云数据处理领域,PCL Viewer作为Point Cloud Library的标准可视化工具,其基础功能已被广泛使用。然而,许多用户仅停留在简单的视图旋转和缩放操作上…...

LM1875功放DIY避坑指南:从看懂官方电路图到解决自激发热(附元件选择心得)

LM1875功放DIY实战手册:从电路设计到疑难排解全攻略 每次打开音响,那种温暖而有力的声音总能瞬间填满整个房间。作为DIY爱好者,亲手打造一台属于自己的功放不仅是技术的挑战,更是一种独特的成就感。LM1875这颗经典的音频功放芯片&…...

arcgis-利用融合与排序工具高效提取图斑面积最大属性值

1. 为什么需要提取图斑面积最大属性值 在GIS数据处理中,经常会遇到这样的需求:我们需要从复杂的图斑数据中找出每个区域占面积最大的属性值。比如在国土调查中,一个地块可能包含多种房屋质量等别,但我们需要确定该地块最主要的房…...

AI原生A/B测试框架设计实战(从LLM服务灰度到多模态策略归因):Meta/Netflix/阿里内部验证的7层隔离架构首次公开

第一章:AI原生A/B测试框架的核心范式演进 2026奇点智能技术大会(https://ml-summit.org) 传统A/B测试以静态页面与确定性分流为基石,而AI原生框架将实验设计、流量分配、指标归因与模型反馈深度耦合,形成闭环自适应系统。其核心范式从“假设…...

雨课堂英语听说期末考后复盘:那些容易丢分的听力填空长难句怎么破?(附2024.12真题片段分析)

破解英语听力填空长难句:从真题分析到精听实战 刚走出考场的你,是否对听力填空题里那些"听懂了却填不对"的长难句耿耿于怀?当录音中闪过"physicial active"、"two times as much water"这类复杂表达时&#xf…...