当前位置：首页 > article >正文

YOLO-Master 与 YOLO 开始吭

article 2026/6/2 7:15:19

AI Agent 时代的沙箱需求从 Copilot 到 Agent执行能力的质变在生成式 AI 的早期阶段应用主要以“Copilot”形式存在AI 仅作为辅助生成建议。然而随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter现为 Advanced Data Analysis的出现AI 开始扮演“Agent”的角色。Agent 被赋予了目标并能自主规划步骤、使用工具来达成目标。这种质变的核心在于代码执行Code Execution。为了回答“分析这层楼的销售数据并绘制趋势图”这样的请求LLM 不再只是生成一段 Python 代码文本而是需要在一个真实的 Python 环境中运行这段代码并获取绘图结果。同样为了“帮我预订一张去东京的机票”Agent 可能需要在一个无头浏览器Headless Browser中模拟用户点击。不可信代码的安全隐患当 LLM 生成代码并执行时这段代码在本质上是不可信的Untrusted。如果直接在应用服务器或用户的本地设备上运行将面临灾难性的安全风险系统破坏AI 生成的代码可能无意或恶意地包含 rm -rf / 等破坏性指令或者修改关键系统配置文件。数据泄露代码可能尝试读取环境变量中的 API Key或者扫描内网数据库将敏感数据发送到外部服务器。资源耗尽死循环或内存泄漏代码可能导致宿主机崩溃影响其他租户的服务。网络攻击恶意 Prompt 注入Prompt Injection可能诱导 AI 将执行环境作为跳板Jump Box对内部网络发起 DDoS 攻击或端口扫描。Agent 场景面临的独特挑战除了基础的安全性AI Agent 的交互特性还给沙箱环境带来了前所未有的工程挑战这也是传统沙箱如简单的 Docker 容器或虚拟机难以应对的状态保持与传统的“请求-响应”模式不同Agent 往往需要进行多轮对话。上一轮定义的变量如 df load_data()需要在下一轮df.plot()中继续可用。这就要求沙箱环境必须具备上下文记忆能力而非每次请求都重置环境。极速启动用户无法忍受每次交互都等待数秒甚至数十秒的虚拟机启动时间。为了保证流畅的对话体验Time to First Token沙箱必须具备毫秒级的冷启动能力。环境依赖多样性不同的 Agent 任务可能需要完全不同的依赖库如 Pandas、Scipy 用于数据分析Puppeteer 用于网页操作。沙箱需要支持灵活的自定义镜像或动态依赖加载同时不能影响启动速度。资源成本控制Agent 的调用往往具有稀疏性和突发性例如一天只用几次但一次用很久。长期运行独占的虚拟机VM成本高昂且资源利用率低而传统的 FaaS 虽然便宜但往往缺乏状态保持能力。如何在低成本和高性能之间找到平衡点是一个巨大的挑战。因此构建一个沙箱Sandbox——一个与宿主机、内网以及其他用户数据严格隔离同时具备高性能、低成本、有状态的封闭执行环境——成为了 AI Agent 沙箱落地的前提条件。AgentRun Sandbox专为 Agent 设计的工程化方案为了解决上述挑战我们推出了 AgentRun Sandbox。这是一个以高代码为核心开放生态、灵活组装的一站式 Agentic AI 基础设施平台。AgentRun 并非从零构建传统的虚拟机集群而是基于阿里云函数计算FC这一强大的 Serverless 底座构建。通过充分利用 Serverless 的按需付费、极致弹性以及免运维NoOps 特性AgentRun 解决了一直困扰沙箱领域的成本与效率难题并在此基础上通过工程化封装提供了面向 Agent 场景的专业能力。为什么选择函数计算作为 Sandbox Infra在构建 Agent 沙箱时我们坚定地选择了函数计算FC作为底层基础设施这主要基于以下核心优势的考量强安全隔离沙箱的核心诉求是安全。函数计算底层采用神龙裸金属与 RunD 安全容器技术每个执行环境都运行在独立的 MicroVM 中。这种基于虚拟化技术的内核级隔离相比传统的 Docker 容器隔离具有更高的安全性能有效防止恶意代码逃逸为不可信代码执行提供了坚实屏障。极致弹性与冷启动优化 Agent 的调用往往具有突发性。函数计算具备毫秒级的弹性伸缩能力结合 RunD 技术对启动速度的极致优化使得沙箱能够在数秒甚至毫秒内完成创建和启动。这不仅满足了高并发场景下的需求也保证了 Agent 交互的流畅性避免了传统虚拟机启动慢带来的延迟感。成本效益自建虚拟机集群通常需要为峰值流量预留资源导致低谷期资源浪费。函数计算采用按需付费Pay-as-you-go模式且 AgentRun 利用了 FC 的空闲自动回收机制真正做到了“有请求才计费”。对于稀疏调用的 Agent 场景这种模式能显著降低基础设施成本。免运维基于 Serverless 架构开发者无需关心底层服务器的操作系统补丁、网络配置及集群维护。AgentRun 团队可以将精力集中在沙箱的核心逻辑与业务体验上而非底层基础设施的繁琐运维。会话能力函数计算围绕 AI Agent Sandbox 场景推出了会话亲和、隔离以及管理能力。在一次会话生命周期内相同会话的请求均会被亲和路由到同一个实例中并独占该实例保证了会话交互的连续性、上下文完整性以及多租安全性同时提供完整的管理接口来主动对会话生命周期进行控制降低了开发门槛。AgentRun 的核心运行机制传统的 Serverless 通常是无状态的难以满足 Code Interpreter 这类需要上下文保持的场景。AgentRun 借助函数计算的会话产品能力在无状态的计算底座上构建了有状态、会话级的沙箱体验。1. 沙箱请求亲和AgentRun 允许开发者显式地创建一个具有生命周期的执行环境解决了传统 Serverless“用完即走”导致的上下文丢失问题。会话亲和AgentRun 依赖函数计算会话亲和机制。当开发者创建沙箱后AgentRun 会维护一个唯一的 SessionID。后续所有携带该 ID 的请求都会被精准路由到同一个底层的计算实例。这意味着用户在第一步定义的 df pd.read_csv(...) 对象在第二步 df.plot() 时依然存在于内存中完美复刻本地开发体验。MCP 协议原生支持针对模型上下文协议Model Context Protocol, MCPAgentRun 提供了 MCP SSE 及 MCP Streamable HTTP 会话亲和支持。AgentRun 可以直接作为 MCP 网关让 LLM 与外部工具的交互更加顺滑。2. 多层次安全隔离在多租户 SaaS 平台中安全性是 AgentRun 的基石。计算隔离AgentRun 利用底层基础设施的神龙裸金属与 RunD 安全容器技术确保每个沙箱实例在内核级别进行隔离。通过强制将会话并发度设置为 1AgentRun 保证租户 A 的进程空间、内存数据与租户 B 物理分离防止容器逃逸。网络隔离网络隔离完全由用户控制。用户可以根据安全需求灵活配置选择开启或关闭沙箱的公网访问权限或者将沙箱接入指定的 VPC 网络环境从而在满足业务连通性的同时防止恶意代码对内网发起攻击。3. 灵活的生命周期控制AgentRun 通过函数计算的会话能力接管了底层计算资源的生命周期为上层应用提供精细化管理自动闲置回收Idle Timeout为了通过 Serverless 架构降低成本AgentRun 支持设置空闲超时例如 5 分钟。如果 Agent 在这段时间内没有新指令底层实例会自动销毁并停止计费完美适配 AI 交互“突发性强、稀疏度高”的特点。状态暂停与恢复即将上线针对长时间的任务间歇AgentRun 能够将沙箱的内存与磁盘状态快照保存在用户回归时通过快照快速恢复现场既节省成本又保留了上下文。4. 会话粒度存储隔离即将上线代码执行需要隔离数据存储更需要隔离。AgentRun 创新性地规划了会话粒度存储粘性。动态绑定AgentRun 允许用户为每个沙箱环境中动态分配一个存储挂载点的专属子目录。逻辑沙箱通过底层的挂载技术沙箱内部只能看到属于自己的 /workspace物理上无法访问其他租户的文件如 ../../tenant-b/secret.txt从文件系统层面根除了数据交叉风险。AgentRun 开箱即用的沙箱能力AgentRun 不仅提供了底层隔离环境还预置了经过工程化调优的标准化模版让开发者开箱即用Code Interpreter代码解释器预装 Python/Node.js/Java 等环境支持文件上传下载、数据分析、图表绘制及命令行操作。Browser User浏览器沙箱提供基于 CDP over WebSocket 协议的浏览器环境兼容 Puppeteer / Playwright让 Agent 能够安全地访问互联网进行网页操作。All In One集成了代码解释器与浏览器环境的全能型沙箱满足复杂 Agent 任务需求。这些模版镜像具备高度的灵活性AgentRun 未来将开放镜像定义允许用户基于标准镜像定制私有依赖库或安全策略。AgentRun 沙箱架构详解image.pngAgentRun 网关这是 AgentRun 的门户负责接收来自 AI Agent如 LangChain 应用、ChatGPT Plugin的 HTTP 请求除了标准的身份验证、鉴权以及协议转换如将 HTTP 转为 WebSocket之外其核心能力便是沙箱管理以及沙箱请求路由的功能它屏蔽了底层 Serverless 基础设施的复杂性实现了如下能力沙箱管理管理沙箱资源维护业务层沙箱 ID 与底层计算资源 SessionID 的映射关系状态维护监控沙箱的活跃状态基于沙箱超时配置以及底层资源情况及时对状态进行更新资源调度根据用户指定的计算规格CPU、Memory向底层申请相应的资源。函数计算沙箱环境主要由函数计算作为底层算力来承载沙箱的运行。AgentRun 利用函数计算提供的极致弹性能力实现在分钟内启动成三万个独立的沙箱环境每个环境都运行在独立的 MicroVM 中搭配自研开箱即用的沙箱镜像模版在功能以及性能上为用户提供了双重保障。典型工作流从指令到结果以“用户让 Agent 根据上传的 Excel 文件绘制图表”为例AgentRun 的工作流程如下。阶段一模板创建用户请求Agent 接收到用户指令后由 LLM 决策使用 Python 来实现该需求。Agent 工具调用AI Agent 会向 AgentRun 网关发送 Code Interpreter 沙箱模板的创建请求。模板创建AgentRun 网关会调用函数计算接口创建一个 Code 沙箱模板函数镜像配置为前文提到的自研 Code Interpreter 沙箱模板该函数需要同时配置会话亲和以及会话隔离。阶段二沙箱创建Agent 工具调用模板创建完成后Agent 继续进行沙箱创建创建时传入已有的模板 ID标识沙箱实例运行时的配置和镜像沙箱创建AgentRun 收到沙箱创建请求后会调用 FC 的 CreateSession 接口来创建一个沙箱实例该沙箱会有一个合适的闲置超时时间最长可存活 24h创建完成AgentRun 会保存 FC 返回的会话 ID并生成沙箱业务 ID 与之对应最终将沙箱业务 ID 返回给用户阶段三任务执行上传文件Agent 通过 Code Interpreter 的文件上传接口将 Excel 文件上传。若想将该文件持久化可以在创建沙箱时配置持久化存储 NAS将其挂到沙箱中并将文件上传到 NAS 挂载的目录上。绘制图表Agent 生成代码 import pandas as pd; df pd.read_excel(data.xlsx)并调用 Code Interpreter 的 run_code 接口执行代码。会话亲和Agent 所有发往 Code Interpreter 的请求中都必须带上对应的沙箱 ID 才能保证请求都路由到同一个沙箱实例。内存驻留代码执行完毕变量 df 驻留在内存中.二次代码执行Agent 根据数据列名生成绘图代码 df.plot()。再次发送代码运行请求上下文复用请求再次到达同一实例直接使用内存中的 df 对象进行绘图生成图片文件。结果回传图片被写入 NAS下载链接返回给 Agent。阶段四资源销毁空闲检测Agent 完成任务不再发送请求。自动回收达到 SessionIdleTimeout如 5 分钟后函数计算会自动销毁该沙箱实例此时除了持久化到 NAS 上的数据其余环境相关数据均被销毁。文件回收如果 NAS 上的文件是会话隔离的当用户会话结束后NAS 上文件需要进行主动或者定时自动清除。工作时序图image.pngAgentRun 的核心设计原则AgentRun 的工程化实践遵循以下五大核心原则这构成了其安全、高效、可扩展的基石原则一配置即代码AgentRun 将沙箱环境定义环境变量、资源规格、健康检查等封装为标准化模版。这种设计实现了沙箱配置的版本化管理使得 Agent 环境可以像代码一样进行复制和回滚。原则二会话即沙箱AgentRun 将“会话”作为沙箱的唯一实体。通过 SessionID 绑定底层的计算实例与上下文状态实现了真正的按需分配与状态保持。沙箱的创建与销毁完全独立于底层物理设施对用户透明。原则三生命周期可编程AgentRun 不仅提供创建Create和删除Delete接口还引入了“暂停”、“恢复”和“自动超时”机制。这种可编程性让上层应用能根据业务价值最大化资源利用率实现成本与性能的最优平衡。原则四网络接入标准化AgentRun 抹平了底层网络的差异提供标准化的 HTTP/WebSocket 接口并支持 Server-Sent EventsSSE。无论底层如何升级上层 Agent 沙箱始终通过标准的 Header 或 Cookie 携带 SessionID 进行交互降低了集成复杂度。原则五存储隔离细粒度化即将上线AgentRun 不仅支持模版粒度的文件系统共享同时也能够配置沙箱粒度目录级动态挂载。每个沙箱单独挂载一个目录从根源上杜绝了多租户环境下的数据越权访问风险。总结与展望AgentRun Sandbox 是 Serverless 技术在 AI Agent 领域的最佳工程化实践。拔房咕懊

YOLO-Master 与 YOLO 开始吭

相关文章：

YOLO-Master 与 YOLO 开始吭

从原理到实践：详解双目散斑结构光的生成与优化

大模型之Linux服务器部署大模型筛

【Python】CairoSVG实战：从SVG到多格式转换的完整指南

AI原生软件技术选型到底怎么选？：一张动态决策树图谱，覆盖LLM接入、向量基建、Agent编排与合规审计4大生死关

MinIO初始化报错`Invalid endPoint`全解析：从URL规范到调试技巧

MySQL锁机制：从全局锁到行级锁的深度解读挚

GME多模态向量-Qwen2-VL-2B多场景落地：已支持12类垂直领域图文Schema定制扩展

告别网络依赖！手把手教你本地部署Element UI v2.15.13离线文档（附Nginx/VSCode两种方法）

Linux内核中的KVM虚拟化详解

Linux内核中的RCU机制详解

PyTorch 2.8镜像中的模型安全与鲁棒性测试：对抗样本生成

数字孪生与工业大脑：SOP+VisuCAD 的协同中枢

JBoltAI框架4.2发布！八大核心升级重塑AI开发全场景

使用Alpine配置WSL ssh门户攘

分享种 .NET 桌面应用程序自动更新解决方案檀

我用 AI 辅助开发了一系列小工具（）：文件提取工具挖

5分钟快速上手：抖音批量下载神器完整使用指南

代码之外周刊（第期）：当技术让一切趋同，我们还剩什么？衬

从一次真实的头像上传功能审计说起：我是如何发现并修复那个差点被利用的‘安全’校验逻辑的

LLM 算法岗 | 八股问答（）· 多模态与主流模型架构瞪

别再被P0127吓到了！手把手教你读懂汽车仪表盘上的DTC故障码（附ISO15031-6标准解读）

zq—算法基础：时空复杂度（）咸

HFSS新手避坑指南：用FR-4板材搞定双频Wi-Fi单极子天线（含S11优化技巧）

面试官总爱问的LRU缓存，我用Java手写了一个（附完整代码和避坑点）

保姆级教程：在VS2022里一步步配置Qt 5.15.2源码调试环境（附PDB路径避坑指南）

再次革新 .NET 的构建和发布方式（三）媒

双摄帧同步：从软同步到硬同步的工程实践与调试指南

（二）从零构建嵌入式Linux：SDK编译与交叉工具链实战

Yosys内部数据结构与优化流程深度解析