当前位置: 首页 > article >正文

YOLO-Master 与 YOLO 开始奖

AI Agent 时代的沙箱需求从 Copilot 到 Agent执行能力的质变在生成式 AI 的早期阶段应用主要以“Copilot”形式存在AI 仅作为辅助生成建议。然而随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter现为 Advanced Data Analysis的出现AI 开始扮演“Agent”的角色。Agent 被赋予了目标并能自主规划步骤、使用工具来达成目标。这种质变的核心在于代码执行Code Execution。为了回答“分析这层楼的销售数据并绘制趋势图”这样的请求LLM 不再只是生成一段 Python 代码文本而是需要在一个真实的 Python 环境中运行这段代码并获取绘图结果。同样为了“帮我预订一张去东京的机票”Agent 可能需要在一个无头浏览器Headless Browser中模拟用户点击。不可信代码的安全隐患当 LLM 生成代码并执行时这段代码在本质上是不可信的Untrusted。如果直接在应用服务器或用户的本地设备上运行将面临灾难性的安全风险系统破坏AI 生成的代码可能无意或恶意地包含 rm -rf / 等破坏性指令或者修改关键系统配置文件。数据泄露代码可能尝试读取环境变量中的 API Key或者扫描内网数据库将敏感数据发送到外部服务器。资源耗尽死循环或内存泄漏代码可能导致宿主机崩溃影响其他租户的服务。网络攻击恶意 Prompt 注入Prompt Injection可能诱导 AI 将执行环境作为跳板Jump Box对内部网络发起 DDoS 攻击或端口扫描。Agent 场景面临的独特挑战除了基础的安全性AI Agent 的交互特性还给沙箱环境带来了前所未有的工程挑战这也是传统沙箱如简单的 Docker 容器或虚拟机难以应对的状态保持与传统的“请求-响应”模式不同Agent 往往需要进行多轮对话。上一轮定义的变量如 df load_data()需要在下一轮df.plot()中继续可用。这就要求沙箱环境必须具备上下文记忆能力而非每次请求都重置环境。极速启动用户无法忍受每次交互都等待数秒甚至数十秒的虚拟机启动时间。为了保证流畅的对话体验Time to First Token沙箱必须具备毫秒级的冷启动能力。环境依赖多样性不同的 Agent 任务可能需要完全不同的依赖库如 Pandas、Scipy 用于数据分析Puppeteer 用于网页操作。沙箱需要支持灵活的自定义镜像或动态依赖加载同时不能影响启动速度。资源成本控制Agent 的调用往往具有稀疏性和突发性例如一天只用几次但一次用很久。长期运行独占的虚拟机VM成本高昂且资源利用率低而传统的 FaaS 虽然便宜但往往缺乏状态保持能力。如何在低成本和高性能之间找到平衡点是一个巨大的挑战。因此构建一个沙箱Sandbox——一个与宿主机、内网以及其他用户数据严格隔离同时具备高性能、低成本、有状态的封闭执行环境——成为了 AI Agent 沙箱落地的前提条件。AgentRun Sandbox专为 Agent 设计的工程化方案为了解决上述挑战我们推出了 AgentRun Sandbox。这是一个以高代码为核心开放生态、灵活组装的一站式 Agentic AI 基础设施平台。AgentRun 并非从零构建传统的虚拟机集群而是基于阿里云函数计算FC这一强大的 Serverless 底座构建。通过充分利用 Serverless 的按需付费、极致弹性以及免运维NoOps 特性AgentRun 解决了一直困扰沙箱领域的成本与效率难题并在此基础上通过工程化封装提供了面向 Agent 场景的专业能力。为什么选择函数计算作为 Sandbox Infra在构建 Agent 沙箱时我们坚定地选择了函数计算FC作为底层基础设施这主要基于以下核心优势的考量强安全隔离 沙箱的核心诉求是安全。函数计算底层采用神龙裸金属与 RunD 安全容器技术每个执行环境都运行在独立的 MicroVM 中。这种基于虚拟化技术的内核级隔离相比传统的 Docker 容器隔离具有更高的安全性能有效防止恶意代码逃逸为不可信代码执行提供了坚实屏障。极致弹性与冷启动优化 Agent 的调用往往具有突发性。函数计算具备毫秒级的弹性伸缩能力结合 RunD 技术对启动速度的极致优化使得沙箱能够在数秒甚至毫秒内完成创建和启动。这不仅满足了高并发场景下的需求也保证了 Agent 交互的流畅性避免了传统虚拟机启动慢带来的延迟感。成本效益自建虚拟机集群通常需要为峰值流量预留资源导致低谷期资源浪费。函数计算采用按需付费Pay-as-you-go模式且 AgentRun 利用了 FC 的空闲自动回收机制真正做到了“有请求才计费”。对于稀疏调用的 Agent 场景这种模式能显著降低基础设施成本。免运维 基于 Serverless 架构开发者无需关心底层服务器的操作系统补丁、网络配置及集群维护。AgentRun 团队可以将精力集中在沙箱的核心逻辑与业务体验上而非底层基础设施的繁琐运维。会话能力函数计算围绕 AI Agent Sandbox 场景推出了会话亲和、隔离以及管理能力。在一次会话生命周期内相同会话的请求均会被亲和路由到同一个实例中并独占该实例保证了会话交互的连续性、上下文完整性以及多租安全性同时提供完整的管理接口来主动对会话生命周期进行控制降低了开发门槛。AgentRun 的核心运行机制传统的 Serverless 通常是无状态的难以满足 Code Interpreter 这类需要上下文保持的场景。AgentRun 借助函数计算的会话产品能力在无状态的计算底座上构建了有状态、会话级的沙箱体验。1. 沙箱请求亲和AgentRun 允许开发者显式地创建一个具有生命周期的执行环境解决了传统 Serverless“用完即走”导致的上下文丢失问题。会话亲和AgentRun 依赖函数计算会话亲和机制。当开发者创建沙箱后AgentRun 会维护一个唯一的 SessionID。后续所有携带该 ID 的请求都会被精准路由到同一个底层的计算实例。这意味着用户在第一步定义的 df pd.read_csv(...) 对象在第二步 df.plot() 时依然存在于内存中完美复刻本地开发体验。MCP 协议原生支持针对模型上下文协议Model Context Protocol, MCPAgentRun 提供了 MCP SSE 及 MCP Streamable HTTP 会话亲和支持。AgentRun 可以直接作为 MCP 网关让 LLM 与外部工具的交互更加顺滑。2. 多层次安全隔离在多租户 SaaS 平台中安全性是 AgentRun 的基石。计算隔离AgentRun 利用底层基础设施的神龙裸金属与 RunD 安全容器技术确保每个沙箱实例在内核级别进行隔离。通过强制将会话并发度设置为 1AgentRun 保证租户 A 的进程空间、内存数据与租户 B 物理分离防止容器逃逸。网络隔离网络隔离完全由用户控制。用户可以根据安全需求灵活配置选择开启或关闭沙箱的公网访问权限或者将沙箱接入指定的 VPC 网络环境从而在满足业务连通性的同时防止恶意代码对内网发起攻击。3. 灵活的生命周期控制AgentRun 通过函数计算的会话能力接管了底层计算资源的生命周期为上层应用提供精细化管理自动闲置回收Idle Timeout为了通过 Serverless 架构降低成本AgentRun 支持设置空闲超时例如 5 分钟。如果 Agent 在这段时间内没有新指令底层实例会自动销毁并停止计费完美适配 AI 交互“突发性强、稀疏度高”的特点。状态暂停与恢复即将上线针对长时间的任务间歇AgentRun 能够将沙箱的内存与磁盘状态快照保存在用户回归时通过快照快速恢复现场既节省成本又保留了上下文。4. 会话粒度存储隔离即将上线代码执行需要隔离数据存储更需要隔离。AgentRun 创新性地规划了会话粒度存储粘性。动态绑定AgentRun 允许用户为每个沙箱环境中动态分配一个存储挂载点的专属子目录。逻辑沙箱通过底层的挂载技术沙箱内部只能看到属于自己的 /workspace物理上无法访问其他租户的文件如 ../../tenant-b/secret.txt从文件系统层面根除了数据交叉风险。AgentRun 开箱即用的沙箱能力AgentRun 不仅提供了底层隔离环境还预置了经过工程化调优的标准化模版让开发者开箱即用Code Interpreter代码解释器预装 Python/Node.js/Java 等环境支持文件上传下载、数据分析、图表绘制及命令行操作。Browser User浏览器沙箱提供基于 CDP over WebSocket 协议的浏览器环境兼容 Puppeteer / Playwright让 Agent 能够安全地访问互联网进行网页操作。All In One集成了代码解释器与浏览器环境的全能型沙箱满足复杂 Agent 任务需求。这些模版镜像具备高度的灵活性AgentRun 未来将开放镜像定义允许用户基于标准镜像定制私有依赖库或安全策略。AgentRun 沙箱架构详解image.pngAgentRun 网关这是 AgentRun 的门户负责接收来自 AI Agent如 LangChain 应用、ChatGPT Plugin的 HTTP 请求除了标准的身份验证、鉴权以及协议转换如将 HTTP 转为 WebSocket之外其核心能力便是沙箱管理以及沙箱请求路由的功能它屏蔽了底层 Serverless 基础设施的复杂性实现了如下能力沙箱管理管理沙箱资源维护业务层沙箱 ID 与底层计算资源 SessionID 的映射关系状态维护监控沙箱的活跃状态基于沙箱超时配置以及底层资源情况及时对状态进行更新资源调度根据用户指定的计算规格CPU、Memory向底层申请相应的资源。函数计算沙箱环境主要由函数计算作为底层算力来承载沙箱的运行。AgentRun 利用函数计算提供的极致弹性能力实现在分钟内启动成三万个独立的沙箱环境每个环境都运行在独立的 MicroVM 中搭配自研开箱即用的沙箱镜像模版在功能以及性能上为用户提供了双重保障。典型工作流从指令到结果以“用户让 Agent 根据上传的 Excel 文件绘制图表”为例AgentRun 的工作流程如下。阶段一模板创建用户请求Agent 接收到用户指令后由 LLM 决策使用 Python 来实现该需求。Agent 工具调用AI Agent 会向 AgentRun 网关发送 Code Interpreter 沙箱模板的创建请求。模板创建AgentRun 网关会调用函数计算接口创建一个 Code 沙箱模板函数镜像配置为前文提到的自研 Code Interpreter 沙箱模板该函数需要同时配置会话亲和以及会话隔离。阶段二沙箱创建Agent 工具调用模板创建完成后Agent 继续进行沙箱创建创建时传入已有的模板 ID标识沙箱实例运行时的配置和镜像沙箱创建AgentRun 收到沙箱创建请求后会调用 FC 的 CreateSession 接口来创建一个沙箱实例该沙箱会有一个合适的闲置超时时间最长可存活 24h创建完成AgentRun 会保存 FC 返回的会话 ID并生成沙箱业务 ID 与之对应最终将沙箱业务 ID 返回给用户阶段三任务执行上传文件Agent 通过 Code Interpreter 的文件上传接口将 Excel 文件上传。若想将该文件持久化可以在创建沙箱时配置持久化存储 NAS将其挂到沙箱中并将文件上传到 NAS 挂载的目录上。绘制图表Agent 生成代码 import pandas as pd; df pd.read_excel(data.xlsx)并调用 Code Interpreter 的 run_code 接口执行代码。会话亲和Agent 所有发往 Code Interpreter 的请求中都必须带上对应的沙箱 ID 才能保证请求都路由到同一个沙箱实例。内存驻留代码执行完毕变量 df 驻留在内存中.二次代码执行Agent 根据数据列名生成绘图代码 df.plot()。再次发送代码运行请求上下文复用请求再次到达同一实例直接使用内存中的 df 对象进行绘图生成图片文件。结果回传图片被写入 NAS下载链接返回给 Agent。阶段四资源销毁空闲检测Agent 完成任务不再发送请求。自动回收达到 SessionIdleTimeout如 5 分钟后函数计算会自动销毁该沙箱实例此时除了持久化到 NAS 上的数据其余环境相关数据均被销毁。文件回收如果 NAS 上的文件是会话隔离的当用户会话结束后NAS 上文件需要进行主动或者定时自动清除。工作时序图image.pngAgentRun 的核心设计原则AgentRun 的工程化实践遵循以下五大核心原则这构成了其安全、高效、可扩展的基石原则一配置即代码AgentRun 将沙箱环境定义环境变量、资源规格、健康检查等封装为标准化模版。这种设计实现了沙箱配置的版本化管理使得 Agent 环境可以像代码一样进行复制和回滚。原则二会话即沙箱AgentRun 将“会话”作为沙箱的唯一实体。通过 SessionID 绑定底层的计算实例与上下文状态实现了真正的按需分配与状态保持。沙箱的创建与销毁完全独立于底层物理设施对用户透明。原则三生命周期可编程AgentRun 不仅提供创建Create和删除Delete接口还引入了“暂停”、“恢复”和“自动超时”机制。这种可编程性让上层应用能根据业务价值最大化资源利用率实现成本与性能的最优平衡。原则四网络接入标准化AgentRun 抹平了底层网络的差异提供标准化的 HTTP/WebSocket 接口并支持 Server-Sent EventsSSE。无论底层如何升级上层 Agent 沙箱始终通过标准的 Header 或 Cookie 携带 SessionID 进行交互降低了集成复杂度。原则五存储隔离细粒度化即将上线AgentRun 不仅支持模版粒度的文件系统共享同时也能够配置沙箱粒度目录级动态挂载。每个沙箱单独挂载一个目录从根源上杜绝了多租户环境下的数据越权访问风险。总结与展望AgentRun Sandbox 是 Serverless 技术在 AI Agent 领域的最佳工程化实践。顺俣铀鸦

相关文章:

YOLO-Master 与 YOLO 开始奖

AI Agent 时代的沙箱需求 从 Copilot 到 Agent:执行能力的质变 在生成式 AI 的早期阶段,应用主要以“Copilot”形式存在,AI 仅作为辅助生成建议。然而,随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter(现为 Advan…...

Coverband与Rails集成指南:从零到部署的完整流程

Coverband与Rails集成指南:从零到部署的完整流程 【免费下载链接】coverband Ruby production code coverage collection and reporting (line of code usage) 项目地址: https://gitcode.com/gh_mirrors/co/coverband Coverband是一款强大的Ruby生产环境代码…...

JitPack.io深度解析:多模块项目构建与发布的最佳实践

JitPack.io深度解析:多模块项目构建与发布的最佳实践 【免费下载链接】jitpack.io Documentation and issues of https://jitpack.io 项目地址: https://gitcode.com/gh_mirrors/ji/jitpack.io JitPack.io是一个创新的JVM和Android项目包仓库,它按…...

小白也能用的AI神器:Anything to RealCharacters 2.5D转真人引擎全流程体验

小白也能用的AI神器:Anything to RealCharacters 2.5D转真人引擎全流程体验 1. 从动漫到真人的神奇转换 你是否曾经想过,把自己喜欢的动漫角色变成真实人物会是什么样子?或者想把游戏中的虚拟形象变成一张可以打印的照片?现在&a…...

四轮独立驱动汽车轨迹跟踪与横向稳定性控制:MPC控制器与二次规划方法结合应用,基于MATLAB...

四轮独立驱动汽车自动轨迹跟踪横向稳定性控制 CarSim与Simulink联合 控制目标为对给定轨迹进行跟踪(不带轨迹规划)同时进行横向稳定性控制 上层控制器为MPC控制器,输出为附加横摆力矩和方向盘转角,采用了二自由度车辆模型 MPC控制器采用代码编写,原理一目…...

免费写小说工具2025推荐,提升创作效率与灵感激发

免费写小说工具2025推荐,提升创作效率与灵感激发随着科技的不断进步,越来越多的创作者开始依赖各种工具来提升创作效率和激发灵感。在2025年,市场上涌现了许多优秀的免费写小说工具,它们不仅能够帮助作者快速生成内容,…...

nli-distilroberta-base部署教程:Kubernetes集群中水平扩展NLI推理服务

nli-distilroberta-base部署教程:Kubernetes集群中水平扩展NLI推理服务 1. 项目概述 nli-distilroberta-base是一个基于DistilRoBERTa模型的自然语言推理(NLI)Web服务,专门用于判断两个句子之间的逻辑关系。这个轻量级模型继承了RoBERTa的强大性能&…...

SDMatte镜像CI/CD实践:GitOps驱动的模型更新与服务发布

SDMatte镜像CI/CD实践:GitOps驱动的模型更新与服务发布 1. 项目背景与价值 SDMatte是一款面向高质量图像抠图的AI模型,特别擅长处理复杂边缘和半透明物体的提取任务。在电商、设计、内容创作等领域,快速高效的图像抠图能力可以显著提升工作…...

ERTEC 系列 PROFINET 芯片级硬件过滤器分析恫

一、语言特性:Java 26 与模式匹配进化 1.1 Java 26 语言级别支持 IDEA 2026.1 EAP 最引人注目的变化之一,就是新增 Java 26 语言级别支持。这意味着开发者可以提前体验和测试即将在 JDK 26 中正式发布的语言特性。 其中最重要的变化是对 JEP 530 的全面支…...

贾子(Kucius)对波普尔证伪主义的系统性批判:从“双标霸权”到“文明可持续”新标尺

贾子(Kucius)对波普尔证伪主义的系统性批判:从“双标霸权”到“文明可持续”新标尺摘要: 贾子从四个层面对波普尔证伪主义展开系统性批判:其一,指认其为“证死你,证伟我”的双标工具&#xff0c…...

OpenClaw+千问3.5-9B智能监控:服务器日志异常自动告警

OpenClaw千问3.5-9B智能监控:服务器日志异常自动告警 1. 为什么需要智能日志监控? 去年我负责维护的一个内部项目突然在凌晨崩溃,直到第二天上班才发现。查看日志才发现,其实系统在崩溃前2小时就已经开始报错——如果能实时捕获…...

宝可梦存档管理全世代兼容指南:从备份到跨世代转移的完整解决方案

宝可梦存档管理全世代兼容指南:从备份到跨世代转移的完整解决方案 【免费下载链接】PKSM Gen I to GenVIII save manager. 项目地址: https://gitcode.com/gh_mirrors/pk/PKSM 宝可梦训练师们常常面临存档丢失、跨世代宝可梦转移困难等问题。本文将介绍一款名…...

2025届毕业生推荐的六大降AI率网站推荐

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 就那些期望降低文本 AI 生成比率的用户来讲,挑选专业网站工具算是一条高效的途径…...

kill-doc:让文档下载效率提升90%的自动化工具

kill-doc:让文档下载效率提升90%的自动化工具 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才能下载文档,该脚本就是为了解决您的烦…...

智元发布GO-2基座模型,定义具身智能“知行合一”新高度

当一个机器人站在你面前,你对它说一句:“把杯子拿过来。”它听懂了,也知道杯子是什么、在哪里,甚至已经在 “脑海里” 规划出一条看似完美的路径。可真正伸手去执行的那一刻,动作却常常偏离规划,无法稳定完…...

2026 InnoCIM 存算一体高校挑战赛报名详情>>

2026 InnoCIM 存算一体高校挑战赛报名正式开启!扫描图中二维码或点击阅读原文即刻报名。报名截止至6月30日,快来组队吧!...

新技术:无需编解码器,NEO-unify如何打造原生视觉语言理解与生成

今天,商汤科技发布一篇最新技术博客 NEO-unify: 原生架构打造端到端多模态理解与生成统一模型(NEO-unify: Building Native Multimodal Unified Models End to End)这篇博客深入解读NEO-unify:一项旨在从底层统一多模态理解与生成…...

CogVideoX-2b效果探索:极端提示词下的边界测试

CogVideoX-2b效果探索:极端提示词下的边界测试 1. 引言:当文字遇见视频魔法 你有没有想过,用几句话就能拍出一部微电影?输入一段文字描述,几分钟后就能得到一段动态视频,这听起来像是科幻电影里的场景&am…...

K8s ConfigMap实战全解析

ConfigMap祥解 ConfigMap与 Secret 类似,用来存储配置文件的kubernetes资源对象,所有的配置内容都存储在etcd中。与 Secret 的区别: ConfigMap 保存的是不需要加密的、应用所需的配置信息。ConfigMap 的用法几乎与 Secret 完全相同&#xff1…...

你知道ZooKeeper分布式锁怎么应用吗?【原理与实现深度解析】

目录 一、前言 二、核心实现原理 1. 创建节点 2. 获取子节点列表 3. 判断是否获取锁 4. 监听前序节点 5. 等待与重试 三、锁的类型与实现变体 排他锁(Exclusive Lock) 共享锁(Shared Lock) 可重入锁(Reentr…...

收藏!程序员转型AI必看:手把手教你构建百万级文档RAG系统

本文聚焦于企业级大模型应用中的RAG技术,针对10万级文档规模,探讨了如何构建一个高效、稳定且可扩展的RAG系统。文章从RAG的基本原理出发,分析了检索慢、召回率低和部署复杂三大痛点,并提出了相应的优化策略,包括文档预…...

零基础玩转fft npainting lama:5分钟上手AI图片修复,轻松去除水印杂物

零基础玩转fft npainting lama:5分钟上手AI图片修复,轻松去除水印杂物 1. 快速了解fft npainting lama fft npainting lama是一款基于LaMa(Large Mask Inpainting)架构的AI图像修复工具,经过二次开发构建&#xff0c…...

RMBG-2.0与LangChain结合:智能图片处理工作流设计

RMBG-2.0与LangChain结合:智能图片处理工作流设计 1. 引言:当抠图遇上智能编排 想象一下这样的场景:你手头有几百张产品图片需要处理,有的要抠图换背景,有的要智能分类,还有的需要根据内容自动生成描述。…...

您知道什么是AspectJ吗?【Java AOP的静态编织引擎】

目录 前言 核心洞察 核心概念与运行机制 1. 连接点 (Join Point) 2. 切入点 (Pointcut) 3. 通知 (Advice) 4. 切面 (Aspect) 三种编织方式 1. 编译时编织 (Compile-time Weaving) 2. 编译后编织 (Post-compile Weaving) 3. 加载时编织 (Load-time Weaving, LTW) Sp…...

《QGIS快速入门与应用基础》268:国土行业标准布局模板

作者:翰墨之道,毕业于国际知名大学空间信息与计算机专业,获硕士学位,现任国内时空智能领域资深专家、CSDN知名技术博主。多年来深耕地理信息与时空智能核心技术研发,精通 QGIS、GrassGIS、OSG、OsgEarth、UE、Cesium、OpenLayers、Leaflet、MapBox 等主流工具与框架,兼具…...

书匠策AI:论文写作界的“智能导航仪”,让课程论文创作如行云流水!

在学术的征途中,每一篇课程论文都是一次智慧的探险,既充满挑战也孕育着成长的喜悦。然而,面对浩瀚的知识海洋和复杂的写作规范,许多学子常常感到力不从心,甚至迷失方向。别怕,今天我要为你揭秘一位论文写作…...

信捷PLC控制 台达伺服电机实现手动自动与循环控制

信捷XD/XC系列PLC 控制台达B2系列伺服电机程序,手动自动,循环,循环次数设定在自动化控制领域,信捷PLC与台达伺服电机的搭配应用十分广泛。今天咱们就来聊聊如何用信捷XD/XC系列PLC控制台达B2系列伺服电机,实现手动、自…...

揭秘书匠策AI:课程论文写作的“智慧魔法棒”

在学术的奇妙旅程中,课程论文宛如一座座等待攀登的小山峰,既充满挑战,又蕴含着成长的机遇。对于众多初涉学术领域的学生而言,从构思选题到搭建框架,再到填充内容与精心打磨,每一步都可能伴随着困惑与迷茫。…...

WPF新手村教程(七)—— 终章(MVVM架构初见杀)陶

1. 哑铃图是什么? 哑铃图(Dumbbell Plot),有时也称为DNA图或杠铃图,是一种用于比较两个相关数据点的可视化图表。 它源于人们对更有效数据比较方式的持续探索。 在传统的时间序列比较中,我们通常使用两条折…...

物联网入门:从会动的小灯泡起步,普通人轻松上手,一篇文章快速入门

物联网开发入门指南:从零开始,手把手带你玩转物联网 一、物联网专业到底学些啥? 物联网专业听起来高大上,其实说白了,就是教你如何把身边的各种“东西”连上网,让它们能“说话”、能“听话”、能“思考”…...