当前位置: 首页 > article >正文

YOLO-Master 与 YOLO 开始吭

AI Agent 时代的沙箱需求从 Copilot 到 Agent执行能力的质变在生成式 AI 的早期阶段应用主要以“Copilot”形式存在AI 仅作为辅助生成建议。然而随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter现为 Advanced Data Analysis的出现AI 开始扮演“Agent”的角色。Agent 被赋予了目标并能自主规划步骤、使用工具来达成目标。这种质变的核心在于代码执行Code Execution。为了回答“分析这层楼的销售数据并绘制趋势图”这样的请求LLM 不再只是生成一段 Python 代码文本而是需要在一个真实的 Python 环境中运行这段代码并获取绘图结果。同样为了“帮我预订一张去东京的机票”Agent 可能需要在一个无头浏览器Headless Browser中模拟用户点击。不可信代码的安全隐患当 LLM 生成代码并执行时这段代码在本质上是不可信的Untrusted。如果直接在应用服务器或用户的本地设备上运行将面临灾难性的安全风险系统破坏AI 生成的代码可能无意或恶意地包含 rm -rf / 等破坏性指令或者修改关键系统配置文件。数据泄露代码可能尝试读取环境变量中的 API Key或者扫描内网数据库将敏感数据发送到外部服务器。资源耗尽死循环或内存泄漏代码可能导致宿主机崩溃影响其他租户的服务。网络攻击恶意 Prompt 注入Prompt Injection可能诱导 AI 将执行环境作为跳板Jump Box对内部网络发起 DDoS 攻击或端口扫描。Agent 场景面临的独特挑战除了基础的安全性AI Agent 的交互特性还给沙箱环境带来了前所未有的工程挑战这也是传统沙箱如简单的 Docker 容器或虚拟机难以应对的状态保持与传统的“请求-响应”模式不同Agent 往往需要进行多轮对话。上一轮定义的变量如 df load_data()需要在下一轮df.plot()中继续可用。这就要求沙箱环境必须具备上下文记忆能力而非每次请求都重置环境。极速启动用户无法忍受每次交互都等待数秒甚至数十秒的虚拟机启动时间。为了保证流畅的对话体验Time to First Token沙箱必须具备毫秒级的冷启动能力。环境依赖多样性不同的 Agent 任务可能需要完全不同的依赖库如 Pandas、Scipy 用于数据分析Puppeteer 用于网页操作。沙箱需要支持灵活的自定义镜像或动态依赖加载同时不能影响启动速度。资源成本控制Agent 的调用往往具有稀疏性和突发性例如一天只用几次但一次用很久。长期运行独占的虚拟机VM成本高昂且资源利用率低而传统的 FaaS 虽然便宜但往往缺乏状态保持能力。如何在低成本和高性能之间找到平衡点是一个巨大的挑战。因此构建一个沙箱Sandbox——一个与宿主机、内网以及其他用户数据严格隔离同时具备高性能、低成本、有状态的封闭执行环境——成为了 AI Agent 沙箱落地的前提条件。AgentRun Sandbox专为 Agent 设计的工程化方案为了解决上述挑战我们推出了 AgentRun Sandbox。这是一个以高代码为核心开放生态、灵活组装的一站式 Agentic AI 基础设施平台。AgentRun 并非从零构建传统的虚拟机集群而是基于阿里云函数计算FC这一强大的 Serverless 底座构建。通过充分利用 Serverless 的按需付费、极致弹性以及免运维NoOps 特性AgentRun 解决了一直困扰沙箱领域的成本与效率难题并在此基础上通过工程化封装提供了面向 Agent 场景的专业能力。为什么选择函数计算作为 Sandbox Infra在构建 Agent 沙箱时我们坚定地选择了函数计算FC作为底层基础设施这主要基于以下核心优势的考量强安全隔离 沙箱的核心诉求是安全。函数计算底层采用神龙裸金属与 RunD 安全容器技术每个执行环境都运行在独立的 MicroVM 中。这种基于虚拟化技术的内核级隔离相比传统的 Docker 容器隔离具有更高的安全性能有效防止恶意代码逃逸为不可信代码执行提供了坚实屏障。极致弹性与冷启动优化 Agent 的调用往往具有突发性。函数计算具备毫秒级的弹性伸缩能力结合 RunD 技术对启动速度的极致优化使得沙箱能够在数秒甚至毫秒内完成创建和启动。这不仅满足了高并发场景下的需求也保证了 Agent 交互的流畅性避免了传统虚拟机启动慢带来的延迟感。成本效益自建虚拟机集群通常需要为峰值流量预留资源导致低谷期资源浪费。函数计算采用按需付费Pay-as-you-go模式且 AgentRun 利用了 FC 的空闲自动回收机制真正做到了“有请求才计费”。对于稀疏调用的 Agent 场景这种模式能显著降低基础设施成本。免运维 基于 Serverless 架构开发者无需关心底层服务器的操作系统补丁、网络配置及集群维护。AgentRun 团队可以将精力集中在沙箱的核心逻辑与业务体验上而非底层基础设施的繁琐运维。会话能力函数计算围绕 AI Agent Sandbox 场景推出了会话亲和、隔离以及管理能力。在一次会话生命周期内相同会话的请求均会被亲和路由到同一个实例中并独占该实例保证了会话交互的连续性、上下文完整性以及多租安全性同时提供完整的管理接口来主动对会话生命周期进行控制降低了开发门槛。AgentRun 的核心运行机制传统的 Serverless 通常是无状态的难以满足 Code Interpreter 这类需要上下文保持的场景。AgentRun 借助函数计算的会话产品能力在无状态的计算底座上构建了有状态、会话级的沙箱体验。1. 沙箱请求亲和AgentRun 允许开发者显式地创建一个具有生命周期的执行环境解决了传统 Serverless“用完即走”导致的上下文丢失问题。会话亲和AgentRun 依赖函数计算会话亲和机制。当开发者创建沙箱后AgentRun 会维护一个唯一的 SessionID。后续所有携带该 ID 的请求都会被精准路由到同一个底层的计算实例。这意味着用户在第一步定义的 df pd.read_csv(...) 对象在第二步 df.plot() 时依然存在于内存中完美复刻本地开发体验。MCP 协议原生支持针对模型上下文协议Model Context Protocol, MCPAgentRun 提供了 MCP SSE 及 MCP Streamable HTTP 会话亲和支持。AgentRun 可以直接作为 MCP 网关让 LLM 与外部工具的交互更加顺滑。2. 多层次安全隔离在多租户 SaaS 平台中安全性是 AgentRun 的基石。计算隔离AgentRun 利用底层基础设施的神龙裸金属与 RunD 安全容器技术确保每个沙箱实例在内核级别进行隔离。通过强制将会话并发度设置为 1AgentRun 保证租户 A 的进程空间、内存数据与租户 B 物理分离防止容器逃逸。网络隔离网络隔离完全由用户控制。用户可以根据安全需求灵活配置选择开启或关闭沙箱的公网访问权限或者将沙箱接入指定的 VPC 网络环境从而在满足业务连通性的同时防止恶意代码对内网发起攻击。3. 灵活的生命周期控制AgentRun 通过函数计算的会话能力接管了底层计算资源的生命周期为上层应用提供精细化管理自动闲置回收Idle Timeout为了通过 Serverless 架构降低成本AgentRun 支持设置空闲超时例如 5 分钟。如果 Agent 在这段时间内没有新指令底层实例会自动销毁并停止计费完美适配 AI 交互“突发性强、稀疏度高”的特点。状态暂停与恢复即将上线针对长时间的任务间歇AgentRun 能够将沙箱的内存与磁盘状态快照保存在用户回归时通过快照快速恢复现场既节省成本又保留了上下文。4. 会话粒度存储隔离即将上线代码执行需要隔离数据存储更需要隔离。AgentRun 创新性地规划了会话粒度存储粘性。动态绑定AgentRun 允许用户为每个沙箱环境中动态分配一个存储挂载点的专属子目录。逻辑沙箱通过底层的挂载技术沙箱内部只能看到属于自己的 /workspace物理上无法访问其他租户的文件如 ../../tenant-b/secret.txt从文件系统层面根除了数据交叉风险。AgentRun 开箱即用的沙箱能力AgentRun 不仅提供了底层隔离环境还预置了经过工程化调优的标准化模版让开发者开箱即用Code Interpreter代码解释器预装 Python/Node.js/Java 等环境支持文件上传下载、数据分析、图表绘制及命令行操作。Browser User浏览器沙箱提供基于 CDP over WebSocket 协议的浏览器环境兼容 Puppeteer / Playwright让 Agent 能够安全地访问互联网进行网页操作。All In One集成了代码解释器与浏览器环境的全能型沙箱满足复杂 Agent 任务需求。这些模版镜像具备高度的灵活性AgentRun 未来将开放镜像定义允许用户基于标准镜像定制私有依赖库或安全策略。AgentRun 沙箱架构详解image.pngAgentRun 网关这是 AgentRun 的门户负责接收来自 AI Agent如 LangChain 应用、ChatGPT Plugin的 HTTP 请求除了标准的身份验证、鉴权以及协议转换如将 HTTP 转为 WebSocket之外其核心能力便是沙箱管理以及沙箱请求路由的功能它屏蔽了底层 Serverless 基础设施的复杂性实现了如下能力沙箱管理管理沙箱资源维护业务层沙箱 ID 与底层计算资源 SessionID 的映射关系状态维护监控沙箱的活跃状态基于沙箱超时配置以及底层资源情况及时对状态进行更新资源调度根据用户指定的计算规格CPU、Memory向底层申请相应的资源。函数计算沙箱环境主要由函数计算作为底层算力来承载沙箱的运行。AgentRun 利用函数计算提供的极致弹性能力实现在分钟内启动成三万个独立的沙箱环境每个环境都运行在独立的 MicroVM 中搭配自研开箱即用的沙箱镜像模版在功能以及性能上为用户提供了双重保障。典型工作流从指令到结果以“用户让 Agent 根据上传的 Excel 文件绘制图表”为例AgentRun 的工作流程如下。阶段一模板创建用户请求Agent 接收到用户指令后由 LLM 决策使用 Python 来实现该需求。Agent 工具调用AI Agent 会向 AgentRun 网关发送 Code Interpreter 沙箱模板的创建请求。模板创建AgentRun 网关会调用函数计算接口创建一个 Code 沙箱模板函数镜像配置为前文提到的自研 Code Interpreter 沙箱模板该函数需要同时配置会话亲和以及会话隔离。阶段二沙箱创建Agent 工具调用模板创建完成后Agent 继续进行沙箱创建创建时传入已有的模板 ID标识沙箱实例运行时的配置和镜像沙箱创建AgentRun 收到沙箱创建请求后会调用 FC 的 CreateSession 接口来创建一个沙箱实例该沙箱会有一个合适的闲置超时时间最长可存活 24h创建完成AgentRun 会保存 FC 返回的会话 ID并生成沙箱业务 ID 与之对应最终将沙箱业务 ID 返回给用户阶段三任务执行上传文件Agent 通过 Code Interpreter 的文件上传接口将 Excel 文件上传。若想将该文件持久化可以在创建沙箱时配置持久化存储 NAS将其挂到沙箱中并将文件上传到 NAS 挂载的目录上。绘制图表Agent 生成代码 import pandas as pd; df pd.read_excel(data.xlsx)并调用 Code Interpreter 的 run_code 接口执行代码。会话亲和Agent 所有发往 Code Interpreter 的请求中都必须带上对应的沙箱 ID 才能保证请求都路由到同一个沙箱实例。内存驻留代码执行完毕变量 df 驻留在内存中.二次代码执行Agent 根据数据列名生成绘图代码 df.plot()。再次发送代码运行请求上下文复用请求再次到达同一实例直接使用内存中的 df 对象进行绘图生成图片文件。结果回传图片被写入 NAS下载链接返回给 Agent。阶段四资源销毁空闲检测Agent 完成任务不再发送请求。自动回收达到 SessionIdleTimeout如 5 分钟后函数计算会自动销毁该沙箱实例此时除了持久化到 NAS 上的数据其余环境相关数据均被销毁。文件回收如果 NAS 上的文件是会话隔离的当用户会话结束后NAS 上文件需要进行主动或者定时自动清除。工作时序图image.pngAgentRun 的核心设计原则AgentRun 的工程化实践遵循以下五大核心原则这构成了其安全、高效、可扩展的基石原则一配置即代码AgentRun 将沙箱环境定义环境变量、资源规格、健康检查等封装为标准化模版。这种设计实现了沙箱配置的版本化管理使得 Agent 环境可以像代码一样进行复制和回滚。原则二会话即沙箱AgentRun 将“会话”作为沙箱的唯一实体。通过 SessionID 绑定底层的计算实例与上下文状态实现了真正的按需分配与状态保持。沙箱的创建与销毁完全独立于底层物理设施对用户透明。原则三生命周期可编程AgentRun 不仅提供创建Create和删除Delete接口还引入了“暂停”、“恢复”和“自动超时”机制。这种可编程性让上层应用能根据业务价值最大化资源利用率实现成本与性能的最优平衡。原则四网络接入标准化AgentRun 抹平了底层网络的差异提供标准化的 HTTP/WebSocket 接口并支持 Server-Sent EventsSSE。无论底层如何升级上层 Agent 沙箱始终通过标准的 Header 或 Cookie 携带 SessionID 进行交互降低了集成复杂度。原则五存储隔离细粒度化即将上线AgentRun 不仅支持模版粒度的文件系统共享同时也能够配置沙箱粒度目录级动态挂载。每个沙箱单独挂载一个目录从根源上杜绝了多租户环境下的数据越权访问风险。总结与展望AgentRun Sandbox 是 Serverless 技术在 AI Agent 领域的最佳工程化实践。拔房咕懊

相关文章:

YOLO-Master 与 YOLO 开始吭

AI Agent 时代的沙箱需求 从 Copilot 到 Agent:执行能力的质变 在生成式 AI 的早期阶段,应用主要以“Copilot”形式存在,AI 仅作为辅助生成建议。然而,随着 AutoGPT、BabyAGI 以及 OpenAI Code Interpreter(现为 Advan…...

从原理到实践:详解双目散斑结构光的生成与优化

1. 散斑结构光的基础原理 当你用手电筒照射粗糙墙面时,会看到无数闪烁的光点,这就是自然界中最常见的散斑现象。在三维视觉领域,我们通过精心设计的伪随机散斑图案(Pseudorandom Speckle Pattern),将这种物…...

大模型之Linux服务器部署大模型筛

一、各自优势和对比 这是检索出来的数据,据说是根据第三方评测与企业数据,三款产品在代码生成质量上各有侧重: 产品 语言优势 场景亮点 核心差异 百度 Comate C核心代码质量第一;Python首生成率达92.3% SQL生成准确率提升35%&…...

【Python】CairoSVG实战:从SVG到多格式转换的完整指南

1. 为什么选择CairoSVG进行SVG转换 如果你经常需要处理矢量图形,肯定遇到过这样的场景:设计部门给你发来SVG文件,但你的应用场景需要PNG格式;或者需要把SVG图标批量导出为PDF文档。这时候CairoSVG就是你的瑞士军刀。 我在实际项目…...

AI原生软件技术选型到底怎么选?:一张动态决策树图谱,覆盖LLM接入、向量基建、Agent编排与合规审计4大生死关

第一章:AI原生软件技术选型的底层逻辑与决策范式 2026奇点智能技术大会(https://ml-summit.org) AI原生软件并非传统应用叠加模型API的简单拼接,而是以模型为一等公民、数据流为骨架、推理生命周期为驱动内核的全新构造范式。其技术选型本质是权衡“表达…...

MinIO初始化报错`Invalid endPoint`全解析:从URL规范到调试技巧

1. 为什么你的MinIO客户端总是报Invalid endPoint错误? 最近在帮团队排查MinIO集成问题时,发现超过60%的初始化错误都源于endPoint配置不当。很多开发者习惯性复制浏览器地址栏的URL直接粘贴到代码里,结果运行时却收到冰冷的Invalid endPoint…...

MySQL锁机制:从全局锁到行级锁的深度解读挚

如果有多个供应商,你也可以使用 [[CC-Switch]] 来可视化管理这些API key,以及claude code 的skills。 # 多平台安装指令 curl -fsSL https://claude.ai/install.sh | bash ## Claude Code 配置 GLM Coding Plan curl -O "https://cdn.bigmodel.cn/i…...

GME多模态向量-Qwen2-VL-2B多场景落地:已支持12类垂直领域图文Schema定制扩展

GME多模态向量-Qwen2-VL-2B多场景落地:已支持12类垂直领域图文Schema定制扩展 你是不是经常遇到这样的问题?想找一张图,却只能用文字描述,结果搜出来的图片总是不对劲;或者有一张图片,想找和它内容相关的文…...

告别网络依赖!手把手教你本地部署Element UI v2.15.13离线文档(附Nginx/VSCode两种方法)

告别网络依赖!手把手教你本地部署Element UI v2.15.13离线文档(附Nginx/VSCode两种方法) 作为一名长期在咖啡厅、地铁等弱网环境下工作的前端开发者,我深刻体会到离线文档的重要性。Element UI作为Vue.js生态中最受欢迎的UI框架之…...

Linux内核中的KVM虚拟化详解

Linux内核中的KVM虚拟化详解 引言 KVM(Kernel-based Virtual Machine)是Linux内核中的虚拟化模块,它允许Linux内核作为 hypervisor 运行虚拟机。KVM将Linux内核转变为一个功能完整的虚拟化平台,支持硬件辅助虚拟化。本文将深入探讨…...

Linux内核中的RCU机制详解

Linux内核中的RCU机制详解 引言 RCU(Read-Copy-Update)是Linux内核中一种高效的读写同步机制,特别适合读多写少的场景。它允许多个读者同时访问数据,写者通过复制和更新的方式来修改数据,避免了传统锁机制带来的性能开…...

PyTorch 2.8镜像中的模型安全与鲁棒性测试:对抗样本生成

PyTorch 2.8镜像中的模型安全与鲁棒性测试:对抗样本生成 1. 为什么我们需要关注模型安全性 想象一下,你开发了一个用于医疗影像诊断的AI系统,准确率高达99%。但在实际部署后,有人通过微小的图像改动就让系统做出完全错误的判断。…...

数字孪生与工业大脑:SOP+VisuCAD 的协同中枢

数字孪生是物理实体的数字化镜像,通过实时数据同步、动态仿真与虚拟映射,实现物理世界与数字世界的双向映射与闭环优化。工业大脑是工业智能的决策中枢,整合数据、模型、知识与算力,完成全局分析、智能决策与协同调度。在 JBoltAI…...

JBoltAI框架4.2发布!八大核心升级重塑AI开发全场景

深耕AI开发领域,聚焦开发者实际需求,JBoltAI框架持续迭代优化。今日,我们正式宣布JBoltAI框架升级至V4.2版本,带来9大核心功能升级,覆盖语音交互、文件处理、文档生成、知识库优化等全场景,进一步降低AI应用…...

使用Alpine配置WSL ssh门户攘

1. 哑铃图是什么? 哑铃图(Dumbbell Plot),有时也称为DNA图或杠铃图,是一种用于比较两个相关数据点的可视化图表。 它源于人们对更有效数据比较方式的持续探索。 在传统的时间序列比较中,我们通常使用两条折…...

分享 种 .NET 桌面应用程序自动更新解决方案檀

一、Actor 模型:不是并发技巧,而是领域单元 Actor 模型的本质是: Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是: 如何在不共享状…...

我用 AI 辅助开发了一系列小工具():文件提取工具挖

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

5分钟快速上手:抖音批量下载神器完整使用指南

5分钟快速上手:抖音批量下载神器完整使用指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音…...

代码之外周刊(第期):当技术让一切趋同,我们还剩什么?衬

1. 前言 本文详细介绍如何使用 kylin v10 iso 文件构建出 docker image,docker 版本为 20.10.7。 2. 构建 yum 离线源 2.1. 挂载 ISO 文件 mount Kylin-Server-V10-GFB-Release-030-ARM64.iso /media 2.2. 添加离线 repo 文件 在/etc/yum.repos.d/下创建kylin…...

从一次真实的头像上传功能审计说起:我是如何发现并修复那个差点被利用的‘安全’校验逻辑的

从一次真实的头像上传功能审计说起:我是如何发现并修复那个差点被利用的‘安全’校验逻辑的 那天下午,我正在为一个企业级SaaS平台开发用户头像上传功能。这个功能看似简单——用户上传图片,后端校验后存储。但当我深入代码审计时&#xff0c…...

LLM 算法岗 | 八股问答()· 多模态与主流模型架构瞪

7.1 初识三维模型 7.1.1 三维模型的数据载体 随着计算机图形技术的发展,我们或多或少都会见过或者听说过三维模型。笔者始终记得小时候第一次在电视上看到三维动画《变形金刚:超能勇士》的震撼感受;而现在我们已经可以在手机上玩三维游戏《王…...

别再被P0127吓到了!手把手教你读懂汽车仪表盘上的DTC故障码(附ISO15031-6标准解读)

汽车故障码解密指南:从P0127到U0105的实战解读 当仪表盘突然亮起黄色发动机灯,伴随着一串像是外星密码的字母数字组合时,大多数车主的第一反应都是心头一紧。上周我的老伙计张伟就遇到了这种情况——他的SUV在高速公路上突然显示"P0172&…...

zq—算法基础:时空复杂度()咸

一、什么是setuptools? setuptools 是一个用于创建、分发和安装 Python 包的核心库。 它可以帮助你: 定义 Python 包的元数据(如名称、版本、作者等)。 声明包的依赖项,确保你的包能够正确运行。 构建源代码分发包&…...

HFSS新手避坑指南:用FR-4板材搞定双频Wi-Fi单极子天线(含S11优化技巧)

HFSS新手避坑指南:用FR-4板材搞定双频Wi-Fi单极子天线(含S11优化技巧) 刚接触HFSS的天线设计新手,往往会在仿真过程中遇到各种"坑":明明按照教程操作,S11曲线却离奇偏移;谐振频率与预…...

面试官总爱问的LRU缓存,我用Java手写了一个(附完整代码和避坑点)

面试官最爱问的LRU缓存:从原理到Java实战的深度解析 为什么LRU缓存是面试中的常青树? 在技术面试中,设计一个高效的缓存系统几乎是必考题,而LRU(Least Recently Used)算法则是这类问题中最经典的考察点。…...

保姆级教程:在VS2022里一步步配置Qt 5.15.2源码调试环境(附PDB路径避坑指南)

保姆级教程:在VS2022里一步步配置Qt 5.15.2源码调试环境(附PDB路径避坑指南) 当你兴奋地在Visual Studio 2022中按下F11键,想要深入Qt框架内部一探信号槽的魔法时,调试器却无情地显示"无法加载符号"——这种…...

再次革新 .NET 的构建和发布方式(三)媒

1 安装与初始化 # 全局安装 OpenSpec npm install -g fission-ai/openspeclatest # 在项目目录下初始化 cd /path/to/your-project openspec init 初始化时,OpenSpec 会提示你选择使用的 AI 工具(Claude Code、Cursor、Trae、Qoder 等)。 3 O…...

双摄帧同步:从软同步到硬同步的工程实践与调试指南

1. 双摄帧同步技术概述 第一次接触双摄同步需求时,我也被各种专业术语搞得头晕眼花。简单来说,双摄帧同步就是要让手机的两个摄像头像双胞胎一样默契配合,确保它们拍摄的画面在时间上完全对齐。想象一下用双眼看世界时,如果左右眼…...

(二)从零构建嵌入式Linux:SDK编译与交叉工具链实战

1. 嵌入式Linux开发环境搭建 第一次接触嵌入式Linux开发的朋友们,可能会被各种专业术语搞得一头雾水。别担心,今天我就用最接地气的方式,带大家从零开始搭建开发环境。我最近刚用全志T113-i芯片完成了一个项目,正好把整个流程梳理…...

Yosys内部数据结构与优化流程深度解析

1. Yosys工具与RTLIL数据结构概述 Yosys作为开源硬件综合工具链的核心组件,其内部实现了一套名为RTLIL(Register Transfer Level Intermediate Language)的中间表示语言。这套数据结构的设计直接决定了工具的性能上限和优化潜力。我第一次接触…...