当前位置: 首页 > article >正文

用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口

用操作系统类比彻底搞懂 AI Agent进程、系统调用与上下文窗口引言很多人第一次接触 AI Agent会立刻被一堆新词包围Tool Use、Function Calling、RAG、Memory、Orchestrator、Multi-Agent、Context Compression。这些词看起来很新但它们背后要解决的问题并不新。如果你学过操作系统会发现 Agent 系统并不是凭空长出来的另一个世界。它更像是把操作系统里已经出现过的问题换了一批资源、换了一套接口、换了一种计算单元然后重新演了一遍。在操作系统里核心资源是 CPU、内存、文件、设备和网络在 Agent 系统里核心资源变成了 token、上下文窗口、推理时间、外部工具和知识库。在操作系统里程序不能随便访问硬件必须通过系统调用进入内核在 Agent 系统里模型不能自己搜索网页、运行代码、查询数据库必须通过工具调用交给外部运行环境执行。这不是说 Agent 和操作系统完全一样。更准确的说法是它们面对的是一组高度相似的系统问题。如何划分执行边界如何隔离权限如何调度任务如何管理稀缺资源如何把慢而大的外部存储接入快速计算过程如何处理并发、竞争、失败和一致性理解了这一点Agent 就不再只是一个会聊天的大模型。它开始变成一个可以被工程化、被调度、被治理的系统。一、Agent 不是只有 Model很多入门文章会把 Agent 讲成大模型 提示词。这个说法太薄了。在真实工程里更有解释力的结构是Agent Model HarnessModel负责推理Harness负责把推理接到真实世界。Harness 可以理解为 Agent 的运行时环境。它接收用户输入维护上下文暴露工具解析模型输出执行函数调用处理工具返回再把结果塞回模型。模型本身只是在 token 空间里计算真正让它拥有外部行动能力的是 Harness。图 1Agent Model Harness 的基本结构。这个视角很重要。因为只看 Model你会觉得 Agent 的能力全在模型聪不聪明但看见 Harness 之后你会意识到 Agent 的工程能力来自一整套运行机制上下文如何组织工具如何注册权限如何限制结果如何校验多个 Agent 如何调度失败时如何重试或回滚这已经不是单纯的提示词工程而是系统工程。二、进程和线程Sub-Agent 带来的并发问题在操作系统里进程是资源边界线程是执行单元。同一个进程里的多个线程共享内存所以线程之间通信很快但也容易出现竞争条件。不同进程之间默认隔离彼此不能随便读写对方内存跨进程通信必须通过管道、Socket、共享内存、消息队列等机制。Agent 世界正在重演这件事。当一个任务足够复杂时我们会把它拆给多个 sub-Agent一个 Agent 负责搜索资料一个 Agent 负责阅读代码一个 Agent 负责写草稿一个 Agent 负责审查事实一个 Agent 负责生成最终答案这样做的好处很明显并行、分工、上下文更专注。但问题也随之出现这些 Agent 之间到底共享什么如果所有 Agent 共享同一份上下文通信成本很低但状态会变得混乱。一个 Agent 写入的结论另一个 Agent 可能还没看见一个 Agent 基于旧信息做了判断另一个 Agent 已经把前提改掉了。共享上下文越方便竞争条件越容易出现。如果每个 Agent 都有独立上下文隔离性会更好但通信成本会上升。它们必须显式传递结果必须约定输出格式必须有人负责合并和裁决。图 2操作系统与 Agent 系统的核心类比。所以 Multi-Agent 的难点不只是多叫几个模型一起干活。真正的难点是并发系统的老问题谁能访问谁的状态谁对最终结果负责多个 Agent 输出冲突时听谁的中间结果是否需要锁定任务失败后如何重试是否存在循环等待、重复工作和无效协商操作系统里的死锁、竞争、一致性问题到了 Agent 系统里并没有消失只是换了一身自然语言的衣服。三、系统调用Tool Use 是权限边界上的洞用户程序想读文件、访问网络、操作硬件不能直接碰底层资源。它必须通过系统调用进入内核由内核检查权限、执行操作再把结果返回给用户程序。这个机制的关键不只是让程序能访问硬件更是让程序不能随便访问硬件。Agent 的 Tool Use 也是类似逻辑。模型本身不能真的打开浏览器不能真的运行代码不能真的查数据库。它只能生成一个结构化请求例如{tool:search_web,arguments:{query:Agent tool use function calling}}Harness 接到这个请求后会判断这个工具是否存在当前 Agent 是否有权限使用参数是否合法是否需要用户确认执行结果是否可信返回内容是否应该进入上下文这就是 Agent 世界里的系统调用。图 3Tool Use 与系统调用的相似路径。这个类比能帮助我们理解 Tool Use 的本质它不是给模型加插件这么简单而是在权限边界上打一个受控的洞。能力从这个洞里流进来风险也被这个洞隔住。如果没有 Harness 做边界模型就会变成一个没有权限模型的自动化脚本。如果没有工具模型就只能困在上下文窗口里说话。一个可用的 Agent 系统必须同时拥有能力入口和边界控制。四、Cache 和虚拟内存Context Window 是最贵的内存在 Agent 系统里最稀缺的资源是什么很多人会说是模型能力。这个答案不算错但从工程角度看真正每天都在被消耗、被压缩、被调度的资源是上下文窗口。Context Window 就像 Agent 的工作内存。模型每一次推理只能看到当前上下文窗口里的内容。窗口外的内容除非被重新检索、重新摘要、重新放进来否则对模型来说就相当于不存在。这和 CPU Cache / 内存 / 磁盘的分层非常像当前推理里的关键指令和目标像寄存器最近几轮对话和工具返回像高速缓存长期记忆、项目文档和历史记录像主存或磁盘压缩摘要像被换页出去后留下的索引上下文窗口满了怎么办Agent 框架通常会做几件事删除不重要的历史消息把长对话压缩成摘要把文件内容放到外部存储需要时再检索只保留任务目标、约束、当前计划和关键事实这就是语义版本的内存管理。图 4Context Window 与存储分层。这里有一个很容易被忽略的问题压缩不是无损的。一段对话被压缩成摘要后细节会丢失语气会丢失反例会丢失某些边界条件也可能被丢失。操作系统把内存页换到磁盘理论上字节还能原样换回来但 Agent 把上下文压缩成语义摘要再恢复时就不一定是原来的信息了。所以 Context Compression 不是简单的省 token 技巧它会直接影响系统的一致性和可靠性。五、文件系统挂载RAG 是把知识库接进运行时如果所有知识都必须塞进上下文窗口Agent 很快就会崩溃。现实任务需要大量外部知识产品文档、代码仓库、数据库记录、用户手册、论文、工单、会议纪要、历史聊天记录。它们体积很大但每次推理真正需要的只是其中一小部分。RAG 的作用就是把这些外部知识库挂载到 Agent 的运行时里。它不要求所有内容常驻上下文而是在需要时根据当前问题生成查询去外部知识库检索相关片段对结果排序、过滤和重组把少量高相关内容放入上下文让模型基于这些内容生成答案或行动这很像操作系统挂载外部存储。磁盘容量大、便宜、慢内存容量小、贵、快。文件系统和虚拟内存的价值就是用廉价的大容量存储补偿昂贵的快速内存。RAG 也是一样外部知识库容量大、便宜、慢上下文窗口容量小、贵、快。检索系统负责把可能有用的知识按需搬进上下文窗口。图 5RAG 作为 Agent 的外部知识挂载。但 RAG 也有自己的工程陷阱。检索不到模型会缺事实检索太多窗口会被噪声淹没切片太碎语义断裂切片太长召回不准排序不好关键证据进不来权限没做好用户可能看到不该看的知识。所以 RAG 不只是向量数据库 embedding。它本质上是 Agent 的知识 I/O 子系统。六、Harness 和 OrchestratorAgent 系统的内核与调度器如果把 Model 看成计算核心那么 Harness 就像 Agent 的内核。它至少要负责这些事情接收输入并构造上下文维护可用工具列表管理工具权限执行工具调用处理工具返回记录中间状态控制循环次数在失败时重试、降级或终止当系统里只有一个 Agent 时Harness 已经很重要。当系统里有多个 Agent 时还需要一个 Orchestrator。Orchestrator 做的事很像调度器把复杂任务拆成多个子任务决定哪个 Agent 先运行决定哪些 Agent 可以并行控制每个 Agent 的上下文和工具权限汇总多个 Agent 的输出处理冲突、失败和重复工作图 6Multi-Agent 的调度结构。到这里Agent 架构的轮廓就比较清楚了。Model 不是全部。Tool 不是外挂。Memory 不是聊天记录。RAG 不是简单搜索。Multi-Agent 也不是让一堆模型互相聊天。它们共同组成了一个运行系统Agent 组件类似 OS 概念主要作用ModelCPU / 执行核心根据上下文进行推理、规划和生成Harness内核 / 运行时管理上下文、工具、权限、执行循环Tool Use系统调用让模型通过受控接口访问外部能力Context WindowCache / 内存保存当前推理可见的信息Memory主存 / 持久化状态保存跨轮次、跨任务的状态和经验RAG文件系统挂载按需接入外部知识库Orchestrator调度器拆分任务、调度多个 Agent、合并结果Sub-Agent进程 / 线程承担局部任务带来并发和协作问题七、开发者应该如何理解 Agent如果你是开发者我建议先不要把 Agent 理解成更聪明的聊天机器人。更好的理解方式是Agent 是一个以大模型为执行核心的受控运行系统。它有输入有状态有工具有权限有调度有失败有资源限制也有副作用。它会访问外部世界会读写文件会调用 API会执行代码会把中间结果传给下一个环节。一旦系统有了这些特征我们就不能只用提示词写得好不好来评价它。我们还要问工具权限是否最小化上下文是否可追踪RAG 结果是否有证据来源多 Agent 输出是否可合并失败是否可恢复成本是否可控制关键步骤是否可审计这些问题听起来很工程甚至有点老派。但这正是 Agent 从 Demo 走向真实应用必须补上的部分。八、结尾老问题新资源操作系统花了几十年才把进程、线程、系统调用、虚拟内存、文件系统、调度器这些问题逐渐想清楚。Agent 时代正在把同样的问题重新答一遍。只不过这一次资源从 CPU 和内存变成了 token 和推理时间程序从机器指令变成了自然语言系统调用从read()、write()、open()变成了工具调用文件系统挂载从磁盘和网络存储变成了向量库、文档库和企业知识库。所以学习 Agent 不应该只学 API也不应该只学提示词。真正值得建立的是系统感你要知道模型在哪里计算工具在哪里执行状态在哪里保存知识在哪里检索权限在哪里收口多个 Agent 之间如何协作以及当它们出错时谁来兜底。当你开始这样看 Agent它就不再是一个神秘的新名词而是一套可以被分析、设计和实现的工程系统。这也是开发者进入大模型应用时代时最值得补上的第一课。

相关文章:

用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口

用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口 引言 很多人第一次接触 AI Agent,会立刻被一堆新词包围:Tool Use、Function Calling、RAG、Memory、Orchestrator、Multi-Agent、Context Compression。 这些词看起来很新&#…...

科技与科学新闻摘要-2026年5月16日

科技与科学新闻摘要 日期: 2026年5月16日 科技领域重点新闻 1. 中国2025年度十大科学进展揭晓 核心要点: 中国科学技术部发布了2025年度十大科学进展,覆盖深空探测、人工智能、生命科学、能源技术等多个领域,集中展示了中国基础研究和应用研究的突破性…...

每日大赛间歇期通过Taotoken模型广场探索新模型特性

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 每日大赛间歇期通过Taotoken模型广场探索新模型特性 对于每日参与各类AI应用开发或创意大赛的选手而言,比赛间歇期并非…...

当机器人遇见城市:江南北如何重塑武汉的智能生活图景

城市,是人类文明的结晶,也是科技创新的试验场。在武汉这座英雄的城市,一场由江南北(武汉)信息技术有限公司(简称“江南北机器人”)引领的智能革命,正悄然改变着市民的日常生活与城市…...

5步搭建Sunshine游戏串流服务器:打造你的私人云游戏平台

5步搭建Sunshine游戏串流服务器:打造你的私人云游戏平台 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine Sunshine是一款功能强大的自托管游戏串流服务器,专…...

GitHub系统提示词库:提升大模型交互效率的工程实践指南

1. 项目概述:一个系统提示词的宝库如果你深度使用过ChatGPT、Claude或者DeepSeek这类大语言模型,那你一定对“系统提示词”这个概念不陌生。简单来说,它就是你发给模型的“第一条指令”,用来设定它的身份、行为准则和对话风格。比…...

82、【Agent】【OpenCode】bash 工具提示词(amend 风险)

【声明】本博客所有内容均为个人业余时间创作,所述技术案例均来自公开开源项目(如Github,Apache基金会),不涉及任何企业机密或未公开技术,如有侵权请联系删除 背景 上篇 blog 【Agent】【OpenCode】bash 工…...

免费开源工业通信调试工具:ModbusTool终极指南,5分钟快速上手

免费开源工业通信调试工具:ModbusTool终极指南,5分钟快速上手 【免费下载链接】ModbusTool A modbus master and slave test tool with import and export functionality, supports TCP, UDP and RTU. 项目地址: https://gitcode.com/gh_mirrors/mo/Mo…...

LibreOffice Online 终极指南:如何在浏览器中实现免费办公协作

LibreOffice Online 终极指南:如何在浏览器中实现免费办公协作 【免费下载链接】online Read-only Mirror - no pull request (use https://gerrit.libreoffice.org instead) 项目地址: https://gitcode.com/gh_mirrors/onl/online 还在为昂贵的在线办公软件…...

如何快速掌握Winhance中文版:Windows优化终极指南

如何快速掌握Winhance中文版:Windows优化终极指南 【免费下载链接】Winhance-zh_CN A Chinese version of Winhance. C# application designed to optimize and customize your Windows experience. 项目地址: https://gitcode.com/gh_mirrors/wi/Winhance-zh_CN …...

Virtual ZPL Printer:5步搭建专业级条码标签开发测试环境

Virtual ZPL Printer:5步搭建专业级条码标签开发测试环境 【免费下载链接】Virtual-ZPL-Printer An ethernet based virtual Zebra Label Printer that can be used to test applications that produce bar code labels. 项目地址: https://gitcode.com/gh_mirror…...

Heightmapper完全指南:5步将全球地形数据变成3D模型

Heightmapper完全指南:5步将全球地形数据变成3D模型 【免费下载链接】heightmapper interactive heightmaps from terrain data 项目地址: https://gitcode.com/gh_mirrors/he/heightmapper 还在为3D地形建模发愁吗?Heightmapper让你的地形创作效…...

终极解决方案:让苹果触控板在Windows上获得原生级精准触控体验

终极解决方案:让苹果触控板在Windows上获得原生级精准触控体验 【免费下载链接】mac-precision-touchpad Windows Precision Touchpad Driver Implementation for Apple MacBook / Magic Trackpad 项目地址: https://gitcode.com/gh_mirrors/ma/mac-precision-tou…...

别再手动记版本了!Xilinx FPGA两种自动记录编译时间的方法实测对比(附Tcl脚本)

Xilinx FPGA版本管理实战:Tcl脚本与USR_ACCESS原语深度评测 每次编译FPGA设计时手动记录版本号的时代该结束了。在快速迭代的硬件开发中,精确追踪每个比特流文件的生成时间对调试和版本控制至关重要。本文将深入对比两种自动化方案——Tcl脚本与USR_ACCE…...

异步复位同步释放:数字电路设计的核心技巧与工程实践

1. 项目概述:一个看似简单却暗藏玄机的设计技巧在数字电路设计,尤其是FPGA和ASIC开发中,复位信号的处理是确保系统从确定状态启动和稳定运行的第一道,也是最重要的一道防线。我们经常听到“异步复位,同步释放”这个设计…...

2026 免费GEO监测:AI搜索优化实用工具推荐

2026年AI搜索优化(GEO)已经成为企业数字营销的核心环节。当前GEO工具市场呈现明显的国内外分化格局,国内工具和海外工具在功能支持、适用场景上存在巨大差异。本文选取目前市场上主流的5款GEO工具,从功能完整性、AI模型支持、易用…...

3分钟完成B站缓存视频转换:m4s-converter完整使用指南

3分钟完成B站缓存视频转换:m4s-converter完整使用指南 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾为B站视频下架后&…...

Linux服务器安全基线自动化实践:基于Ansible的加固方案

1. 项目概述与核心价值“安全加固”这个词,对于任何一个负责线上系统运维、应用部署或者个人服务器管理的朋友来说,都绝不陌生。它就像给自家房子装防盗门、安监控一样,是基础且必要的工作。然而,现实情况往往是:我们面…...

税调企业与所在区县税务局的距离

税调企业与所在区县税务局的距离2007-2020数据包含:2007~2020年税调企业与所在区县税务局的距离_km.dta数据包含如下变量:sdid、与税务局的大圆距离_km、税务局经度、经度、纬度、省、省代码、市、市代码、县、县代码、税务局纬度、组织机构代…...

【ElevenLabs语音伦理合规白皮书】:面向银发群体的AI语音生成必须绕开的4类GDPR/《互联网信息服务深度合成管理规定》雷区

更多请点击: https://intelliparadigm.com 第一章:银发群体AI语音服务的伦理合规必要性 随着智能语音助手在居家养老、远程问诊、紧急呼叫等场景中的深度部署,面向60岁以上用户的AI语音服务已从“可选功能”演变为“关键基础设施”。然而&am…...

RK3568平台开发系列讲解(热拔插篇)内核是如何发送事件到用户空间

🚀返回专栏总目录 文章目录 一、相关接口函数 二、udevadm 命令 三、实验程序 四、运行效果 沉淀、分享、成长,让自己和他人都能有所收获!😄 一、相关接口函数 kobject_uevent 是 Linux 内核中的一个函数, 用于生成和发送 uevent 事件。 它是 udev 和其他设备管理工具与…...

实验室小白避坑指南:在浪潮AiStation上从零部署PyTorch项目(含离线环境打包)

实验室科研实战:浪潮AiStation离线部署PyTorch全流程解析 当实验室服务器遭遇网络隔离与资源限制时,如何高效部署深度学习项目成为每个科研新手的必修课。本文将针对浪潮AiStation平台的特殊性,系统梳理从环境准备到代码运行的完整闭环&#…...

终极NGA论坛浏览体验优化指南:5分钟打造你的专属摸鱼神器

终极NGA论坛浏览体验优化指南:5分钟打造你的专属摸鱼神器 【免费下载链接】NGA-BBS-Script NGA论坛增强脚本,给你完全不一样的浏览体验 项目地址: https://gitcode.com/gh_mirrors/ng/NGA-BBS-Script 还在为NGA论坛繁杂的界面和低效的浏览体验烦恼…...

Cursor Free VIP:一键解决Cursor AI试用限制的智能工具

Cursor Free VIP:一键解决Cursor AI试用限制的智能工具 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tr…...

上海软件定制开发技术路径深度拆解:PaaS云架构如何重构企业系统交付模式

摘要:本文围绕上海软件定制开发的核心技术路径展开分析,重点拆解PaaS云架构在企业软件交付中的实现机制、架构取舍与落地约束,并结合典型平台的工程实践,探讨不同开发模式在性能、兼容性与运维成本上的真实差异。企业在推进数字化…...

Sunshine游戏串流服务器:打造你的私人云游戏平台

Sunshine游戏串流服务器:打造你的私人云游戏平台 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想要在客厅电视、笔记本电脑甚至手机上玩高性能PC游戏吗?S…...

【模拟 IC】运放失调电压的成因剖析与版图优化策略

1. 运放失调电压的本质与影响 第一次接触运放失调电压这个概念时,我也被它搞得一头雾水。简单来说,失调电压就是理想运放和实际运放之间的"性格差异"。理想情况下,当两个输入端电压相等时,输出应该是零。但现实中&#…...

用MakeCode Arcade与树莓派Zero打造复古像素游戏:从拖拽编程到实体街机

1. 项目概述:为什么选择MakeCode Arcade开启你的游戏开发之旅?如果你对编程充满好奇,又或者一直想亲手制作一款属于自己的复古像素风游戏,但被一行行复杂的代码劝退,那么MakeCode Arcade就是你一直在寻找的答案。它不是…...

告别环境配置焦虑:用Intel oneAPI和OpenMPI在CentOS7搭建你的第一个并行计算Demo

告别环境配置焦虑:用Intel oneAPI和OpenMPI在CentOS7搭建你的第一个并行计算Demo 高性能计算(HPC)的世界常常让人望而生畏——复杂的工具链、晦涩的术语、漫长的环境配置过程。但今天,我们将打破这一认知。只需一台CentOS7服务器…...

Harness Open Source 与 GitLab 的区别:一个轻量一体化 DevOps 平台,一个完整 DevSecOps 平台

Harness:https://github.com/harness/harness 一、先给结论 Harness Open Source 和 GitLab 都可以做代码托管、代码协作、CI/CD 和制品管理,但二者的产品边界不同。 Harness Open Source 官方定位是一个开源的一体化开发平台,集成源码管理、CI/CD pipelines、托管开发环…...