当前位置: 首页 > article >正文

从用户一句话到任务完成:Hermes Agent 一次请求完整链路详解

一、先说结论Hermes 不是“问一句答一句”的普通聊天框很多人理解 AI 应用时会把它想成一个 Chatbot用户发一句话模型回一句话。但 Hermes Agent 的请求链路更像一个“任务操作系统”。用户的一句话进入系统后Hermes 会先判断会话来源和历史状态再组装项目上下文、长期记忆、技能索引、工具列表最后让模型在 Agent Loop 中一步步决定是直接回答还是调用工具继续执行。所以完整链路可以概括成一句话入口负责接人会话负责接上下文Prompt 负责接知识Provider 负责接模型Tools 负责接动作Session 和 Memory 负责把过程沉淀下来。二、入口层请求先从 CLI、Gateway、API、ACP 或 Cron 进来Hermes 的第一个特点是入口不止一个。你可以在本地 CLI 里和它对话也可以从 Telegram、Discord、Slack、WhatsApp 等平台发消息还可以通过 API Server、ACP/IDE、Cron 自动化触发任务。不同入口的形态不同但最终都要被转换成 Hermes 能理解的用户消息。如果是聊天平台Gateway 会负责平台适配、用户授权、消息路由和会话键构造如果是 CLI则直接进入本地交互如果是 Cron则像一个“定时用户”一样发起任务。CLI/TUI适合本地开发、终端操作、直接看工具输出。Gateway适合把 Hermes 放到服务器上让用户从多个消息平台持续交互。API Server适合企业系统或其他程序把 Hermes 当成后端能力调用。ACP/IDE适合在编辑器场景里把任务交给 Hermes。Cron适合日报、巡检、备份、定时报告这类无人值守任务。三、会话层先确认“这是哪个用户、哪个平台、哪个任务”请求进入后Hermes 不会急着调模型而是先处理 Session。Session 的作用是回答三个问题这条消息来自谁它属于哪个平台或频道它应该接到哪个历史任务后面这一步非常关键。没有 SessionAgent 就会像普通 Chatbot 一样每次都重新开始有了 Session用户今天在 Telegram 发起任务明天在 CLI 或同一会话里继续追问Hermes 还能把之前的消息、工具调用、模型配置和统计信息接上。三.一、state.db 是跨平台延续任务的“账本”Hermes 使用 ~/.hermes/state.db 保存会话元数据、完整消息历史、模型配置和检索索引。你可以把它理解成一本账本每一轮用户消息、模型回复、工具结果、token 消耗、成本估算、父子会话关系都会被记录下来。这样做有两个好处第一任务可以恢复第二历史可以检索。后续 Memory、Session Search、压缩后的 Session lineage都是建立在这个会话存储能力之上的。四、Prompt 层把项目规则、记忆和技能装进“任务背景”很多 AI 应用效果不好不是因为模型不够强而是因为模型不知道当前项目的规则。Hermes 在调用模型之前会通过 prompt_builder.py 组装一套有效系统提示词。它不是只有一句“你是一个助手”而是分层拼装身份、工具使用规则、Memory 快照、User 快照、Skills 索引、项目 Context Files、时间和平台提示。四.一、为什么要分层分层的好处是稳定、可控、可缓存。比如 SOUL.md 是 Agent 身份MEMORY.md 和 USER.md 是长期记忆AGENTS.md 或 .hermes.md 是项目规则Skills 是可复用流程。它们都属于不同性质的信息如果混在一起后期会非常难维护。四.二、这一步决定模型“站在哪个场景里思考”同样一句“帮我修一下 bug”如果没有项目上下文模型只能泛泛而谈如果 Prompt 里有项目入口、测试命令、代码规范、历史问题和可用工具模型就能像一个熟悉项目的工程师一样行动。五、Provider 层选模型、选 API 模式、选凭证Prompt 准备好之后Hermes 还要决定这次请求用哪个模型、哪个供应商、哪个 API 模式。它会综合显式参数、配置文件、环境变量和 provider 插件默认值解析出 provider、model、api_mode、base_url、api_key 等运行时信息。这一步解决的是“模型供应商差异”问题。OpenAI 兼容接口、Codex Responses API、Anthropic Messages API 的消息格式和工具调用形式并不完全一样。Hermes 会在外层做转换让 Agent 内部继续使用统一的消息结构。六、Agent Loop一次请求真正进入执行循环进入 AIAgent 后Hermes 会执行一轮标准生命周期。官方文档把这个过程拆成 9 步生成 task_id、追加用户消息、构建或复用系统 Prompt、检查预压缩、构造 API 消息、注入临时提示、应用缓存标记、发起可中断模型调用、解析响应。六.一、为什么叫 Loop而不是一次调用因为模型不一定第一次就能给出最终答案。它可能先调用 read_file 看代码再调用 terminal 跑测试再调用 patch 修改文件再继续让模型判断下一步。每一次“模型思考 工具执行 结果回填”都是循环的一轮。六.二、消息格式为什么重要Hermes 内部把消息统一成 system、user、assistant、tool 这样的结构。工具调用时必须遵守“Assistant 带 tool_calls → Tool 返回结果 → Assistant 继续判断”的顺序。顺序错了很多模型供应商会直接拒绝请求。七、工具执行模型负责决策Hermes 负责落地当模型返回 tool_calls 时Hermes 会进入工具执行层。这个阶段不是模型自己去碰文件、终端或浏览器而是模型声明“我要调用哪个工具、参数是什么”Hermes 再从工具注册表里找到对应 handler。七.一、工具执行的标准动作先从 tools/registry.py 找到工具 handler。触发 pre_tool_call hook给插件或平台机会拦截。如果是危险命令进入审批逻辑等待用户授权。真正执行 handler比如读文件、跑命令、调用 MCP Server。触发 post_tool_call hook记录执行后的状态。把工具结果作为 tool message 写回对话历史。七.二、并发执行提高效率但交互工具要谨慎如果模型一次返回多个普通工具调用Hermes 可以用线程池并发执行但像 clarify 这种需要用户交互的工具不能并发乱跑必须按顺序等待用户输入。八、长任务保护压缩、Fallback、预算控制真实任务经常很长读很多文件、跑很多测试、来回修很多轮。如果没有保护机制Agent 很容易遇到三个问题上下文太长、模型失败、循环太久。Hermes 在请求链路中加入了压缩、Fallback 和预算控制。八.一、压缩上下文太长就把中间过程总结掉当对话超过模型上下文一定比例时Hermes 会触发压缩。压缩前会先把 Memory 刷盘防止重要事实丢失然后把中间对话总结成更短的摘要同时保留最近 N 条消息和工具调用/工具结果成对结构。八.二、Fallback主模型失败就换备用路线如果主模型出现限流、服务端错误、鉴权问题Hermes 会检查 fallback_providers按顺序尝试备用模型或供应商。这样长任务不会因为一次模型失败就彻底中断。八.三、预算控制防止 Agent 无限跑下去Hermes 会跟踪迭代预算。父 Agent 有自己的上限子 Agent 也有独立上限。到达上限后系统会停止并返回已完成工作的总结而不是继续无休止消耗 token 和工具资源。九、持久化最终答案返回前后Hermes 会把过程留下来一次请求结束时Hermes 不只是把答案发给用户还会保存会话消息、工具调用、token 统计、Memory 更新等信息。这样下一次用户追问“刚才那个任务继续”时系统不是凭空猜而是能从 Session 和 Memory 中找回依据。从工程角度看这就是 Hermes 和普通 Chatbot 的根本差异普通 Chatbot 更像“当前窗口里的回复器”Hermes 更像“能长期记账、能执行动作、能沉淀经验的任务运行时”。十、完整链路总表一条请求到底经过了哪些站点链路阶段核心问题关键模块/文件输出结果入口接入消息从哪里来CLI / gateway/run.py / API / ACP / Cron标准化用户消息会话识别属于哪个用户和任务gateway/session.py / hermes_state.pySession ID / History上下文组装模型需要知道什么背景agent/prompt_builder.py系统 PromptProvider 解析该调用哪个模型runtime_provider.py / providers/api_mode / base_url / key模型调用下一步要做什么run_agent.py / adapters文本或 tool_calls工具执行怎么把决定变成动作model_tools.py / tools/registry.pyTool Result循环推进是否需要继续做AIAgent Loop继续调用模型或结束容错保护上下文、模型、预算失控怎么办context_compressor / fallback / IterationBudget压缩、切换、停止总结持久化过程如何保存state.db / MEMORY.md / Skills / trajectory可恢复、可检索、可复用十一、源码阅读路线按请求链路去看效率最高如果你想看 GitHub 源码不建议直接从最大文件开始硬啃。更好的方式是顺着一次请求的生命周期看入口怎么接入会话怎么恢复Prompt 怎么构造Provider 怎么解析模型怎么调用工具怎么执行最后状态怎么落盘。第一步看 Architecture先建立整体地图。第二步看 Agent Loop Internals理解 AIAgent 的主职责。第三步看 Prompt Assembly理解系统提示词从哪些来源组成。第四步看 Provider Runtime Resolution理解模型供应商如何统一。第五步看 Tools Runtime理解工具注册、Schema、Dispatch。第六步看 Session Storage理解跨平台任务如何延续。第七步回到 run_agent.py对照前面的概念读主循环。十二、总结一次用户请求进入 Hermes 后本质经历了三次转换第一从“平台消息”转换成“标准任务”入口层和会话层负责识别来源、用户、平台、历史上下文。第二从“自然语言”转换成“可执行循环”Prompt Builder 把身份、记忆、技能、项目规则和工具说明装进模型上下文AIAgent 再通过模型调用和工具调用循环推进任务。第三从“执行结果”转换成“长期资产”Session 保存过程Memory 保存事实Skills 沉淀流程Trajectory 留作调试和评测。这也是 Hermes 越用越像长期助手的原因。所以理解 Hermes Agent 的完整链路不要只盯着模型。真正的主线应该是入口、会话、上下文、模型、工具、容错、持久化。模型负责判断下一步Hermes 负责把这个判断放进一个可以长期运行、可以跨平台延续、可以安全执行动作的工程系统里。

相关文章:

从用户一句话到任务完成:Hermes Agent 一次请求完整链路详解

一、先说结论:Hermes 不是“问一句答一句”的普通聊天框很多人理解 AI 应用时,会把它想成一个 Chatbot:用户发一句话,模型回一句话。但 Hermes Agent 的请求链路更像一个“任务操作系统”。用户的一句话进入系统后,Her…...

Sunshine自托管游戏串流终极指南:打造跨平台家庭游戏云的完整解决方案

Sunshine自托管游戏串流终极指南:打造跨平台家庭游戏云的完整解决方案 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想象一下这样的场景:您坐在客厅沙发上…...

Python项目框架解析

...

都在喊难,它却狂赚!深度扒开长鑫科技底牌:什么才是决定生死的产业势?

2026年的商业世界,正在经历一场冰火两重天的考验。 一边,是无数传统企业在需求萎缩、价格内卷的泥潭里苦苦挣扎,老板们每天为了几毛钱的利润拼得头破血流;而另一边,一份堪称“核弹级”的财报,直接炸翻了整个…...

AI驱动的DNA分析平台:简化生物信息学流程

1. 项目概述:当生物信息学遇上“开箱即用”的AI逻辑引擎“BIOREASON”这个名字一出现,我就下意识在笔记本上画了个双螺旋和神经网络的交叉草图——不是为了炫技,而是因为过去八年里,我亲手调试过三十多套DNA分析流程,从…...

即插即用AI记忆协议:跨模型兼容的记忆中间件

1. 项目概述:不是“插件”,而是一套可即插即用的AI记忆增强协议你有没有遇到过这样的情况:刚让大模型帮你梳理完一份30页产品需求文档的逻辑漏洞,转头问它“第三章提到的用户分层标准是否和第五章的测试样本筛选条件冲突”&#x…...

认知通量(CT):用语义带宽、时序保真度与概念熵减重构AI训练评估

1. 项目概述:这不是又一个“大模型参数秀”,而是一次对AI认知边界的重新测绘“From 1T Tokens to Total Cognition: The Numbers Behind the New AI Brain…”——这个标题里没有一个生僻词,但组合在一起,却像一把钥匙&#xff0c…...

GitHub 被黑或因员工安装 Nx Console 恶意扩展引发,更多详情待调查

聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士专栏供应链安全数字化时代,软件无处不在。软件如同社会中的“虚拟人”,已经成为支撑社会正常运转的最基本元素之一,软件的安全性问题也正在成为当今社会的…...

独家逆向分析ElevenLabs印地文语音模型架构(基于HTTP/3流量捕获+声学特征聚类):发现其隐式支持马拉地语-印地语混合语境

更多请点击: https://codechina.net 第一章:ElevenLabs印地文语音模型的逆向分析背景与核心发现 近年来,ElevenLabs 以高保真多语言语音合成能力著称,但其印地文(Hindi)语音模型未公开架构细节、训练数据构…...

2026年长沙美缝施工团队哪家强?专业之选等你来揭秘!

在长沙高端住宅、别墅装修领域,美缝施工是提升家居质感的关键环节。面对众多美缝施工团队,业主们常常不知如何选择。今天,我们就来揭秘2026年长沙值得信赖的美缝施工团队——长沙匠心徐师傅美缝团队,看看它有哪些独特的优势。一、…...

2026年想找口碑好的长沙瓷砖美缝?哪家专业这里给你答案!

装修是一件充满期待却又布满挑战的事情,而美缝作为装修收尾的关键一步,其重要性不言而喻。然而,许多业主在美缝过程中遭遇了各种困扰,究竟怎样才能找到一家专业靠谱的美缝团队呢?在长沙,长沙匠心徐师傅美缝…...

2026年,专业打造湖南美缝施工极致体验的宝藏公司你知道吗?

在湖南,装修市场日益繁荣,美缝作为装修中至关重要的一环,其品质直接影响着家居的整体美观与舒适度。今天,就带大家了解一家专业打造湖南美缝施工极致体验的宝藏公司——长沙匠心徐师傅美缝团队。一、高端服务体系贴合业主核心诉求…...

模型加速全景图:从“瘦身”到“飞驰”的知识图谱

文章目录知识图谱:模型加速的三大维度维度一:模型自身优化(让模型更“瘦”)维度二:计算过程优化(让计算更“顺”)维度三:硬件与系统优化(让硬件更“忙”)如何…...

淘宝淘金币自动化脚本:3步解放你的双手,每天多赚30分钟自由时间

淘宝淘金币自动化脚本:3步解放你的双手,每天多赚30分钟自由时间 【免费下载链接】taojinbi 淘宝淘金币自动执行脚本,包含蚂蚁森林收取能量,芭芭农场全任务,解放你的双手 项目地址: https://gitcode.com/gh_mirrors/t…...

农业电商服务系统(10078)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告/任务书)远程调试控屏包运行一键启动项目&…...

kafka安装与可视化工具offset explore连接操作说明

1.1 环境前置要求 本地部署 Kafka 4.0 极简,无复杂依赖,只需满足 1 个核心条件: 本地已安装 JDK 17 及以上版本(推荐 JDK 17),并配置好 Java 环境变量(能在命令行执行 java -version 和 javac -…...

名胜古迹旅游网站的设计与实现(10076)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告/任务书)远程调试控屏包运行一键启动项目&…...

谷歌 I/O 开发者大会亮点多:Gemini Spark、YouTube 搜索等新功能来袭!

谷歌 I/O 开发者大会拉开帷幕 谷歌年度 I/O 开发者大会于周二在加利福尼亚州山景城拉开帷幕,会上发布了众多新的 AI 功能、硬件和工具。记者在现场通过 CNET 的实时博客报道了每一项更新。以下是一些亮点回顾。 Gemini Spark 任务自动化 AI 是今年谷歌 I/O 大会的核…...

一键部署开源 AI 项目教程:OpenClaw 下载安装启动卸载全流程

AIStarter 是什么?一文彻底讲清楚很多朋友第一次看到 AIStarter 和 PanelAI 都比较懵:这到底是个什么工具?简单来说,AIStarter 是一款专为本地 AI 部署打造的一键安装管理平台,它能帮助开发者快速下载、安装、启动各种…...

AI写论文秘籍!4款AI论文写作工具,解决论文创作的烦恼!

学术写作难题与AI论文写作工具推荐 在撰写期刊论文、毕业论文或职称论文时,学术研究人员常常面对许多困难。人工创作论文,面对海量的参考文献,寻找合适的资料仿佛在大海中捞针;繁琐的格式要求时常让人感到心力交瘁;而…...

AI设计泳装,效率能翻几倍?

炎夏未至,泳装行业的备战硝烟却已弥漫。设计师灵感枯竭、打版反复修改、样衣成本高企……每一个痛点都像一座大山,压得品牌方喘不过气。面对Z世代瞬息万变的审美,“快”与“准”成了决胜关键。北京先智先行科技有限公司,正携旗下“…...

GanttProject免费开源项目管理工具:简单高效的甘特图软件完全指南

GanttProject免费开源项目管理工具:简单高效的甘特图软件完全指南 【免费下载链接】ganttproject Official GanttProject repository. 项目地址: https://gitcode.com/gh_mirrors/ga/ganttproject GanttProject是一款功能强大的免费开源项目管理工具&#xf…...

终极文档下载指南:如何用kill-doc一键拯救30+平台的文档资源

终极文档下载指南:如何用kill-doc一键拯救30平台的文档资源 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才能下载文档,该脚本就是…...

毫米波高汇聚空馈天线技术【附方案】

✨ 长期致力于透射阵天线、高增益、宽角波束扫描、共形设计、近场赋形研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)低剖面透射阵天线设计&#xff…...

实战指南:5个关键技术揭秘PUBG罗技鼠标宏后坐力控制脚本

实战指南:5个关键技术揭秘PUBG罗技鼠标宏后坐力控制脚本 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg logitech-pubg是一个针对《绝…...

uml学习笔记(1)

UML学习笔记一:面向对象与UML基础入门 一、面向对象开发思想 两种开发范式对比 结构化方法:以功能、流程为核心拆分模块。逻辑简单直观,但复用性差、耦合度高、维护困难,不适合复杂大型项目。面向对象方法:以现实事物的…...

Onekey Steam清单下载工具:3步搞定游戏清单管理的终极指南

Onekey Steam清单下载工具:3步搞定游戏清单管理的终极指南 【免费下载链接】Onekey Onekey Steam Depot Manifest Downloader 项目地址: https://gitcode.com/gh_mirrors/one/Onekey 在Steam游戏生态中,清单文件是连接游戏客户端与服务器资源的关…...

进口与国产扁线电感参数PK:Coilcraft SER2918H-103KL vs TONEVEE ZER2918-H103K

在大电流电源设计领域,扁线电感因低直流电阻、高饱和电流及良好的散热性能,成为 DC-DC 转换器、VRM 及工业控制等场景的核心器件。美国 Coilcraft(线艺)作为国际品牌,其 SER2900 系列长期占据高端市场;国产…...

Promptfoo的搭建与测试,2026-0521成功版很简单

可能写的有点粗糙,但是我搞通了,有不懂的可以问我,懒得再更新了 其实我也是520当天搭建好的,现在的教程也不多,我就搜了搜,没什么具体的步骤,我想用windows感觉更方便一点但是一直不行各种版本…...

人工智能在科学领域需要设立防护措施,避免对它不加批判地采用

耶鲁大学人类学研究生院主任Lisa Messeri、和普林斯顿大学的心理学家M. J. Crockett 发给《自然》期刊的论文中阐述:人工智能正在迅速加速科学产出,但也有可能缩小研究范围,削弱判断力,削弱科学家的培训方式。科学界正以惊人的速度…...