当前位置: 首页 > article >正文

一文看懂 Hermes Agent 的 Prompt Builder:系统提示词到底拼进了什么?

一、先说结论Prompt Builder 是 Hermes 的“提示词总装车间”普通 Chatbot 的系统提示词往往是一段固定文字告诉模型“你是谁、怎么回答”。Hermes Agent 的 Prompt Builder 更像一条总装线它会把身份、记忆、用户画像、项目规则、技能目录、平台差异、工具使用规程、时间信息等材料统一组装形成一次会话真正使用的系统提示词。这件事很关键因为 Agent 不只是回答问题它还会读文件、改代码、调用工具、跨平台回复、延续历史任务。模型要安全地行动必须先知道当前任务边界、项目规则、可用能力、输出渠道和长期约束。官方架构文档把 prompt_builder.py 放在 Prompt System 中说明它负责从 SOUL.md、MEMORY.md、USER.md、Skills、Context Files、工具使用指导和模型特定指令中组装系统提示词。1.1 它解决的不是“写一句好 Prompt”而是“上下文治理”Prompt Builder 的难点不在于写得漂亮而在于判断信息该放在哪里。身份信息、项目规则、长期记忆、一次性提示、技能索引、平台渲染规则如果全混在一起系统就会变得难缓存、难维护、难排查也容易出现上下文污染。所以 Hermes 的设计思路是长期稳定的信息进入 cached system prompt只对当前调用有效的信息放到 ephemeral layers可复用流程沉淀为 Skills历史会话通过 session_search 按需检索项目规则通过 Context Files 加载。二、系统提示词会拼进哪几层内容官方 Prompt Assembly 文档明确给出 cached system prompt 的大致组装顺序Agent Identity、工具感知行为指导、Honcho 静态块、可选 system message、MEMORY 快照、USER 快照、Skills Index、Context Files、时间戳/Session ID、Platform Hint。2.1 第一层Agent Identity也就是“我是谁”最前面的身份层来自 ~/.hermes/SOUL.md。如果存在并且有内容SOUL.md 会替换代码里的默认身份如果不存在Prompt Builder 会回退到 DEFAULT_AGENT_IDENTITY。官方文档也强调SOUL.md 是从 HERMES_HOME 加载不是从当前项目目录加载。这层适合放 Agent 的长期人格、表达风格、工作原则例如“你是一个严谨的工程助手”“回答前优先验证事实”“不要为了显得聪明而编造”。它不适合放某个项目的 API 路径也不适合放一次任务的临时要求。2.2 第二层Tool-aware 行为指导告诉 Agent 如何行动Hermes 不是普通聊天机器人它会调用工具。因此 Prompt Builder 会注入工具相关的行为指导比如什么时候保存 Memory、什么时候使用 session_search、什么时候沉淀 Skill、什么时候必须实际调用工具而不是只描述计划。在 GitHub 的 prompt_builder.py 里可以看到 MEMORY_GUIDANCE、SESSION_SEARCH_GUIDANCE、SKILLS_GUIDANCE、TOOL_USE_ENFORCEMENT_GUIDANCE 等常量。它们不是业务内容而是 Agent 的操作规程。2.3 第三层Honcho 静态块启用时补充更深的记忆上下文当 Hermes 启用 Honcho 等外部记忆增强能力时会有额外的静态上下文块进入提示词。你可以把它理解为更强的用户建模和长期背景增强层。它不是所有安装都必然启用但 Prompt Builder 预留了这个位置。2.4 第四层Optional System Message用于部署或调用方补充某些调用场景会传入额外 system message比如企业部署要求、API Server 层面的统一风格、某个入口自带的约束。Prompt Builder 会把它作为可选层加入而不是让它覆盖全部系统。2.5 第五层和第六层MEMORY 与 USER 快照MEMORY.md 保存长期事实、环境细节、稳定约定USER.md 保存用户画像、长期偏好和习惯。官方文档说明本地 memory 和用户 profile 会在 session 开始时作为冻结快照注入session 中途写入磁盘不会立刻改变已经构建好的系统提示词。2.6 第七层Skills Index技能目录而不是技能全文Skills 是 Hermes 的经验沉淀机制但 Prompt Builder 不会把所有技能全文都塞进系统提示词。它通常放入一个紧凑的 skills index让模型先知道有哪些技能、适合什么场景需要时再通过 skill_view 加载完整内容。这就是 progressive disclosure先放目录再按需加载正文。它能显著降低 token 成本也能避免无关技能干扰当前任务。2.7 第八层Context Files当前项目的规则说明Hermes 通过 Context Files 知道当前项目。官方文档说明启动时会按优先级扫描 .hermes.md / HERMES.md、AGENTS.md、CLAUDE.md、.cursorrules / .cursor/rules/*.mdc命中后读取、扫描、截断并组装到 # Project Context 下。这些文件适合放项目级约定例如技术栈、目录结构、测试命令、提交规范、禁止修改的目录、API 入口、代码风格。它们不适合放用户长期偏好也不适合放一次性任务。2.8 第九层时间戳和 Session ID时间戳让 Agent 知道当前时间避免把过去和现在混淆Session ID 则用于任务追踪、会话恢复、日志关联。对于跨平台、长任务、自动化场景这些元信息非常重要。2.9 第十层Platform Hint告诉 Agent 当前在哪个入口说话同一段回答在 CLI、Telegram、Slack、Email、Cron、WebUI 中表达方式不同。Prompt Builder 会加入平台提示告诉模型应该用什么格式输出、能不能发送媒体、能不能使用 Markdown、能不能反问用户。三、为什么要区分 Cached Prompt 和 Ephemeral Prompt官方文档强调Hermes 有意把 cached system prompt state 和 API-call-time-only additions 分开。这是 Prompt Builder 最重要的设计之一因为它直接影响 token 使用、prompt caching 效果、session 连续性和 memory 语义正确性。3.1 Cached Prompt长期稳定适合缓存SOUL.md、MEMORY 快照、USER 快照、Skills Index、Context Files 这些内容相对稳定适合构成系统提示词前缀。对支持 prompt caching 的模型和 provider 来说稳定前缀越稳定缓存收益越明显。3.2 Ephemeral Prompt只对当前调用有效ephemeral_system_prompt、prefill messages、gateway-derived session overlays、later-turn Honcho recall 等内容只应该影响本次调用。如果把这些临时内容固化进系统提示词会让后续任务受到污染。3.3 这个边界解决了三个工程问题降低成本稳定部分更容易复用缓存减少重复处理。减少污染临时上下文不会变成长期规则。便于排查出现问题时可以判断是长期层错了还是本轮临时层错了。四、Context FilesPrompt Builder 怎么让 Hermes 知道当前项目项目上下文是 Prompt Builder 最容易产生误解的地方。很多人以为 Agent 会自动理解整个仓库其实不是。它依赖明确的项目规则文件把“这个项目怎么做事”写进系统提示词。官方 Context Files 文档给出的启动流程很清楚扫描工作目录、读取文件、执行安全扫描、对超过 20,000 字符的文件做头尾截断、组装到 # Project Context 下然后注入系统提示词。4.1 优先级不是全都加载而是 first match winsPrompt Builder 对项目文件使用优先级机制。官方文档写到.hermes.md / HERMES.md 优先其次是 AGENTS.md然后是 CLAUDE.md最后是 .cursorrules / .cursor/rules/*.mdc。它不是把所有文件都无脑拼进去而是按规则选择项目上下文。4.2 安全扫描防止项目文件变成 Prompt 注入入口Context Files 会被扫描检查类似“ignore previous instructions”、隐藏 HTML、不可见字符、凭证外泄命令、读取 .env 等危险模式。这说明 Prompt Builder 不只是拼文本它还承担了系统提示词入口的安全过滤职责。4.3 子目录规则执行中渐进发现启动时通常加载顶层规则。执行过程中SubdirectoryHintTracker 会从工具调用参数中提取路径在相关目录和父目录中寻找 AGENTS.md、CLAUDE.md、.cursorrules 等文件并把发现的规则追加到工具结果里让模型自然看到更细的目录规则。五、Memory、Skills、Context Files 三者到底怎么分工理解 Prompt Builder最关键的是分清这三类信息。它们都可能进入模型上下文但性质完全不同。信息类型应该放什么不应该放什么进入方式Memory长期稳定事实、环境、用户偏好任务进度、临时 TODO、过期结果MEMORY.md / USER.md 冻结快照Skills可复用流程、复杂任务经验、标准操作步骤一次性事实、当前项目路径Skills Index skill_view 按需加载Context Files当前项目规则、目录结构、测试命令、代码规范个人长期偏好、跨项目事实.hermes.md / AGENTS.md 等注入 # Project ContextEphemeral Layers本次调用临时补充、Gateway 当轮覆盖长期规则、稳定偏好API-call-time-only 附加六、平台提示与环境提示为什么同一个 Agent 在不同入口表现不同Hermes 支持 CLI、Telegram、Discord、Slack、Email、Cron、WebUI 等入口。不同入口的输出格式和交互方式差异很大CLI 不能真正发送附件Telegram 有自己的 Markdown 和媒体发送方式Email 更适合纯文本结构Cron 没有人在场不能反问。prompt_builder.py 中维护了 PLATFORM_HINTS针对不同平台给模型补充输出规则。这样做的好处是同一个任务在不同渠道不会用错表达方式。除此之外还有环境提示。例如 WSL、Windows Bash、Docker、SSH、Modal 等运行环境会影响路径、shell 语法、文件系统位置。Prompt Builder 会把这些差异告诉模型减少“命令跑错环境”的问题。七、Prompt Builder 与 Tool Schema 是什么关系Prompt Builder 主要负责系统提示词内容而工具 schema 则告诉模型“有哪些工具可以调用、每个工具需要什么参数”。在 Agent Loop 中AIAgent 会通过 prompt_builder.py 组装有效系统提示词和工具 schema然后选择 provider/API mode 发起模型调用。可以这样理解Prompt Builder 负责告诉模型“该怎么想、该遵守什么规则、当前任务背景是什么”Tool Schema 负责告诉模型“你可以做哪些动作”。两者结合模型才能从聊天变成可执行的 Agent。八、如果你想改 Hermes 的 Prompt应该改哪里官方文档建议绝大多数用户不要直接改 agent/prompt_builder.py。这个文件是实现代码不是配置面。直接改它等于改全局组装逻辑适合维护 fork 或贡献上游不适合日常使用。8.1 想改身份风格改 SOUL.md例如你希望 Agent 更像严谨工程师、研究助手、运维专家就改 ~/.hermes/SOUL.md。8.2 想改长期事实改 MEMORY.md / USER.md例如用户长期偏好、常用技术栈、固定环境、稳定项目路径可以放进 MEMORY.md 或 USER.md。8.3 想改项目规则改 Context Files例如“这个仓库用 pytest”“提交前运行 make lint”“不要改 generated 目录”应该写入 .hermes.md、AGENTS.md、CLAUDE.md 或 .cursorrules。8.4 想改可复用流程做成 Skill例如“发布流程”“排查线上故障流程”“写技术文章流程”“做代码审查流程”更适合做成 SKILL.md而不是塞进 Memory。8.5 想加单次限制用 Ephemeral 层例如某次任务要求“只输出 JSON”“这次不要改代码只分析”这类临时约束应该走 ephemeral_system_prompt 或调用方覆盖不应该写进长期文件。九、一次 Prompt 构建可以这样理解把 Hermes Prompt Builder 想象成一个“任务说明书生成器”它先从磁盘和配置里收集材料再做安全处理和截断然后按层级组装稳定提示词最后叠加当前平台和当次调用的临时信息送给模型。9.1 用一句话总结完整流程收集身份、记忆、用户画像、项目规则、技能目录和平台环境信息对外部文本做扫描与截断按稳定性和优先级分层组装把稳定部分作为 cached system prompt把当次临时内容作为 ephemeral layer最后交给 AIAgent 和 provider 执行模型调用。十、面向 Java 后端/AI 应用开发者的启发如果你要自己做 Agent 系统Prompt Builder 这套设计非常值得借鉴。不要把所有指令硬编码成一个长 prompt而要把信息分层管理。身份层定义助手是谁、长期风格是什么。记忆层保存长期事实和用户偏好但不要保存临时结果。项目层保存当前项目规则、目录结构、测试命令。技能层保存可复用流程按需加载。工具层通过工具 schema 告诉模型能做什么。平台层根据入口差异控制输出格式。临时层当次调用有效不污染长期状态。这样做之后你的 Agent 系统会更像一个可维护的工程平台而不是一堆堆叠 prompt 的脚本。十一、总结Prompt Builder 是 Agent 从“会聊天”变成“会做事”的前置大脑Hermes Agent 的 Prompt Builder 并不是简单拼接几段提示词而是在做系统级上下文编排。它把 Agent 身份、长期记忆、用户画像、项目规则、技能索引、工具使用指导、平台渲染规则、环境信息和临时调用层有序组织起来。真正值得学习的是它的工程思想稳定和临时分开事实和流程分开项目规则和用户偏好分开技能目录和技能全文分开平台渲染和业务逻辑分开。只有这样Agent 才能在长任务、跨平台、多工具、多会话场景下保持可控。所以Prompt Builder 的价值不是“让模型更会说”而是“让模型知道在什么上下文里、以什么身份、遵守什么规则、调用什么能力、完成什么动作”。这正是 Agent 工程化的核心。

相关文章:

一文看懂 Hermes Agent 的 Prompt Builder:系统提示词到底拼进了什么?

一、先说结论:Prompt Builder 是 Hermes 的“提示词总装车间”普通 Chatbot 的系统提示词往往是一段固定文字,告诉模型“你是谁、怎么回答”。Hermes Agent 的 Prompt Builder 更像一条总装线:它会把身份、记忆、用户画像、项目规则、技能目录…...

成都制造企业SRM和ERP数据对不上,AI协同先治理什么?

系统都上线了,为什么协同还是慢不少成都制造企业已经有ERP,也陆续上了SRM、WMS、MES或QMS。采购订单在线审批,供应商可以在SRM里报价,仓库可以扫码入库,质量部门也有检验记录。可一到真实协同,问题仍然反复…...

成都制造企业供应链价格波动频繁,AI智能体该先预警哪些信号?

一、价格波动不是采购一个部门能扛住的问题很多制造企业谈供应链价格波动,第一反应是让采购去谈价、催报价、找替代供应商。但在真实经营里,价格风险很少只停留在采购单价上。铜、铝、钢材、塑料、电子元器件、包装材料、运费、汇率和供应商产能变化&…...

AIAgent 才是 Hermes Agent 的“总调度器”:run_agent.py 在系统里到底负责什么?

一、先给结论:AIAgent 不是“大模型”,而是“任务总控台”很多人第一次看 Hermes Agent,容易把核心误解成“调用某个大模型的代码”。但从官方文档和源码结构看,真正的核心不是模型本身,而是 run_agent.py 里的 AIAgen…...

【系统架构师-综合题(5)】信息安全技术基础知识点

信息安全技术基础围绕的核心问题很统一:系统如何证明“我是安全的”,以及为了做到这一点,需要哪些目标、技术、协议和管理机制。 所以这一章最适合顺着一条从“安全目标”到“实现手段”再到“安全体系”的主线来理解。 先弄清信息安全到底保…...

LLM成长笔记(六):RAG(检索增强生成)

RAG(检索增强生成)全栈学习博客(通俗原理 详细注释 AI应用强化版) RAG 是让大模型“能回答它没学过的新知识”的核心架构。这篇博客从实际问题出发,用生活化类比建立直觉,通过术语详解深入概念本质&#…...

2026央国企求职哪家强?TOP机构帮你稳住铁饭碗!

引言综述随着 2026 届超 1200 万毕业生涌入就业市场,央国企岗位竞争愈发激烈,岗位竞争比持续攀升。在这样的大环境下,求职者的核心需求集中在系统备考规划、精准岗位匹配以及高保障面试辅导上。本次测评旨在为求职者提供客观、专业的机构对比…...

用高效证书管理加固企业数字边界

在当今企业 IT 基础架构的运行中,数字证书已经成为不可或缺的重要组成部分。这在很大程度上源于企业逐渐将 HTTPS 作为默认的数据传输方式,以实现更加安全的通信环境。从安全与隐私角度来看,这无疑是一项积极的改变,因为数据在传输…...

记一次 .NET 某集群管理软件 内存暴涨分析

一:背景 1. 讲故事 前些天有位朋友微信找到我,说它的程序出现了内存暴涨,自己也没分析出啥,让我看下到底怎么回事,然后让这位朋友抓一个dump,拿它占一卦就行了。 二:内存暴涨分析 1. 为什么会暴…...

容器资源限制

1、创建一个临时容器c1 docker run -it --namec1 --rm centos:v1监控容器的资源使用情况 docker statsmemload工具可以直接占用消耗资源 将memload工具拷贝到c1容器的opt目录下 docker cp memload-7.0-1.r29766.x86_64.rpm c1:/opt在运行的容器中安装上传的安装包 rpm -ivh /op…...

收藏!小白程序员必看:搞定RAG知识库,解锁大模型核心技能!

文章强调知识库是RAG系统的核心,其质量直接影响智能问答效果。构建知识库并非简单处理数据,而是涉及多数据源整合、复杂格式处理、数据更新与版本管理、文档召回优化及系统架构设计等关键环节。作者指出,随着数据量增长,完善的知识…...

原神抽卡数据分析终极指南:免费开源工具助你告别抽卡迷茫

原神抽卡数据分析终极指南:免费开源工具助你告别抽卡迷茫 【免费下载链接】genshin-wish-export Easily export the Genshin Impact wish record. 项目地址: https://gitcode.com/GitHub_Trending/ge/genshin-wish-export 还在为原神抽卡记录无法保存而烦恼吗…...

收藏!揭秘高薪职业:AI大模型训练师,小白也能入门的AI时代新机遇!

本文介绍了AI大模型训练师这一新兴职业,旨在解决AI与人类沟通的障碍。训练师通过拆解人类模糊需求,教AI识别信号,输出精准回应。随着AI技术普及,该岗位需求激增,薪资可达3w。工作内容包括数据管理、模型训练、评估迭代…...

原神祈愿数据分析终极方案:genshin-wish-export架构革命与效能倍增

原神祈愿数据分析终极方案:genshin-wish-export架构革命与效能倍增 【免费下载链接】genshin-wish-export Easily export the Genshin Impact wish record. 项目地址: https://gitcode.com/GitHub_Trending/ge/genshin-wish-export 你是否曾在多设备间苦苦同…...

打开U盘文件夹变成.exe的问题:在MAC ios中的解决办法

Mac文件夹变成.exe文件,通常是由于病毒将原文件夹隐藏并生成同名exe文件所致。 此类情况多发生于Mac移动硬盘或U盘在Windows系统感染病毒后,病毒会隐藏原始文件夹,并生成伪装成文件夹的exe文件。由于Mac系统默认不显示文件扩展名&#xff0c…...

SHE 密钥注入的“通配符魔法”:从 UID 通配到 AUTOSAR 分层落地

想象一下,你是一家汽车电子工厂的技术员,需要为成千上万个 ECU 刷写密钥。每个 ECU 都有一个独一无二的 ID(UID)。如果每次刷写都要读取这个 UID,再根据 UID 计算出专属的密钥数据,那产线的效率会大打折扣。…...

告别检测卡点,okbiye 智能双优化破解毕业论文查重与 AI 识别难题

okbiye-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPT降重复率 - Okbiye智能写作https://www.okbiye.com/reduceAIGC 一、引言:论文定稿阶段两大检测难题普遍困扰学子 论文撰写收尾阶段,绝大多数毕业生都会直面两道审核关卡&#x…...

Image2.0生成的PPT图片转换成可编辑的PPT的一种方法

老弟,PPT不想做,用AI生成的PPT图片编辑不了很烦恼是吧,俺有一法!~ Edit Banana(最强,开源免费) 能把 AI 图→可编辑 PPTX / DrawIO / SVG 原理:用 SAM 分割图标 / 形状,用…...

全球眼用缓释药市场调查:预计2032年将攀升至25.46亿美元

在全球人口老龄化加速与慢性眼病患病率持续攀升的背景下,眼用缓释药市场正迎来历史性增长窗口。据QYResearch(北京恒州博智国际信息咨询有限公司)最新统计,2025年全球眼用缓释药市场销售额已达15.00亿美元,预计2032年将…...

用 MinIO 搭建 S3 兼容对象存储服务

用 MinIO 搭建 S3 兼容对象存储服务 分类:开源项目部署 MinIO 适合附件、备份归档和 S3 兼容对象文件。这类主题真正跑起来并不难,难的是上线后稳定、可备份、能排错。本文按实操方式整理一套可以直接落地的流程,默认你已经会登录 Linux 服务…...

GEO生成引擎优化:当品牌竞争从搜索结果页迁移到大模型对话窗口

当生成式AI成为信息的首要分发渠道,你的品牌还只盯着SEO吗?一、用户获取信息的路径,已经变了过去十几年,我们习惯了"搜索关键词 → 浏览结果页 → 点击进入网站"这条线性路径。SEO(搜索引擎优化)…...

Perplexity案例法检索深度解析(工业级RAG系统落地避坑手册)

更多请点击: https://intelliparadigm.com 第一章:Perplexity案例法检索深度解析(工业级RAG系统落地避坑手册) Perplexity作为衡量语言模型预测不确定性的核心指标,在RAG系统中并非仅用于后处理重排序,而是…...

从OpenAPI 3.1规范到实时交互式文档:ChatGPT驱动的API文档生成闭环体系(含性能压测数据对比)

更多请点击: https://kaifayun.com 第一章:从OpenAPI 3.1规范到实时交互式文档:ChatGPT驱动的API文档生成闭环体系(含性能压测数据对比) OpenAPI 3.1 是首个原生支持 JSON Schema 2020-12 的 API 描述标准&#xff0c…...

2026线下全网营销课程5大甄选:高适配内容改善品牌转化低迷现状

引文/摘要把流量费花在无效投放上,不如先从内部梳理内容适配度。2026年全网营销进入新阶段,据调研超过78%的营销团队已将AI工具纳入日常工作流。然而很多企业面临“内容做了不少,转化却上不去”的尴尬。本质问题往往不是内容不够多&#xff0…...

气动黄油机核心技术解析:泵的选择与厂家评估方法论

工业黄油就是润滑脂,属于半固体润滑剂,润滑脂的作用主要是润滑、保护和密封。可以有效降低机械摩擦,防止磨损,同时还能防腐蚀及密封防尘。毫不夸张的说,润滑脂就是万金油,黄油加注机广泛应用于汽车制造业、…...

量子优化算法ITEMC:原理、实现与应用

1. 量子优化算法ITEMC的核心原理量子优化算法ITEMC(Imaginary Time Evolution Mimicking Circuit)是一种创新的混合量子-经典算法,专门用于解决二次无约束二进制优化(QUBO)问题。其核心思想源自量子力学中的虚时间演化…...

QQ空间说说备份终极指南:GetQzonehistory完整教程

QQ空间说说备份终极指南:GetQzonehistory完整教程 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否曾经想要永久保存QQ空间里那些珍贵的青春回忆?那些承载着…...

VMware虚拟机创建详细教程(新手小白友好)

本教程以 VMware Workstation Pro 16/17 版本为例,演示如何创建一台新的虚拟机。第一步:启动新建虚拟机向导打开VMware Workstation,点击主界面上的 “创建新的虚拟机”,或依次点击菜单栏“文件” → “新建虚拟机”。图1 VMware创…...

Photoshop‌2022安装教程

ps是一款使用率很高的设计工具,此篇分享一下Windows2022版本的安装教程 1、下载的压缩包解压2、右键以管理员身份运行Set-up.exe3、选择语言及安装位置(建议安装在系统盘C以外的其他磁盘)4、继续安装,等待安装完成点击关闭即可5、…...

Vue/React/Svelte通用Lovable实践框架(内部首发):1套配置+4个插件=自动注入用户喜爱度

更多请点击: https://kaifayun.com 第一章:Vue/React/Svelte通用Lovable实践框架(内部首发):1套配置4个插件自动注入用户喜爱度 Lovable 是一套面向用户体验(UX)可量化提升的前端工程化实践框架…...