当前位置: 首页 > article >正文

跳出传统 RAG!用 LLM Wiki 构建闭环式产品 Agent 协作体系

这段时间我在了解 LLM Wiki 之后把它当成一套「私域知识库 Agent 工作流」的底座做了一次具体实践。这篇文章主要想记录我对 LLM Wiki 的理解以及我怎么基于这套思路去构建一个产品 Agent知识库如何组织产品工作流如何串起来最后又如何和 GitLab 上的 PRD、Epic、Issue 这些需求资产衔接。下面我会先按 gist 里最关键的那几条理念对齐一下我对 LLM Wiki 的理解再写我怎样在此基础上做产品 Agent知识库长什么样、入口 skill 怎么设计、Hermes 里怎么挂定时任务和默认提示词。中间我放了一张架构图把整体串起来。LLM Wiki 在说什么Andrej Karpathy 在那份 gist 里描述的并不是再做一个「上传文件 → 向量检索 → 答一次题」的 RAG他强调的是一种会持续维护的中间层模型不只在提问瞬间去拼片段而是把读过的材料整理进一套互联的 wiki 里包括实体页、概念页、摘要、对照表、索引等内容。交叉引用提前存在矛盾会被标出来综述也会随着新材料迭代。我的理解是wiki 本身会成为一个持续积累的知识产物而不是每次问答都从零重新发现知识。从这个角度我自己的感受更接近「把知识显式地摊开给模型」网络化页面之间的关系、索引与入口本身就是线索模型不必每次都从大量原始文档里重新查找。减轻上下文压力大量细节落在 wiki 层对话里更多是做检索、对齐与增量更新而不是每次把整个资料堆塞进提示词。利用效率更高知识已经按类型归档并且通过页面关系连接起来查询时更容易找到相关内容。gist 里把结构分成很清晰的三层我后面搭库也基本按这个结构来理解Raw原始资料放进来的地方偏向「只读真相源」ingest 时从这里读不在这里乱改语义。Wiki模型主导维护的一层 markdown包括摘要、实体、概念、来源引用、对照比较等内容。人负责读与审模型负责写与串联。Schema告诉模型目录怎么长、页面怎么写、ingest / query / lint 的时候要遵守什么流程。这一层决定模型如何维护知识库。运营层面 gist 提了三个动作也非常贴合工程化Ingest新资料进 raw模型读、抽要点、更新索引与相关页必要的话在 log 里留痕。Query对着 wiki 发问带着引用组织答案有价值的回答还可以补充回 wiki成为后续知识的一部分。Lint定期做健康检查包括陈旧信息、孤立页面、缺少页面的重要概念、没有补齐的交叉引用等。他也提到了Obsidian对人的一侧侧边开 Agent另一边开图视图人看文档关系和关键页面模型负责批量改文件。wiki 本身可以就是一个 git 仓库这套组合在实践里也比较自然。我怎样理解「产品 Agent」对我来讲产品 Agent 不只是用来生成 PRD 的工具。我更愿意把它定义成以知识和经验为主的智能体并且它的动作要尽量贴着团队真实协作方式来设计。也就是说先要有一套团队可用的知识结构与工作流Agent 才能在具体流程里发挥作用。所以顺序是先构建 LLM Wiki 的私域知识库再思考还需要哪些 skill 作为工具最后用入口 skill把「聊需求 → 落文档 → 拆 Epic → 知识回收」串起来。知识库按 LLM Wiki 的标准拆三层我的目录结构和 gist 的三层一一对应只是在wiki里按用途拆得更细一点方便人和模型使用。raw/原始文档与裁剪下来的来源材料。ingest 的起点。wiki/下面分了comparisons、concepts、entities、sources、summaries等不同类型的页面区。本质是把 gist 里提到的 summary / entity / concept / comparisons 这些页面类型固定下来减少模型每次处理资料时重新判断分类的成本。schema/这一层写清楚整体目录语义、wiki 页的格式约定含Obsidian友善的链接与别名习惯、以及Ingest / Query / Lint的具体 SOPIngest原始资料进 raw 之后如何抽主题、写哪几类页、如何更新索引、如何记变更日志。Query如何先从索引或目录入口收窄范围再深读页面、如何带引用回答。Lint定期要检查哪些一致性问题、孤立页面、过期声明。用 Obsidian 做前端也很常见。它可以可视化地看到文档之间的关系适合人工维护和审阅知识库Agent 侧继续负责批量更新 markdown。初始数据与边界我最初的种子数据来自 GitLab把产品相关的Epic / Issue拉下来当作第一批实体与脉络。这里我觉得初始数据质量很关键如果一开始进入知识库的信息就不准确后续维护成本会变高也会影响模型对知识的理解。另一个我很在意的点是领域边界。我刻意不让「所有产品知识」都进同一个大杂烩而是让知识库聚焦在少数几个域。原因很简单关联范围太大query 时会引入更多无关信息。维护成本会上升交叉引用越多lint 和人工审阅的工作量也会随之增加。知识库能跑起来之后我在仓库根目录补了AGENTS.md。它的作用很单纯任何模型在第一次进入这个知识库时先读到这份库的用途、LLM Wiki 的理念并且被引导去阅读schema。这样即使是新会话也能先了解知识库的使用方式。Skill 层GitLab 与 Product Workflow光有 wiki 还不够。要让流程在团队系统里落地还需要能够写回 GitLab 的能力。GitLab skill这套 skill 我很早就有但在想产品 Agent 的时候我把它更多放在承接产品结论的位置讨论清楚后可以把共识整理成PRD上传到 GitLab Wiki。之后可以继续用基于 Wiki 中 PRD 的Epic 拆分工具把大颗粒需求切成可执行 issue 树。这两条加上之后产品 Agent 就有了一条比较明确的工作流讨论结果可以从对话进入 GitLab并继续拆成后续可执行的需求。Product Workflow skill入口我还做了一个更上位的product workflowskill定位就是 Agent 的入口 skill它不负责替代所有细节工具而是提供背景信息和主要工作流程。里面会放齐背景材料——公司背景、项目背景、团队组织、关键仓库与 GitLab 入口——但最核心的还是主流程指引私域知识库是产品信息的第一信源需要时先从 wiki 拉脉络再下结论。GitLab skill承载 PRD、wiki、issue/epic 相关动作。和用户讨论需求时该查库就查库有结论后询问是否把 PRD 落到 GitLab并是否继续Epic 拆分。如果出现新的关键事实询问是否要写入知识库并走Ingest。用户当场纠正的信息要落实到知识更新本质上是一次小 ingest 或定向修订。Hermes、定时任务与默认加载这一套我跑在Hermes上。除了对话能力之外我用它的定时任务加了一个小脚本每天扫一遍知识库如果发现新增文件就触发一轮lint / 健康检查。这样可以及时发现新增内容带来的格式和引用问题。同时我把Product Workflow skill 默认放进 Hermes 入口提示词里。效果是用户提出和需求相关的问题时Agent 会先进入「产品工作流 LLM Wiki」这套上下文再决定是否查询知识库或调用 GitLab 工具。整体架构可以用下面这张图概括。写完之后的感受对我来说这次实践最大的收获不是「又多了一个 Agent」而是在做 Agent 的过程中我越来越意识到知识库设计和维护的重要性。模型可以批量修改很多互相关联的页面所以前期的目录设计、页面格式和更新流程都需要尽量明确。反过来这也会改变一部分产品工作的重心有些工作会从「每次在聊天里复述背景」转移到审阅 wiki、划定领域边界、决定什么值得 ingest。gist 里提到人负责来源、探索和提问LLM 负责总结、交叉引用和维护我觉得这个分工在团队场景里也成立。但专业产品仍然不可替代因为哪些信息值得入库、哪些只是临时判断仍然需要人来判断。如果你也在搭类似系统最值得参考的可能不是某个目录名而是这三件事三层分离、schema 写清楚流程、入口 skill 把默认工作方式讲清楚。后面的工具链GitLab、定时 lint、Obsidian都可以按环境替换但这套结构能帮助 Agent 保持比较稳定的行为。

相关文章:

跳出传统 RAG!用 LLM Wiki 构建闭环式产品 Agent 协作体系

这段时间我在了解 LLM Wiki 之后,把它当成一套「私域知识库 Agent 工作流」的底座,做了一次具体实践。这篇文章主要想记录我对 LLM Wiki 的理解,以及我怎么基于这套思路去构建一个产品 Agent:知识库如何组织,产品工作…...

龙芯LS2K PMON启动全景:从mainbus到U盘识别

【龙芯LS2K PMON终极干货】整机设备启动全景图:从 mainbus 开机到 U 盘识别全流程 大家好,本篇是PMON/BSD内核设备模型大结局。 我将把你所有文件: mainbus、localbus、pci、pcibr、pcilotg、lotg、dwc2、usb、ioconf.c、cfdata 全部串成一张从开机上电到U盘识别的终极全景…...

东南大学论文模板终极指南:8倍效率完成毕业论文排版的完整解决方案

东南大学论文模板终极指南:8倍效率完成毕业论文排版的完整解决方案 【免费下载链接】SEUThesis 东南大学论文模板 项目地址: https://gitcode.com/gh_mirrors/seu/SEUThesis 东南大学SEUThesis论文模板库是东大学子必备的学术写作神器,它能将论文…...

工业级字符识别实战:C#结合YOLO+Tesseract实现药品批号与电子元件丝印精准校验

在工业自动化生产线上,字符识别一直是质量管控的核心环节。从药品包装的批号、有效期到电子元件的丝印型号、批次号,每一个字符的错误都可能导致严重的产品质量问题甚至安全事故。 传统的OCR方案在面对工业场景时往往力不从心:字符倾斜、背景…...

Android Studio中文界面快速配置指南:5分钟告别英文开发困扰

Android Studio中文界面快速配置指南:5分钟告别英文开发困扰 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack 还在为An…...

从 Dify 配置页理解 RAG 的重要参数

RAG(Retrieval-Augmented Generation,检索增强生成)经常被一句话概括成“先检索,再回答”。这句话没有错,但如果真的要把一个知识库调到可用,仅仅理解这四个字还不够。真正影响答案质量的,往往是…...

无人超市|基于Java+vue的无人超市管理系统(源码+数据库+文档)

无人超市管理系统 基于SprinBootvue的无人超市管理系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 后台管理员模块实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂…...

如何在15分钟内完成Windows系统优化和软件批量安装:WinUtil完全指南

如何在15分钟内完成Windows系统优化和软件批量安装:WinUtil完全指南 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 你是否曾为新…...

IT运维、远程协助必看!ToDesk录屏功能实测:被控方也能“回放”操作全程

Hello大家,不知道各位有没有注意到,在ToDesk远程控制上新的V4.8.8.9版本中,无论是在基本设置还是在远控连接过程中的悬浮球功能栏里都能看见【录屏设置/开始录屏】这一项!那么,这究竟是何意味呐?又有哪些人…...

核心主题:IT人如何通过系统性技能提升实现高效编码

核心主题:IT人如何通过系统性技能提升实现高效编码 技术能力维度 编程语言深度掌握(如Python、Java等主流语言特性与底层原理)算法与数据结构实战应用(LeetCode高频题型与工程化落地)设计模式与架构思维(…...

如何完整破解Cursor Pro限制:终极免费激活方案全解析

如何完整破解Cursor Pro限制:终极免费激活方案全解析 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tria…...

DataRoom:企业级数据可视化大屏设计器的架构创新与实践价值

DataRoom:企业级数据可视化大屏设计器的架构创新与实践价值 【免费下载链接】DataRoom 🔥基于SpringBoot、MyBatisPlus、ElementUI、G2Plot、Echarts等技术栈的大屏设计器,具备目录管理、DashBoard设计、预览能力,支持MySQL、Orac…...

GEO优化适合什么类型的企业

这是一个非常务实的问题。很多企业主会担心:“GEO这么高大上的东西,是不是只有大品牌才用得上?”答案是:GEO适用于几乎所有希望通过线上渠道获取客户的企业,只是不同体量、不同行业的企业,适配的GEO策略有所…...

深度掌握GB28181视频监控API:构建高效国标协议的3个核心技巧

深度掌握GB28181视频监控API:构建高效国标协议的3个核心技巧 【免费下载链接】wvp-GB28181-pro 基于GB28181-2016、部标808、部标1078标准实现的开箱即用的网络视频平台。自带管理页面,支持NAT穿透,支持海康、大华、宇视等品牌的IPC、NVR接入…...

AI圈今日大事(2026-05-21)

AI圈今日大事(2026-05-21)1. 阿里云峰会:真武M890芯片 Qwen3.7-Max 双料齐发今日阿里云峰会上,阿里平头哥正式发布新一代训推一体AI芯片 真武M890:性能:相比前代真武810E提升3倍,内置144GB显存…...

CyberChef:浏览器中的数据安全处理实践

CyberChef:浏览器中的数据安全处理实践 【免费下载链接】CyberChef The Cyber Swiss Army Knife - a web app for encryption, encoding, compression and data analysis 项目地址: https://gitcode.com/GitHub_Trending/cy/CyberChef CyberChef是一款基于浏…...

知识图谱与推荐系统实战

一、传统推荐系统的“天花板”协同过滤的困境你刷电商、看视频时,推荐系统总在猜你喜欢什么。最经典的协同过滤思路是“物以类聚、人以群分”:你买过A,那么买过A的人也常买B,于是把B推给你。这套方法简单有效,但也有硬…...

在自动化工作流中集成大模型,利用Taotoken统一API调用与管理

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在自动化工作流中集成大模型,利用Taotoken统一API调用与管理 将大模型能力集成到自动化工作流中,例如CI/CD…...

如何3分钟完成Steam游戏清单下载?Onekey工具终极指南

如何3分钟完成Steam游戏清单下载?Onekey工具终极指南 【免费下载链接】Onekey Onekey Steam Depot Manifest Downloader 项目地址: https://gitcode.com/gh_mirrors/one/Onekey 你是否曾经为了获取Steam游戏清单而花费数小时?手动查找App ID、配置…...

用知识图谱重构搜索引擎

一、传统搜索:关键词的“机械匹配”时代你输入词,它找文档我们熟悉的搜索引擎,无论是早期的Google还是百度的首页,核心逻辑都是关键词匹配。你输入“苹果热量”,它就把互联网里包含“苹果”和“热量”两个词的网页抓出…...

CyberChef:网络安全工程师的终极数据处理瑞士军刀

CyberChef:网络安全工程师的终极数据处理瑞士军刀 【免费下载链接】CyberChef The Cyber Swiss Army Knife - a web app for encryption, encoding, compression and data analysis 项目地址: https://gitcode.com/GitHub_Trending/cy/CyberChef 你是否曾遇到…...

三小时搞定百年乐谱数字化:Audiveris光学音乐识别技术实战指南

三小时搞定百年乐谱数字化:Audiveris光学音乐识别技术实战指南 【免费下载链接】audiveris Latest generation of Audiveris OMR engine 项目地址: https://gitcode.com/gh_mirrors/au/audiveris 你是否曾面对堆积如山的古典乐谱束手无策?那些泛黄…...

Windows 11系统优化终极方案:用Win11Debloat免费提升电脑性能

Windows 11系统优化终极方案:用Win11Debloat免费提升电脑性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter…...

网页视频抓取终极指南:猫抓工具让你轻松收藏全网精彩内容

网页视频抓取终极指南:猫抓工具让你轻松收藏全网精彩内容 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 还在为网页上的精彩视频无法保…...

MultiHighlight插件:让代码阅读不再痛苦的终极解决方案

MultiHighlight插件:让代码阅读不再痛苦的终极解决方案 【免费下载链接】MultiHighlight Jetbrains IDE plugin: highlight identifiers with custom colors 🎨💡 项目地址: https://gitcode.com/gh_mirrors/mu/MultiHighlight 你是否…...

企业网盘怎么选?从同步效率、权限、安全合规到协作:2025横评清单

随着企业数字化办公深化,企业网盘承载的内容从项目文件扩展到合同、投研材料、设计源文件、制度文档与交付归档。选型时如果只看容量和下载速度,往往会忽略更关键的管理问题:越权共享如何追责、误删误改如何恢复、离职交接如何确保资料不丢、…...

2026网盘怎么选:别只盯“不限速”,更该看同步稳定性与数据安全

很多人换网盘的导火索是“限速”,但真正拉开体验差距的,往往是:同步是否稳定、复杂网络下是否容易失败、多人协作有没有权限与版本控制、数据安全与合规是否站得住脚。下面这篇不再只比较“快不快”,而是用更贴近长期使用的维度&a…...

2026企业网盘选型指南:外部协作可控、合规审计、版本追溯的8款测评盘点

企业买云盘,表面是买存储,实际是在买“协作边界”。文件一旦要跨部门、跨项目、跨公司流转,最怕的不是空间不够,而是三件事: 1)外发出去收不回来;2)谁看过、谁下载过说不清&#xff…...

如果你还在为CAD、SolidWorks的许可发愁,看看这八家

先讲个真事。上个月我一个老同事打电话来,他们公司做非标自动化,四十几个机械工程师,用的主要是SolidWorks和AutoCAD。他说每年买浮动许可的钱快三百万了,结果研发那边还是天天有人排队等许可。他去看了一眼,下午两点半…...

职场新人不会写自我介绍怎么办?AI三分钟帮你搞定,面试邀约直接翻倍!

嘿,各位刚踏入职场的小萌新、想跳槽但又苦于没新项目亮点的打工人!你是不是也遇到过这种尴尬:辛辛苦苦写完简历,最后却卡在“自我介绍”或者“个人总结”那块? 要么就是寥寥几句套话,像“本人性格开朗&…...