当前位置：首页 > article >正文

我给Hermes配了4个Agent，真正有用的是这些事

article 2026/5/8 18:02:36

导读本文详细分享了作者使用 Hermes Agent 多智能体系统的几周经验强调先从个人日常任务和生活痛点出发确定 AI 用途而不是盲目追求技术。作者将AI视为助手用于处理重复性工作如技术研究摘要、健康资讯搜索、饮水提醒和姿势调整同时推荐记录一周活动以发现自动化机会。同时文章也介绍了低成本配置方案包括本地 Qwen 模型、OpenRouter 免费模型、Nous Portal 订阅和 ChatGPT Plus突出通过不同智能体分离研究与执行任务来优化效率。作者介绍vmiss33vmiss独立技术分析师与企业架构师电气工程师AI基础设施专家VCDX-236 认证持有者。专注分享多智能体系统与 Hermes Agent 实战经验。Image过去几周我一直在给 Hermes Agent 跑一套多 Agent 配置。说实话我花了一段时间才摸到现在这个状态。OpenClaw 最热的时候我也跟风装了盯着它看了一个小时然后再也没打开过。为什么因为我不知道该拿它做什么。我看着 X 时间线上大家聊得热火朝天又是各种新东西又是 Mac Mini 狂热潮自己坐在那里一头雾水但我确实很想参与进去。当你问“你用 AI Agent 做什么”时很多人会回答“什么都做”“全都做”或者“写代码”。我自己也给过类似答案。今天我想把一些入门思路讲清楚到底可以从哪些事情开始用 Hermes Agent怎样才能真正用出价值。我会结合一些自己的奇怪用法给你几个可以直接上手的例子。如何判断 Hermes Agent 该用来做什么我对 AI 的个人理念是把 AI 当成我的助手。我不用它替代我的思考而是让它把我指向正确方向。我会让它做苦活然后由我验证再继续推进。对于自动化任务我只会让 AI 自动化并执行那些我已经知道该怎么做的事情。这是我的个人原则你的情况可能会因为工作方式不同而不同。所以个人 AI Agent 到底应该用来做什么这是我们都会问的问题。我发现一个非常有用的方法是先把自己一天里做过的事情写下来然后认真看一遍那张清单。之后我又继续补充把这个清单扩展了一周左右。我会问自己“哪些事情花了很多时间”以及“哪些事情我必须做但对我的工作流价值不高”先列出这张清单然后开始用 Hermes 试。更生活化的部分还可以问自己另一个问题“你日常生活里有哪些麻烦”这里先别急着想该在本地硬件上跑哪个模型可以转向更柔软、更生活化的东西也就是真正影响你作为一个人的生活质量的事情。有没有哪些事你总是忘记做有没有哪些事你不得不处理但它们只是让生活变得更难当我这样问自己时又想出了几个非常有用的点子。经过一些头脑风暴后我就开始动手了。我的 Agent 小队当然我一开始就没有只用一个 Agent而是直接上了一组。Hermes 一个很棒的地方在于你可以配置不同 profile每个 profile 使用不同的 provider 和模型并且随时在 TUI 里轻松切换模型。我喜欢折腾所以这点对我来说非常加分可以并排比较不同模型的响应方式。下面是我当前 Agent 小队的拆解以及它们现在使用的 provider 和模型。我通过 Hermes TUI 和 Telegram 来访问它们。技术研究 Agent通常我会给这个 Agent 一个主题让它写一份带引用的研究简报。对我来说引用非常关键因为我想自己去读学术论文和源材料。比如我曾用这个 Agent 帮我学习如何做模型量化。我没有让 Agent 直接替我做量化而是让它教我怎么自己做。这个 Agent 目前使用 Nous Portal 上的 MiniMax M2.7不过过去我也让它用过其他模型和 provider比如 NVIDIA NIM 上的模型。技术任务管家 Agent我用这个 Agent 来给 Hermes 构建 skills。昨天我还让它完成了所有 Agent 的 TUI 定制。这基本上就是我的万能 Agent。这个 Agent 目前通过我的 ChatGPT Plus Codex 订阅使用 GPT 5.5不是 API。我很可能会继续让这个 Agent 使用 GPT 5.5同时准备一个备用方案以防什么时候配额用完。关于技术类 Agent 补充一句之前为了测试大量模型和 provider我曾经把它们混着用。但接下来我大概会继续保持现在这种分工一个负责研究另一个负责执行。生活方式 Agent冒着被吐槽的风险说一句我有一个 Agent 的工作是在一天中的特定时间提醒我喝水。荒唐吗是的。改变巨大吗绝对是。写到这里时我觉得接下来还要让它提醒我检查坐姿过去六个月我一直在努力修复多年伏案工作造成的问题以及提醒我起来活动。它会通过 Telegram 给我发消息提醒。这个 Agent 通过 OpenRouter 运行使用一个免费模型NVIDIA Nemotron 3 Super。生活方式 / 研究 Agent我长期受一种慢性健康问题困扰是 MCAS 的一种变体也伴随严重食物过敏。我用这个 Agent 在网上搜索相关研究和新闻也会让它处理一些很简单的事情比如“唉今晚该做什么晚饭”因为我吃的每一餐都要自己做。很简单的用法包括给它一组菜谱让它从里面选一个或者给它一组我想用的食材让它给我一些做法灵感。因为有些日子我真的只会想天啊怎么又要做饭了。信不信由你这个 Agent 跑在一个本地模型上用的是我一台随机游戏本里的 8GB RTX 4070 显卡。Hermes Agent 通过无线网络访问它。我会说这个 Agent 反而最让我“惊讶”因为我是在一个很小的本地模型上跑它。我用的是一个 Qwen 3.5 9B 量化模型64k 上下文。Provider / 模型我有一个个人任务尽可能便宜地做这件事甚至便宜到可能有点坑自己。我见过太多我称之为恐怖故事的案例有人直接接 Anthropic API一天花掉几百美元。不了谢谢。下面是我目前使用的一些模型和 provider。关于 Provider / 模型 / 成本的说明很多个人 Agent AI 的关键在于知道哪个模型能完成你需要的事情。这件事有一定个人化和主观性经常需要一些试错。许多 provider 都在补贴成本或者在模型发布时免费提供模型。很多免费模型确实有一些取舍比如速度但价格摆在那里。我也构建了一些 skills。如果我想继续研究当前哪些模型便宜或免费就会直接让 Agent 给我展示 Nous Portal / OpenRouter 的最新价格。OpenRouter免费模型我充值了 10 美元额度虽然实际上并不会用它但这样免费模型每天可以有 1,000 次请求每分钟 20 次请求。完全免费的账户每天只有 50 次请求很快就会用完。我目前在这里首选的免费模型是 nvidia/nemotron-3-super-120b-a12b:free。Nous Portal每月 10 美元订阅我买了 Nous Portal 每月 10 美元的订阅来做实验目前效果不错。因为它是基于 API 的订阅所以我用得比较克制不过它也包含 tool calling。现在我用的是 MiniMax M2.7。本地模型我的本地设备一般般但效果出乎意料地好。我用一台带 NVIDIA RTX 4070 的笔记本它有 8GB VRAM并用 llama.cpp 提供 64k 上下文服务。现在我最喜欢的小模型是一个 Qwen 3.5 9B 量化模型不过我也喜欢试一些随机的 distilled 和 abliterated 模型。说实话这套配置运行得很好。我也在 16GB RAM 的 M1 MacBook 上跑过同一个模型。你会惊讶于手头现有设备能在本地跑起什么。每个人都应该试试。LMStudio 是最容易上手的方式而且现在你可以很方便地从 Hermes 连接到它。ChatGPT Plus 订阅每月 20 美元通过我的订阅连接并使用 GPT 5.5效果非常好而且我还没遇到任何配额问题。我是一两天前才这么做的现在想不通为什么等了这么久。这几乎是无瑕的。NVIDIA NIM免费模型如果你打开 https://build.nvidia.com/models[1]会看到相当多模型都是免费的。注册一个账户就能拿到 API key。这是接触一大批模型、感受它们“手感”的好办法。通过 DeepSeek API 使用 DeepSeek v4我还没试过这个但 Twitter 上很多人都建议我试试 DeepSeek v4 API。它现在的价格非常惊人到五月底都有 75% 折扣还记得我前面提到的补贴吗。开始使用 Hermes Agent如果你刚开始正在纠结 AI Agent 到底能做什么我希望这篇文章能给你一些头脑风暴的方向也让你看到不用花很多钱就能很快、很轻松地开始。我见过人们使用 Agent 时最大的错误是一开始就盯着技术栈而不是从问题出发。你不需要先搞一堆 3090 才能开始当然如果你能弄到那也可以。先做起来。从你的生活开始。从你的工作流开始。从你的摩擦点开始。然后围绕这些点构建 Agent。这才是它真正变得有用的地方。参考阅读Agent架构关键变化Harness正在成为新后端明星开源项目为什么开始离开 GitHub300万人在存的Claude提示词别再把上下文当聊天记录Referenceshttps://build.nvidia.com/models: https://build.nvidia.com/models如果你也在关注 AI 应用如何真正落地到生产环境2026.6.26 - 6.27 GIAC 深圳站值得关注。这次大会会集中讨论智能应用开发、架构演进以及来自一线实践的经验与案例。识别二维码可申请大会体验门票点击阅读原文了解大会详细议程。

我给Hermes配了4个Agent，真正有用的是这些事

相关文章：

我给Hermes配了4个Agent，真正有用的是这些事

ZO2框架：18GB显存微调175B大模型，零阶优化与智能卸载技术解析

从开发者视角浅谈Taotoken官方价折扣对个人项目的影响

hack-interview：结构化面试知识体系，从原理到实战的系统设计指南

Taotoken用量看板如何帮助项目管理者追溯团队API消耗明细

LLMPapers：社区驱动的LLM论文知识库，助力研究者高效追踪前沿

CryptoGPT：基于LangChain的AI智能体实现链上金融操作实践

查看与管理团队API Key使用情况的审计日志功能详解

基于Aleo与零知识证明的隐私社交应用LoveSpark技术解析

Windows 11 24H2中近期被披露了一个高危本地权限提升漏洞

法律NLP实战：基于mclaw的法律文本智能分析与问答系统

法律文本智能解析：基于BERT与信息抽取的法律NLP实践

如何将影像组学与计算病理特征关联肿瘤微环境“反应/荒漠”基质表型建立关联，并进一步解释其与胰腺癌术后早期复发及ECM重塑的机制联系

3步告别英文困扰：FigmaCN中文界面插件的完整解决方案

如何用猫抓浏览器扩展打造终极网页媒体资源管理神器

NeMo AutoModel：基于PyTorch DTensor与SPMD的工业级大模型分布式训练框架

ROS2 不只是节点通信

QtScrcpy：解锁跨设备协同的终极方案，实现30ms低延迟投屏

【三维路径规划】基于遗传实现考虑水下生物雷达高炮威胁的导弹航路规划附matlab代码

如何高效使用Iwara视频下载工具：5个专业技巧提升动漫资源获取体验

百度网盘直链解析工具：3分钟解锁全速下载新体验

构建AI客服系统时利用Taotoken实现模型热切换与降级

蛋白与核酸小分子对接#生物医学科研 #生信分析 #生物信息学 #科研 #科研绘图

ComfyUI-Manager终极指南：如何轻松管理AI绘画工作流扩展

别再手动点播放了！用Vue3+Web Speech API实现数组语音自动轮播（附完整代码）

如何免费解锁原神60帧限制：终极FPS解锁工具完全指南

5分钟掌握：SketchUp STL插件实战指南，轻松实现3D打印模型转换

Oracle VPS web console入口

VR/AR市场破局：硬件降本与内容生态的七年博弈与未来展望

在Agent工作流中集成Taotoken实现稳定且低成本的多模型调用