当前位置: 首页 > article >正文

我给Hermes配了4个Agent,真正有用的是这些事

导读本文详细分享了作者使用 Hermes Agent 多智能体系统的几周经验强调先从个人日常任务和生活痛点出发确定 AI 用途而不是盲目追求技术。作者将AI视为助手用于处理重复性工作如技术研究摘要、健康资讯搜索、饮水提醒和姿势调整同时推荐记录一周活动以发现自动化机会。同时文章也介绍了低成本配置方案包括本地 Qwen 模型、OpenRouter 免费模型、Nous Portal 订阅和 ChatGPT Plus突出通过不同智能体分离研究与执行任务来优化效率。作者介绍vmiss33vmiss独立技术分析师与企业架构师电气工程师AI基础设施专家VCDX-236 认证持有者。专注分享多智能体系统与 Hermes Agent 实战经验。Image过去几周我一直在给 Hermes Agent 跑一套多 Agent 配置。说实话我花了一段时间才摸到现在这个状态。OpenClaw 最热的时候我也跟风装了盯着它看了一个小时然后再也没打开过。为什么因为我不知道该拿它做什么。我看着 X 时间线上大家聊得热火朝天又是各种新东西又是 Mac Mini 狂热潮自己坐在那里一头雾水但我确实很想参与进去。当你问“你用 AI Agent 做什么”时很多人会回答“什么都做”“全都做”或者“写代码”。我自己也给过类似答案。今天我想把一些入门思路讲清楚到底可以从哪些事情开始用 Hermes Agent怎样才能真正用出价值。我会结合一些自己的奇怪用法给你几个可以直接上手的例子。如何判断 Hermes Agent 该用来做什么我对 AI 的个人理念是把 AI 当成我的助手。我不用它替代我的思考而是让它把我指向正确方向。我会让它做苦活然后由我验证再继续推进。对于自动化任务我只会让 AI 自动化并执行那些我已经知道该怎么做的事情。这是我的个人原则你的情况可能会因为工作方式不同而不同。所以个人 AI Agent 到底应该用来做什么这是我们都会问的问题。我发现一个非常有用的方法是先把自己一天里做过的事情写下来然后认真看一遍那张清单。之后我又继续补充把这个清单扩展了一周左右。我会问自己“哪些事情花了很多时间”以及“哪些事情我必须做但对我的工作流价值不高”先列出这张清单然后开始用 Hermes 试。更生活化的部分还可以问自己另一个问题“你日常生活里有哪些麻烦”这里先别急着想该在本地硬件上跑哪个模型可以转向更柔软、更生活化的东西也就是真正影响你作为一个人的生活质量的事情。有没有哪些事你总是忘记做有没有哪些事你不得不处理但它们只是让生活变得更难当我这样问自己时又想出了几个非常有用的点子。经过一些头脑风暴后我就开始动手了。我的 Agent 小队当然我一开始就没有只用一个 Agent而是直接上了一组。Hermes 一个很棒的地方在于你可以配置不同 profile每个 profile 使用不同的 provider 和模型并且随时在 TUI 里轻松切换模型。我喜欢折腾所以这点对我来说非常加分可以并排比较不同模型的响应方式。下面是我当前 Agent 小队的拆解以及它们现在使用的 provider 和模型。我通过 Hermes TUI 和 Telegram 来访问它们。技术研究 Agent通常我会给这个 Agent 一个主题让它写一份带引用的研究简报。对我来说引用非常关键因为我想自己去读学术论文和源材料。比如我曾用这个 Agent 帮我学习如何做模型量化。我没有让 Agent 直接替我做量化而是让它教我怎么自己做。这个 Agent 目前使用 Nous Portal 上的 MiniMax M2.7不过过去我也让它用过其他模型和 provider比如 NVIDIA NIM 上的模型。技术任务管家 Agent我用这个 Agent 来给 Hermes 构建 skills。昨天我还让它完成了所有 Agent 的 TUI 定制。这基本上就是我的万能 Agent。这个 Agent 目前通过我的 ChatGPT Plus Codex 订阅使用 GPT 5.5不是 API。我很可能会继续让这个 Agent 使用 GPT 5.5同时准备一个备用方案以防什么时候配额用完。关于技术类 Agent 补充一句之前为了测试大量模型和 provider我曾经把它们混着用。但接下来我大概会继续保持现在这种分工一个负责研究另一个负责执行。生活方式 Agent冒着被吐槽的风险说一句我有一个 Agent 的工作是在一天中的特定时间提醒我喝水。荒唐吗是的。改变巨大吗绝对是。写到这里时我觉得接下来还要让它提醒我检查坐姿过去六个月我一直在努力修复多年伏案工作造成的问题以及提醒我起来活动。它会通过 Telegram 给我发消息提醒。这个 Agent 通过 OpenRouter 运行使用一个免费模型NVIDIA Nemotron 3 Super。生活方式 / 研究 Agent我长期受一种慢性健康问题困扰是 MCAS 的一种变体也伴随严重食物过敏。我用这个 Agent 在网上搜索相关研究和新闻也会让它处理一些很简单的事情比如“唉今晚该做什么晚饭”因为我吃的每一餐都要自己做。很简单的用法包括给它一组菜谱让它从里面选一个或者给它一组我想用的食材让它给我一些做法灵感。因为有些日子我真的只会想天啊怎么又要做饭了。信不信由你这个 Agent 跑在一个本地模型上用的是我一台随机游戏本里的 8GB RTX 4070 显卡。Hermes Agent 通过无线网络访问它。我会说这个 Agent 反而最让我“惊讶”因为我是在一个很小的本地模型上跑它。我用的是一个 Qwen 3.5 9B 量化模型64k 上下文。Provider / 模型我有一个个人任务尽可能便宜地做这件事甚至便宜到可能有点坑自己。我见过太多我称之为恐怖故事的案例有人直接接 Anthropic API一天花掉几百美元。不了谢谢。下面是我目前使用的一些模型和 provider。关于 Provider / 模型 / 成本的说明很多个人 Agent AI 的关键在于知道哪个模型能完成你需要的事情。这件事有一定个人化和主观性经常需要一些试错。许多 provider 都在补贴成本或者在模型发布时免费提供模型。很多免费模型确实有一些取舍比如速度但价格摆在那里。我也构建了一些 skills。如果我想继续研究当前哪些模型便宜或免费就会直接让 Agent 给我展示 Nous Portal / OpenRouter 的最新价格。OpenRouter免费模型我充值了 10 美元额度虽然实际上并不会用它但这样免费模型每天可以有 1,000 次请求每分钟 20 次请求。完全免费的账户每天只有 50 次请求很快就会用完。我目前在这里首选的免费模型是 nvidia/nemotron-3-super-120b-a12b:free。Nous Portal每月 10 美元订阅我买了 Nous Portal 每月 10 美元的订阅来做实验目前效果不错。因为它是基于 API 的订阅所以我用得比较克制不过它也包含 tool calling。现在我用的是 MiniMax M2.7。本地模型我的本地设备一般般但效果出乎意料地好。我用一台带 NVIDIA RTX 4070 的笔记本它有 8GB VRAM并用 llama.cpp 提供 64k 上下文服务。现在我最喜欢的小模型是一个 Qwen 3.5 9B 量化模型不过我也喜欢试一些随机的 distilled 和 abliterated 模型。说实话这套配置运行得很好。我也在 16GB RAM 的 M1 MacBook 上跑过同一个模型。你会惊讶于手头现有设备能在本地跑起什么。每个人都应该试试。LMStudio 是最容易上手的方式而且现在你可以很方便地从 Hermes 连接到它。ChatGPT Plus 订阅每月 20 美元通过我的订阅连接并使用 GPT 5.5效果非常好而且我还没遇到任何配额问题。我是一两天前才这么做的现在想不通为什么等了这么久。这几乎是无瑕的。NVIDIA NIM免费模型如果你打开 https://build.nvidia.com/models[1]会看到相当多模型都是免费的。注册一个账户就能拿到 API key。这是接触一大批模型、感受它们“手感”的好办法。通过 DeepSeek API 使用 DeepSeek v4我还没试过这个但 Twitter 上很多人都建议我试试 DeepSeek v4 API。它现在的价格非常惊人到五月底都有 75% 折扣还记得我前面提到的补贴吗。开始使用 Hermes Agent如果你刚开始正在纠结 AI Agent 到底能做什么我希望这篇文章能给你一些头脑风暴的方向也让你看到不用花很多钱就能很快、很轻松地开始。我见过人们使用 Agent 时最大的错误是一开始就盯着技术栈而不是从问题出发。你不需要先搞一堆 3090 才能开始当然如果你能弄到那也可以。先做起来。从你的生活开始。从你的工作流开始。从你的摩擦点开始。然后围绕这些点构建 Agent。这才是它真正变得有用的地方。参考阅读Agent架构关键变化Harness正在成为新后端明星开源项目为什么开始离开 GitHub300万人在存的Claude提示词别再把上下文当聊天记录Referenceshttps://build.nvidia.com/models: https://build.nvidia.com/models如果你也在关注 AI 应用如何真正落地到生产环境2026.6.26 - 6.27 GIAC 深圳站值得关注。这次大会会集中讨论智能应用开发、架构演进以及来自一线实践的经验与案例。识别二维码可申请大会体验门票点击阅读原文了解大会详细议程。

相关文章:

我给Hermes配了4个Agent,真正有用的是这些事

导读:本文详细分享了作者使用 Hermes Agent 多智能体系统的几周经验,强调先从个人日常任务和生活痛点出发确定 AI 用途,而不是盲目追求技术。作者将AI视为助手,用于处理重复性工作,如技术研究摘要、健康资讯搜索、饮水…...

ZO2框架:18GB显存微调175B大模型,零阶优化与智能卸载技术解析

1. 项目概述:用18GB显存微调175B大模型,ZO2框架如何实现?如果你尝试过在单张消费级显卡上微调一个百亿参数级别的大语言模型,大概率会立刻被“CUDA out of memory”的提示劝退。传统的全参数微调,光是加载一个175B参数…...

从开发者视角浅谈Taotoken官方价折扣对个人项目的影响

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 从开发者视角浅谈Taotoken官方价折扣对个人项目的影响 对于个人开发者或小型独立工作室而言,在有限的预算内维持项目的…...

hack-interview:结构化面试知识体系,从原理到实战的系统设计指南

1. 项目概述:一个为技术面试而生的“军火库”如果你正在准备技术面试,尤其是后端开发、系统设计或者算法相关的岗位,那么你大概率经历过这样的场景:面对网上浩如烟海的八股文、面经和零散的LeetCode题解,感觉知识体系像…...

Taotoken用量看板如何帮助项目管理者追溯团队API消耗明细

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken用量看板如何帮助项目管理者追溯团队API消耗明细 在团队协作开发中,大模型API的调用成本管理常常是一个模糊地…...

LLMPapers:社区驱动的LLM论文知识库,助力研究者高效追踪前沿

1. 项目概述:一个为LLM研究者量身打造的论文仓库如果你正在或即将踏入大语言模型(LLM)的研究领域,那么你大概率会遇到一个经典难题:信息过载与信息孤岛并存。每天都有数十篇甚至上百篇相关论文在arXiv、ACL、NeurIPS等…...

CryptoGPT:基于LangChain的AI智能体实现链上金融操作实践

1. 项目概述:当大语言模型学会“自己赚钱” 最近在捣鼓一个挺有意思的实验性项目,叫 CryptoGPT。这名字听起来可能有点唬人,但它的核心想法其实挺直接的: 让像 ChatGPT 这样的大语言模型(LLM)能够自主地进…...

查看与管理团队API Key使用情况的审计日志功能详解

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 查看与管理团队API Key使用情况的审计日志功能详解 1. 功能概述与核心价值 在团队协作使用大模型API的场景中,API Key…...

基于Aleo与零知识证明的隐私社交应用LoveSpark技术解析

1. 项目概述:当隐私计算遇上浪漫表达最近在开源社区里闲逛,发现了一个挺有意思的项目,叫“LoveSpark”。光看名字,你可能会觉得这跟技术没啥关系,更像是个情感类应用。但点进去一看,它的技术栈和定位让我这…...

Windows 11 24H2中近期被披露了一个高危本地权限提升漏洞

导语:一个普通用户,无需任何特殊权限,只需在锁屏界面上触发一次竞争条件,就能获得系统的最高控制权——这正是CVE-2026-24291(代号RegPwn)所实现的效果。2026年3月,这个潜伏在Windows辅助功能AT…...

法律NLP实战:基于mclaw的法律文本智能分析与问答系统

1. 项目概述:一个为法律文本分析而生的智能工具最近在整理一些合同和法规文件时,我又一次被海量的文本和复杂的条款搞得头大。相信很多法务、律师、合规或者像我一样需要经常处理法律文档的朋友都有同感:动辄几十上百页的文件,要快…...

法律文本智能解析:基于BERT与信息抽取的法律NLP实践

1. 项目概述:一个为法律文本分析而生的智能工具最近在和一些做法律科技的朋友聊天,发现一个挺有意思的现象:无论是律所的法务助理,还是法律科技公司的产品经理,都在为一个问题头疼——怎么高效地从海量的法律文书、合同…...

如何将影像组学与计算病理特征关联肿瘤微环境“反应/荒漠”基质表型建立关联,并进一步解释其与胰腺癌术后早期复发及ECM重塑的机制联系

01导语各位同学,大家好。做影像组学最怕的是什么?是模型精度刷到0.99,但一问“为什么能预测”就哑口无言——特征到底对应什么生物学过程?细胞、基质、还是血管?完全说不清。今天咱们通过一篇发表于Advanced Science的…...

3步告别英文困扰:FigmaCN中文界面插件的完整解决方案

3步告别英文困扰:FigmaCN中文界面插件的完整解决方案 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而头疼吗?专业术语看不懂&#xff0c…...

如何用猫抓浏览器扩展打造终极网页媒体资源管理神器

如何用猫抓浏览器扩展打造终极网页媒体资源管理神器 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓(cat-catch)是一款专为技术开发者和高级用…...

NeMo AutoModel:基于PyTorch DTensor与SPMD的工业级大模型分布式训练框架

1. 项目概述:NeMo AutoModel,一个为PyTorch大模型训练而生的“工业级加速器”如果你正在用PyTorch和Hugging Face做LLM或VLM的微调、预训练,并且被“如何高效地扩展到多卡、多机”这个问题困扰过,那么NeMo AutoModel就是你一直在找…...

ROS2 不只是节点通信

公众号致力于点云处理,SLAM,三维视觉,具身智能,自动驾驶等领域相关内容的干货分享,欢迎各位加入,有兴趣的可联系dianyunpcl163.com。文章未申请原创,未经过本人允许请勿转载,有意转载…...

QtScrcpy:解锁跨设备协同的终极方案,实现30ms低延迟投屏

QtScrcpy:解锁跨设备协同的终极方案,实现30ms低延迟投屏 【免费下载链接】QtScrcpy Android real-time display control software 项目地址: https://gitcode.com/GitHub_Trending/qt/QtScrcpy 你是否曾经遇到过这样的困扰:想要在电脑…...

【三维路径规划】基于遗传实现考虑水下生物 雷达 高炮威胁的导弹航路规划附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 🔥 内容介绍 一、 概…...

如何高效使用Iwara视频下载工具:5个专业技巧提升动漫资源获取体验

如何高效使用Iwara视频下载工具:5个专业技巧提升动漫资源获取体验 【免费下载链接】IwaraDownloadTool Iwara 下载工具 | Iwara Downloader 项目地址: https://gitcode.com/gh_mirrors/iw/IwaraDownloadTool 作为动漫爱好者,您是否经常在Iwara平台…...

百度网盘直链解析工具:3分钟解锁全速下载新体验

百度网盘直链解析工具:3分钟解锁全速下载新体验 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘的龟速下载而烦恼吗?每次下载大文件都要…...

构建AI客服系统时利用Taotoken实现模型热切换与降级

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 构建AI客服系统时利用Taotoken实现模型热切换与降级 在构建在线客服系统并接入AI对话能力时,开发团队通常面临两个核心…...

蛋白与核酸小分子对接#生物医学科研 #生信分析 #生物信息学 #科研 #科研绘图

蛋白与核酸小分子对接#生物医学科研 #生信分析 #生物信息学 #科研 #科研绘图...

ComfyUI-Manager终极指南:如何轻松管理AI绘画工作流扩展

ComfyUI-Manager终极指南:如何轻松管理AI绘画工作流扩展 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various cus…...

别再手动点播放了!用Vue3+Web Speech API实现数组语音自动轮播(附完整代码)

Vue3与Web Speech API打造智能语音轮播系统 在信息过载的时代,语音交互正成为提升用户体验的关键技术。想象一下,当用户打开你的教育类应用时,课程要点自动以清晰流畅的语音播放;或者在新闻阅读场景中,不同栏目的内容无…...

如何免费解锁原神60帧限制:终极FPS解锁工具完全指南

如何免费解锁原神60帧限制:终极FPS解锁工具完全指南 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 你是否在原神中体验过画面卡顿、动作不够流畅的困扰?当其他游…...

5分钟掌握:SketchUp STL插件实战指南,轻松实现3D打印模型转换

5分钟掌握:SketchUp STL插件实战指南,轻松实现3D打印模型转换 【免费下载链接】sketchup-stl A SketchUp Ruby Extension that adds STL (STereoLithography) file format import and export. 项目地址: https://gitcode.com/gh_mirrors/sk/sketchup-s…...

Oracle VPS web console入口

找了半天,终于在一个不起眼的地方找到了,做个记录。如图:...

VR/AR市场破局:硬件降本与内容生态的七年博弈与未来展望

1. 从“潜力无限”到“现实骨感”:VR市场的七年之痒与破局关键2017年那会儿,我还在一个消费电子展上第一次体验了当时最顶级的VR头显。那种沉浸感确实震撼,但当我问及价格和能玩的内容时,得到的答案让我这个从业者都倒吸一口凉气。…...

在Agent工作流中集成Taotoken实现稳定且低成本的多模型调用

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在Agent工作流中集成Taotoken实现稳定且低成本的多模型调用 构建自动化AI工作流的开发者,常常需要依赖大模型API来完成…...