当前位置: 首页 > article >正文

Craft Agents 爆火:Agent 工具正在从“命令行玩具”走向“工作流系统”

开源地址GitHub 项目lukilabs/craft-agents-oss当前 GitHub 页面显示该项目已达到5.8k Star、779 Fork同时还有较活跃的 Issue 和 PR 讨论。https://github.com/lukilabs/craft-agents-oss最近Agent 类开源项目又火了一个。项目名叫Craft Agents。它不是又一个“给大模型套壳的聊天工具”也不是简单把几个 MCP 工具接起来而是试图解决一个更具体的问题当 Agent 真正进入日常工作流后我们到底该怎么管理它、调度它、连接工具、控制权限并让它持续执行任务这也是 Craft Agents 值得关注的地方。过去很多人用 Agent体验大概是这样的打开一个终端输入一段 Prompt等模型调用工具、改代码、读文件、跑命令。能用但很“工程师自娱自乐”。一旦任务变多就会出现几个问题多个 Agent 会话怎么管理哪个任务正在跑哪个任务需要确认Agent 能不能连接 Gmail、Slack、Linear、GitHub、Notion权限怎么控制哪些能只读哪些必须人工确认长任务能不能后台跑能不能像管理工单一样管理 Agent 任务Craft Agents 的出现某种意义上说明了一件事Agent 工具正在从 CLI 阶段进入桌面工作台阶段。阅读目录Craft Agents 到底是什么为什么它会突然火起来它解决的不是“聊天”而是 Agent 工作流管理Craft Agents 的核心能力拆解它和 Claude Code、MCP、普通 AI 聊天工具有什么区别从架构角度看Craft Agents 做对了什么对测试开发、自动化测试、研发效能有什么启发这类 Agent 工具的真实风险在哪里写在最后Agent 的下一站是可控的工程系统一、Craft Agents 到底是什么Craft Agents 是一个开源的 Agent 工作台工具。从官方 README 的描述来看它的目标不是单纯做一个聊天界面而是帮助用户更高效地与 Agent 协作包括多任务处理、连接外部 API 或服务、共享会话以及一种更偏“文档中心”的工作流。([GitHub][1])官方也明确提到它同时使用了Claude Agent SDK和Pi SDK并且强调自己是基于Agent Native software理念构建的工具。([GitHub][1])简单理解Craft Agents 桌面端 Agent 工作台 多模型连接 MCP/API/本地文件源接入 会话管理 权限控制 自动化任务。它更像是一个面向 Agent 的“任务操作系统”。不是让你问一句、答一句而是让你把 Agent 当成一个可以持续工作的“执行单元”。二、为什么它会突然火起来Craft Agents 的爆火并不只是因为它开源了。真正的原因是它踩中了 Agent 工具从 Demo 走向生产力工具的关键痛点。过去一年很多 Agent 工具都在强调会调用工具会读文件会写代码会跑命令会调用 MCP会接入浏览器会多步推理但很多工具的问题也很明显能力很强但工作流很散。你让 Agent 改一个文件它可以 你让 Agent 接一个 API它也可以 但你让它同时管理多个任务、多个来源、多个权限状态、多个执行进度就开始变得混乱。Craft Agents 的重点不在于“让模型更聪明”而在于给 Agent 一个更像工作台的运行环境。这也是为什么它能在 GitHub 上快速获得关注。当前仓库页面显示Craft Agents 已有5.8k Star和779 Fork。([GitHub][1])三、它解决的不是“聊天”而是 Agent 工作流管理很多人判断一个 Agent 工具只看它能不能回答问题。但真正进入工程场景后更重要的问题是Agent 能不能被管理。一个可落地的 Agent 工具至少要解决 5 件事问题传统聊天工具Craft Agents 这类工作台多任务管理多个窗口/上下文混乱多 Session 管理工具接入手工配置居多Sources / MCP / API 接入权限控制容易一把梭Explore / Ask / Auto 分级长任务执行容易中断Background Tasks过程追踪看聊天记录状态流转与会话归档Craft Agents 的设计思路很清楚不要只把 Agent 当成聊天对象而要把 Agent 当成工作流节点。这对研发、测试、运营、文档、项目管理都有启发。四、Craft Agents 的核心能力拆解根据项目 READMECraft Agents 提供了不少关键功能包括多会话收件箱、多模型连接、Craft MCP 集成、Sources、权限模式、后台任务、动态状态系统、多文件 Diff、Skills、文件附件和自动化能力等。([GitHub][1])可以拆成几个核心模块来看。1. Multi-Session InboxAgent 任务也需要“收件箱”Craft Agents 提供了类似 Inbox 的多会话管理能力。这点很关键。因为 Agent 一旦真的进入工作流它不再只是一个聊天窗口而会变成多个并行任务一个 Agent 在整理需求文档一个 Agent 在分析日志一个 Agent 在改自动化脚本一个 Agent 在接 Slack / Gmail 数据源一个 Agent 在跑后台任务如果没有统一管理很快就会失控。Craft Agents 把 Session 设计成可以管理状态的任务单元比如 Todo、In Progress、Needs Review、Done 这类流程状态。README 中也提到其 Session Management 支持 Inbox/Archive、Flagging、Status Workflow、Session Persistence 等能力。([GitHub][1])这意味着 Agent 工具开始具备一点“轻量任务管理系统”的味道。2. SourcesAgent 不只是读文件而是连接真实系统Craft Agents 的一个重点能力是Sources。官方说明里Sources 可以连接 MCP Servers、REST APIs 和本地文件系统示例包括 Craft、Linear、GitHub、Notion、Google、Slack、Microsoft、本地文件、Obsidian vault、Git 仓库等。([GitHub][1])这意味着 Agent 可以从“只读你上传的文件”走向“连接真实业务系统”。这件事的意义很大。因为企业里的很多工作不是发生在一个文件里而是分散在邮件日历工单代码仓库文档系统IM 工具数据库本地项目目录自动化测试平台Agent 想真正工作就必须能进入这些系统。Craft Agents 的 Sources 设计本质上是在做一件事把 Agent 的上下文边界从聊天窗口扩展到真实工作环境。3. Permission ModesAgent 能力越强越需要权限边界Agent 工具最容易被忽略的一个问题是权限。很多人刚开始用 Agent 时会觉得“直接让它自动执行不就好了”但在真实工程环境里这很危险。比如 Agent 可能会删除文件修改配置执行命令调接口改数据库推送代码操作线上系统所以一个成熟的 Agent 工具必须有权限分层。Craft Agents 提供了三种权限模式模式含义适合场景Explore只读探索阻止写操作查资料、读代码、分析日志Ask to Edit修改前需要确认改代码、改文档、调配置Auto自动批准命令沙箱环境、低风险自动化README 中明确列出了 safe、ask、allow-all 三种模式并说明 safe 是只读、ask 需要审批、allow-all 自动批准。([GitHub][1])这才是 Agent 工程化落地的关键。不是 Agent 越自动越好而是该自动的自动该确认的确认该隔离的隔离。4. Skills让 Agent 从“通用助手”变成“岗位助手”Craft Agents 也支持 Skills。官方说明中Skills 是存储在 workspace 里的专用 Agent instructions。([GitHub][1])这点和当前 Agent 工具的发展方向高度一致。因为通用 Prompt 很难解决复杂岗位问题。真正有价值的是把组织经验沉淀成可复用技能比如需求评审 Skill接口测试用例生成 Skill性能瓶颈分析 Skill日志排查 SkillPlaywright 脚本生成 Skill测试报告总结 Skill缺陷复盘 Skill自动化框架改造 Skill这类 Skill 的意义不是简单“写一段提示词”。而是把团队里的经验、约束、流程、模板和工具调用方式封装起来。以后新人不用重新摸索Agent 也不用每次从零理解。5. AutomationsAgent 开始进入事件驱动阶段Craft Agents 的 README 提到 Automations可以基于标签变化、时间计划、工具使用等事件创建 Agent sessions。([GitHub][1])这其实很重要。因为 Agent 的下一步不只是“我问它答”而是当某个事件发生时Agent 自动进入工作流。比如测试场景里新需求进入评审状态自动生成测试点PR 创建后自动分析变更影响范围CI 失败后自动读取日志并归因线上告警后自动生成初步排查报告每天定时汇总缺陷趋势每周自动整理测试覆盖率变化这就是从 Chatbot 到 Agent Workflow 的变化。五、它和 Claude Code、MCP、普通 AI 聊天工具有什么区别可以用一张表理解。工具类型主要解决什么典型能力局限普通 AI 聊天工具问答与内容生成对话、总结、写作工作流弱工具接入有限Claude Code / Codex 类工具代码工程任务读代码、改代码、跑命令偏开发场景任务管理较弱MCP工具协议与连接层让模型调用外部工具本身不是完整工作台Craft AgentsAgent 工作台多会话、Sources、权限、后台任务、自动化仍需验证真实复杂场景稳定性所以 Craft Agents 不是简单替代 Claude Code也不是替代 MCP。更准确地说MCP 更像连接协议Claude Code 更像代码执行代理Craft Agents 更像 Agent 工作台。它把模型、工具、数据源、权限、会话和自动化流程放在一个桌面应用里管理。六、从架构角度看Craft Agents 做对了什么可以用下面这张结构图理解 Craft Agents 的核心设计。这个架构里最值得关注的不是某一个功能而是它的分层方式UI 层让 Agent 工作可视化Session 层让任务可管理Agent 层让模型可替换Sources 层让上下文可扩展Permission 层让执行可控Skills 层让经验可复用Automation 层让流程可触发这比单纯做一个聊天框更接近工程化。七、对测试开发、自动化测试、研发效能有什么启发Craft Agents 对测试开发从业者很有参考价值。因为测试工作天然就是“多系统、多数据、多流程、多角色”的工作。一个测试同学每天可能要接触需求文档接口文档代码仓库测试用例自动化脚本CI/CD 日志缺陷平台线上监控测试报告项目群消息这些信息分散在不同平台里。如果 Agent 只会聊天价值有限。但如果 Agent 能连接这些系统并按权限规则执行任务它就可能真正进入测试工作流。场景 1需求进入评审自动生成测试分析这类场景最适合 Agent。因为它不是替代测试工程师而是把重复的信息整理工作提前完成。测试工程师真正要做的是判断哪些风险最关键哪些历史问题需要回归哪些场景不能漏哪些接口需要重点验证哪些用例必须自动化场景 2CI 失败后自动做初步归因这类工作不是“很难”但很耗时间。Agent 的价值在于先把 60% 的排查路径跑完让人直接看结论和证据。场景 3自动化测试脚本维护Agent 可以结合Git 仓库Playwright / Selenium 脚本页面截图失败日志DOM 变化测试报告自动分析是定位器失效是等待策略不合理是环境响应变慢是断言逻辑过强是页面交互流程变化这比单纯让 AI “帮我写自动化脚本”更有价值。真正难的不是写第一版脚本而是长期维护。八、这类 Agent 工具的真实风险在哪里Craft Agents 这类工具很有想象力但不能神化。它进入工程环境后至少有 4 类风险要注意。1. 权限风险Agent 一旦能调用工具、执行命令、访问外部系统就必须严格控制权限。尤其是写文件删除文件执行 shell调生产接口访问数据库读取敏感文档连接企业 IM 和邮箱Craft Agents 的权限模式是一个好设计但最终是否安全还取决于用户怎么配置。Agent 工具不是不能自动化而是不能无边界自动化。2. 上下文污染风险Agent 接入的数据源越多越容易出现上下文混乱。比如读错文档版本引用过期接口说明混淆测试环境和生产环境把历史需求当成当前需求把不同项目的规则串在一起所以企业落地 Agent 时知识源治理非常关键。不是把所有资料塞给 Agent 就行而是要处理数据源分级文档版本权限边界更新周期引用可追溯输出可验证3. 自动执行风险Auto 模式很爽但风险也最高。建议真实团队使用时至少遵守一个原则读操作可以宽写操作要严低风险可以自动高风险必须确认。比如操作类型建议策略读取日志可自动分析文档可自动生成用例可自动修改测试脚本建议确认提交代码必须确认操作数据库严格限制调生产接口默认禁止4. 评估风险Agent 输出看起来很完整不代表它是对的。测试团队尤其要注意生成的测试点是否遗漏核心风险自动化脚本是否可长期维护日志归因是否有证据链生成的报告是否可复现Agent 是否引用了错误数据源任务是否真的执行成功所以 Agent 进入测试体系后不能只看“能不能生成”还要建立评估机制。九、Craft Agents 给行业释放的信号Craft Agents 的走红本质上说明了一个趋势Agent 工具正在从单点能力走向工作流系统。过去我们关注的是模型能不能写代码Agent 能不能调用工具MCP 能不能接入更多服务Claude Code / Codex 能不能自动改项目接下来更重要的问题会变成Agent 会话怎么管理Agent 任务怎么编排Agent 权限怎么控制Agent 输出怎么审计Agent 技能怎么复用Agent 怎么接入企业真实系统Agent 怎么和人的工作流协同这才是 Agent 工程化的主战场。十、写在最后Agent 的下一站是可控的工程系统Craft Agents 不是第一个 Agent 工具也不会是最后一个。但它值得关注的地方在于它没有只停留在“模型能力展示”而是开始处理 Agent 真正落地时绕不开的问题任务、会话、权限、工具、数据源、技能、自动化。这说明 Agent 正在进入一个新阶段。不是谁 Prompt 写得更花谁就更强 不是谁接的 MCP 更多谁就更强 不是谁能自动跑命令谁就更强。真正能落地的 Agent 系统一定要满足三个条件能连接真实工作环境能沉淀团队经验和流程能在权限边界内稳定执行任务对测试开发同学来说这个趋势尤其值得重视。未来的测试能力不只是会写用例、会写脚本、会搭平台。更重要的是你能不能把测试流程、质量规则、自动化能力和 Agent 工作流结合起来。因为 AI 不会只改变开发也会重构测试。而 Craft Agents 这类工具正是这个变化的一个早期信号。

相关文章:

Craft Agents 爆火:Agent 工具正在从“命令行玩具”走向“工作流系统”

开源地址:GitHub 项目 lukilabs/craft-agents-oss当前 GitHub 页面显示,该项目已达到 5.8k Star、779 Fork,同时还有较活跃的 Issue 和 PR 讨论。https://github.com/lukilabs/craft-agents-oss最近,Agent 类开源项目又火了一个。…...

并行计算突破:RNN序列依赖的并行化重构与优化

1. 并行计算革命:打破RNN序列依赖的固有认知循环神经网络(RNN)长期被视为序列建模的黄金标准,但其序列依赖性导致的计算瓶颈一直困扰着研究者。传统观点认为,评估长度为T的序列必须严格遵循O(T)的时间复杂度——即使拥…...

ARM GIC中断域管理与系统指令详解

1. ARM GIC中断域管理概述在ARM架构中,通用中断控制器(GIC)是处理中断请求的核心组件。作为系统级外设,GIC负责接收来自各种硬件设备的中断信号,进行优先级仲裁后分发给处理器核心处理。现代ARM处理器通常集成GICv3或GICv4架构的中断控制器&a…...

创业团队如何利用统一API网关管理多个大模型调用与成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 创业团队如何利用统一API网关管理多个大模型调用与成本 对于资源有限的创业团队而言,在业务开发中引入大模型能力&…...

AI Agent自动化求职实战:基于Python与LLM的智能简历投递系统

1. 项目概述与核心价值最近在技术社区里,关于AI Agent如何自动化处理重复性工作的讨论越来越热。作为一个在招聘和自动化领域摸爬滚打了十来年的老手,我亲眼见证了求职者从海投简历到使用各种工具辅助的演变。今天想和大家深入聊聊一个让我印象深刻的开源…...

Python基础篇之初识Python必看攻略

Python简介python的创始人为吉多范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,吉多范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承。 Python和其他语言的对比:…...

CANN/HCOMM通信通道内存屏障API

HcommChannelFenceOnThread 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT&#x…...

CANN/SiP Cgemv复数矩阵向量乘法

Cgemv 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I/500 A2 推理产品…...

集成电路设计中的关键特征分析(CFA)技术与应用

1. 关键特征分析(CFA)技术概述关键特征分析(Critical Feature Analysis, CFA)是现代集成电路设计制造(DFM)流程中的核心质量评估工具。这项技术最早由Mentor Graphics(现为Siemens EDA)在2000年代中期提出,旨在解决传统DRC(设计规则检查)仅做"通过/失败"二…...

边缘计算监控实战:轻量级异常检测框架edgequake部署与架构解析

1. 项目概述:当边缘计算遇上“地震”监控最近在GitHub上看到一个挺有意思的项目,叫edgequake。光看名字,你可能会有点懵,“edge”是边缘,“quake”是地震,这俩词放一块儿,难不成是在地震带上部署…...

MAX3735A与DS1859接口设计中的保护机制与优化方案

1. MAX3735A与DS1859接口设计核心问题解析 在155Mbps至2.7Gbps SFP模块设计中,MAX3735A激光驱动器与DS1859数字电阻器的组合堪称经典配置。这对搭档通过高速调制和精密电阻控制,为光纤通信提供了稳定可靠的解决方案。但在实际工程应用中,我发…...

Motif强化学习算法鲁棒性分析:超参数敏感性与数据依赖评估

1. 项目概述:当强化学习遇上“真实世界”的挑战在强化学习(Reinforcement Learning, RL)的研究和应用中,我们常常会看到算法在精心调优的基准测试环境(如Atari游戏、MuJoCo连续控制任务)中取得令人惊艳的性…...

AI智能体工作区管理技能:结构化项目模板与自动化实践

1. 项目概述与核心价值如果你和我一样,每天要在多个项目、不同领域的文档和代码仓库之间来回切换,那你一定对“工作区混乱”这件事深恶痛绝。今天要聊的这个workspace-manager-skill,就是专门为解决这个痛点而生的。它不是一个独立的应用&…...

llmware开源框架:企业级AI应用开发的RAG全流程解决方案

1. 项目概述:一个为构建企业级AI应用而生的开源框架如果你正在尝试将大语言模型(LLM)集成到你的业务系统中,无论是想做一个智能客服、一个文档分析工具,还是一个内部知识问答机器人,你大概率会遇到一系列令…...

基于MCP协议的开源客户端openmcp-client:标准化AI工具集成实践

1. 项目概述:一个面向MCP协议的开源客户端最近在折腾AI应用开发,特别是想给本地的大语言模型(LLM)接上一些外部工具,比如读取本地文件、查询数据库或者调用特定的API。在这个过程中,我反复遇到了一个核心问…...

AI原生CMS架构解析:从智能内容生成到向量检索的工程实践

1. 项目概述:当内容管理遇上AI,一场效率革命正在发生如果你和我一样,长期在内容创作、网站运营或者数字营销的一线工作,那你一定对“内容管理”这四个字又爱又恨。爱的是,一个结构清晰、功能强大的内容管理系统&#x…...

MediaCreationTool.bat实用指南:3种方法轻松绕过Windows 11硬件限制

MediaCreationTool.bat实用指南:3种方法轻松绕过Windows 11硬件限制 【免费下载链接】MediaCreationTool.bat Universal MCT wrapper script for all Windows 10/11 versions from 1507 to 21H2! 项目地址: https://gitcode.com/gh_mirrors/me/MediaCreationTool.…...

Acontext:AI智能体技能记忆层的透明化设计与工程实践

1. 项目概述:Acontext,一个为AI智能体设计的技能记忆层如果你正在构建AI智能体,尤其是那些需要处理复杂、长期任务的智能体,那么“记忆”问题很可能已经让你头疼不已。传统的记忆方案,无论是简单的对话历史堆叠&#x…...

猫抓浏览器扩展:3步掌握全网视频资源捕获的终极方案

猫抓浏览器扩展:3步掌握全网视频资源捕获的终极方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常遇到这样的困境&#xf…...

轻量级智能体框架MiniAgent:快速构建AI应用的核心原理与实践

1. 项目概述:一个轻量级智能体框架的诞生最近在GitHub上闲逛,发现了一个挺有意思的项目——ZhuLinsen/MiniAgent。光看名字,你大概能猜到,这是一个关于“智能体”的东西。没错,它是一个轻量级的智能体框架。但如果你以…...

ESP32远程日志实战:esp-wifi-logger原理、集成与避坑指南

1. 项目概述与核心价值最近在折腾一个物联网项目,需要远程监控一批部署在户外的ESP32设备状态,比如温度、湿度、电压这些关键参数。最头疼的问题就是:设备一旦部署出去,如果网络连接出了问题,或者程序跑飞了&#xff0…...

终极指南:如何用Universal x86 Tuning Utility完全掌控你的硬件性能

终极指南:如何用Universal x86 Tuning Utility完全掌控你的硬件性能 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility …...

CodeFire:为AI编程助手构建持久记忆层,实现连续协作开发

1. 项目概述:为AI编程助手构建持久记忆层 如果你和我一样,深度依赖Claude Code、Gemini CLI这类AI编程助手来辅助日常开发,那你一定遇到过这个让人头疼的问题:每次开启一个新的会话,AI助手就像得了“健忘症”&#xf…...

Awesome Prompts元清单:高效导航AI提示工程生态的终极指南

1. 项目概述:当“Awesome”遇见“Awesome Prompts”如果你在技术社区,特别是AI应用开发或者提示工程领域混迹过一段时间,那么对“Awesome”系列清单一定不会陌生。它们就像一个个精心维护的宝藏库,汇聚了某个特定领域最优质的工具…...

OpenClaw:本地人工智能智能体全新范式,通向成功的新路径

OpenClaw(社区昵称“龙虾”)是一个在2026年引爆全球开发者社区的开源AI智能体执行框架,其核心定位是“本地优先、自托管、能动手的AI助手”。 它的崛起路径与技术架构,代表了AI应用从“对话”走向“执行”的关键转折。 一、 爆发…...

Kasetto:声明式AI技能管理工具,实现跨团队环境一致性

1. 项目概述:Kasetto,一个声明式的AI技能环境管理器如果你和我一样,日常开发中会同时使用多个AI编程助手——比如在Claude Code里写文档,在Cursor里重构代码,在GitHub Copilot里补全注释——那你一定遇到过这个痛点&am…...

MySQL数据库开发工具箱:从环境配置到性能优化的完整工程实践

1. 项目概述:一个数据库开发者的工具箱最近在GitHub上看到了一个名为“MySQL_Development_Work”的项目,作者是puneetkumar041。作为一名长期与数据库打交道的开发者,我立刻被这个标题吸引了。它不像那些炫酷的AI项目或者全栈框架&#xff0c…...

AI算力治理:硬件级执行机制的技术原理与挑战

1. 项目概述:为什么我们需要关注AI算力治理?最近几年,AI模型的规模和能力呈指数级增长,从GPT-3到如今的GPT-4、Claude 3,其背后动辄是数万张高端AI加速卡(如H100、A100)连续运行数月的训练过程。…...

从设计失败到健壮架构:AI代码助手核心模块设计与工程实践

1. 项目概述:当AI代码助手遇上“设计失败”最近在GitHub上闲逛,发现了一个名字相当“耿直”的项目:designfailure/claudecode。这个名字本身就充满了故事感——“设计失败”的Claude Code。作为一名在开发一线摸爬滚打了十多年的老码农&#…...

CANN发布管理8.5.0版计划

Release plan 【免费下载链接】release-management CANN版本发布管理仓库 项目地址: https://gitcode.com/cann/release-management Stange nameBegin timeEnd timeCollect feature2025/10/152025/10/30Develop2025/10/202025/12/05Build2025/12/062025/12/07Test round…...