当前位置: 首页 > article >正文

认识 DeerFlow:一个跑在 LangGraph 上的 Super Agent Harness

DeerFlow 给自己的定位不是又一个 Agent 框架而是 Super Agent Harness。这个词不是随便用的——它意味着 DeerFlow 要解决的不是Agent 能不能跑而是Agent 能不能跑得住。它和 Harness Engineering、Agent Team、Workflow 分别是什么关系这篇一次讲清。2026 年 2 月 28 日字节跳动发布了 DeerFlow 2.0发布后登顶 GitHub Trending 第一。很多人的第一反应是又一个 Agent 框架——但打开 README 会发现它给自己贴的标签是Super Agent Harness不是 Agent Framework。这两个词的差别不小。Framework 关心的是怎么让 Agent 跑起来。Harness 关心的是怎么让 Agent 跑得住、不跑偏。如果了解 Harness Engineering会立刻意识到DeerFlow 就是 Harness Engineering 在开源社区的一个落地实现。对比关系DeerFlow 是 Harness Engineering 的一个落地实现。它把约束、沙箱、上下文管理、反馈机制和可观测性打包成了一个开箱即用的框架。DeerFlow 不是 Agent Team但能承载 Agent Team。它的 Sub-Agent 机制本身就是一套 Agent Team但 DeerFlow 还管着这套 Team 的运行环境。DeerFlow 不是 Workflow 引擎但它管着 Workflow 跑得住不住。编排能力来自 LangGraphDeerFlow 在编排之上加了运行保障层。类比Workflow 是流水线上的工序编排Agent Team 是流水线上的班组分工DeerFlow 是整条流水线的运行系统——包括传送带、质检站、安全围栏和监控大屏。DeerFlow 是什么DeerFlow 全称 Deep Exploration and Efficient Research Flow。1.0 时代定位是深度研究框架更像一个高效的文献整理助手。到了 2.0它从头重写定位升级为 Super Agent Harness——一个全栈的 Agent 运行时基础设施。核心能力一览能力说明Sub-AgentsLead Agent 拆任务动态拉起多个 Sub-Agent 并行执行最后汇总Sandbox每个任务跑在隔离的 Docker 容器里有独立文件系统过程可审计Skills结构化能力模块通常是 Markdown定义工作流和最佳实践按需加载长期记忆跨会话积累用户偏好和知识背景数据保存在本地上下文工程Sub-Agent 之间上下文隔离长会话自动压缩和转存可观测性内置 LangSmith 集成追踪所有 LLM 调用、Agent 运行和工具执行消息网关支持 Telegram、Slack、飞书等渠道接入这些能力单独看都不算新鲜。但放在一起看会发现它们恰好覆盖了 Harness Engineering 的核心要素。Harness Engineering 的落地实现这是本文最重要的判断。Harness Engineering 的核心要素通常包括五个约束机制、反馈回路、沙箱隔离、上下文管理和可观测性。DeerFlow 逐一对应了每一个。Harness Engineering 要素DeerFlow 的实现方式约束机制Skills 体系——用 Markdown 定义工作流、最佳实践和边界Agent 按 Skill 约束执行沙箱隔离每个 Task 跑在独立 Docker 容器完整文件系统uploads / workspace / outputs会话间隔离上下文管理Sub-Agent 之间上下文完全隔离长会话积极总结、压缩、转存中间结果防止 Token 溢出反馈回路Sub-Agent 执行失败后自动重试Lead Agent 汇总时可判断是否需要重新分配任务可观测性内置 LangSmith 集成追踪所有 LLM 调用、工具执行和 Agent 运行轨迹这不是巧合。DeerFlow 2.0 的重写发生在 Harness Engineering 概念爆发的同一时期2026 年初与Engineer the Harness的理念在同期形成共鸣DeerFlow 也因此把自己重新定位为 Super Agent Harness。判断DeerFlow 是目前开源社区里最接近 Harness Engineering 完整实现的框架之一。它在理念上认同 Harness Engineering同时在工程上把五大要素都落了地。需要注意的边界DeerFlow 的约束机制主要靠 SkillsMarkdown 定义的工作流而不是像 CI/CD 那样的硬门禁。这意味着约束的强度取决于 Skill 的设计质量——如果 Skill 写得不够严格Agent 仍然可能跑偏。这是 DeerFlow 当前与完美 Harness之间的差距。Agent Team 的运行底座DeerFlow 的 Sub-Agent 机制本质上就是一个 Agent TeamLead Agent扮演 Manager 角色负责理解任务、拆解子任务Sub-Agents各自领一块活拥有独立上下文、工具和终止条件可以并行运行最后由 Lead Agent 汇总结果这和 Agent Team 的按角色分工、协作完成任务模式完全吻合。但 DeerFlow 超出了 Agent Team 的范围。Agent Team 只管分工和协作DeerFlow 还管运行环境。具体来说维度纯 Agent TeamDeerFlow分工协作✅ 有✅ 有Sub-Agents沙箱隔离❌ 通常没有✅ 每个 Task 独立 Docker上下文管理❌ 靠 Agent 自己✅ 隔离 压缩 转存长期记忆❌ 通常没有✅ 跨会话记忆可观测性❌ 通常没有✅ LangSmith 集成约束机制❌ 靠 Prompt✅ Skills 体系一句话Agent Team 是 DeerFlow 里的协作层DeerFlow 是 Agent Team 的运行底座。Workflow 之上加了什么DeerFlow 的编排能力不是自己造的而是直接用了 LangGraph。LangGraph 是一个状态机驱动的 Workflow 引擎擅长处理多步骤、有分支、需要状态管理的 Agent 编排。本地开发时DeerFlow 的后端服务通过langgraph dev来运行。但 DeerFlow 在 Workflow 之上加了 Harness 层。区别在于Workflow 管的是步骤能不能串起来A 做完了该 B 做B 做完了该 C 做。DeerFlow 管的是每一步跑得住不住A 跑在隔离沙箱里B 拿到的上下文是干净的C 失败了能自动重试整个过程有迹可查。这和本仓库另一篇文章的判断一致Workflow 只能保证步骤能串起来Harness 才能保证整条链路跑完以后不用逐个检查每一步的输出。DeerFlow 就是在 LangGraph 的 Workflow 能力之上叠加了 Harness 层。技术底座LangChain LangGraphDeerFlow 没有重复造轮子而是深度依赖并封装了 LangChain 和 LangGraph。LangChain是模型连接层。DeerFlow 在配置模型时直接使用 LangChain 的类路径如langchain_openai:ChatOpenAI这意味着任何 LangChain 支持的模型提供商都可以无缝接入。LangGraph是编排层。DeerFlow 的多 Agent 编排、状态管理和工作流控制都建立在 LangGraph 之上。DeerFlow 自己加了什么文件系统、沙箱环境、长期记忆、Skills 体系、上下文压缩、消息网关——这些都是 LangChain 和 LangGraph 不管的生产级基础设施。一张表理清三者关系层级谁负责管什么模型连接LangChain对接各家 LLM统一调用接口编排调度LangGraph多步骤工作流、状态机、分支和并行运行保障DeerFlow沙箱、记忆、上下文、Skills、可观测、消息网关类比LangChain 是发动机管动力LangGraph 是变速箱管档位和传动DeerFlow 是整车管能不能安全上路、跑长途、出了问题能修。什么时候该用、什么时候别用适合用 DeerFlow 的场景需要多 Agent 协作完成复杂任务研究、编码、内容生成需要沙箱隔离Agent 要执行代码或操作文件长周期任务需要跨会话记忆和上下文管理需要生产级部署接入飞书、Slack 等消息渠道不太适合的场景只需要单轮对话或简单问答——用 DeerFlow 太重了轻量 RAG 场景——直接用 LangChain 就够不想引入 Docker 依赖——DeerFlow 的沙箱能力强依赖 Docker安全提醒DeerFlow 具备执行系统指令和操作资源的能力默认设计仅部署在本地可信环境127.0.0.1。如果要部署到公网必须配置 IP 白名单、反向代理认证等安全措施。结论DeerFlow 是 Harness Engineering 从论文走向工程的一个标杆实现——它用 LangChain 接模型用 LangGraph 编排工作流然后在上面盖了一整套让 Agent 跑得住的运行系统。理解 DeerFlow不能只看它的功能列表。要看它在整个 AI Agent 工程体系里的位置——它不等于模型或 Prompt也不同于 Workflow 引擎和 Agent Team而是那个让这些东西组合在一起以后还能稳定运行的底座。本文由本人构思并把控借助 AI 辅助整理成文仅代表个人观点欢迎交流。

相关文章:

认识 DeerFlow:一个跑在 LangGraph 上的 Super Agent Harness

DeerFlow 给自己的定位不是"又一个 Agent 框架",而是 Super Agent Harness。这个词不是随便用的——它意味着 DeerFlow 要解决的不是"Agent 能不能跑",而是"Agent 能不能跑得住"。它和 Harness Engineering、Agent Team、…...

福建洗地机厂家 —— 泉州思维博环保科技有限公司

坐落于福建泉州的泉州市思维博环保科技有限公司,是本地深耕清洁设备领域的实力源头厂家,主营各类手推、驾驶式洗地机、扫地设备,专注为工商业场景提供一站式清洁解决方案。依托多年行业积淀与成熟生产工艺,公司旗下设备集洗、拖、…...

工业现场通信避坑指南:Modbus RTU over RS485的CRC校验与异常处理实战

工业现场通信避坑指南:Modbus RTU over RS485的CRC校验与异常处理实战 在工业自动化领域,稳定可靠的通信是系统正常运行的基石。RS485总线因其抗干扰能力强、传输距离远等优势,成为工业现场最常见的物理层通信标准之一。而Modbus RTU协议则因…...

别再手动配环境了!用Docker Compose一键拉起Neo4j 5.x(附数据持久化配置)

告别繁琐配置:用Docker Compose高效部署Neo4j 5.x全攻略 每次开始新项目时,重复配置数据库环境是否让您感到效率低下?传统的手动安装方式不仅耗时,还容易因环境差异导致各种"玄学"问题。本文将带您体验现代开发者的标准…...

DeepEar:基于多智能体协作的金融信息自动化研究框架实践

1. 项目概述:从噪音中捕捉信号,一个量化研究者的新工具在信息爆炸的时代,金融市场的噪音从未如此刺耳。每天,海量的新闻、社交媒体讨论、研报和公告如潮水般涌来,对于分析师和投资者而言,核心挑战不再是信息…...

【数字IC/FPGA】基于Aurora IP核NFC机制的跨片数据流精准调控

1. Aurora IP核NFC机制的核心价值 在FPGA间高速数据传输场景中,数据流的精准控制一直是个棘手问题。传统AXI反压机制在面对跨片通信时往往力不从心,这时候Aurora IP核的NFC(Native Flow Control)功能就派上了大用场。我曾在多个项…...

SciPy优化算法实践:从本地搜索到全局优化

1. SciPy优化算法概述在科学计算和工程应用中,函数优化是一个基础而重要的问题。简单来说,优化就是寻找使目标函数取得最小值或最大值的输入参数。Python的SciPy库为我们提供了一套完整的优化工具集,涵盖了从简单的一维搜索到复杂的多维全局优…...

西电C语言期末考什么?我用Python爬了36道XDOJ真题,帮你划重点(附难度分级)

用Python爬取XDOJ题库:C语言期末考重点分析与备考策略 当C语言期末考的阴影笼罩校园时,大多数学生还在机械地刷着往届试题,而我选择了一条不同的路——用Python爬虫技术从XDOJ平台抓取36道真题,通过数据分析揭示考试规律。这不仅是…...

5. KNN算法之 超参选择(交叉验证网格搜索)

交叉验证、网格搜索 的目的都是寻找最优超参; 知道交叉验证是什么?知道网格搜索是什么?知道交叉验证网格搜索API函数用法能实践交叉验证网格搜索进行模型超参数调优利用KNN算法实现手写数字识别 1. 交叉验证: 交叉验证 本质上就是复验即重复校验&#…...

BERT文本嵌入实战:从原理到应用

1. 文本嵌入基础与核心价值文本嵌入(Text Embedding)是现代自然语言处理(NLP)的核心技术之一,它将离散的文本转化为连续的数值向量,使计算机能够理解和处理语义信息。与传统的词袋模型(Bag-of-W…...

MacBook外接4TB硬盘总失败?别急着换扩展坞,试试这个磁盘工具里的隐藏功能

MacBook外接4TB硬盘总失败?解锁磁盘工具的隐藏技能 刚入手一块4TB移动硬盘,兴冲冲插上MacBook准备备份照片库,结果访达里死活找不到设备?别急着下单新扩展坞,也别怀疑硬盘坏了。作为常年与外部存储打交道的视频剪辑师&…...

自动驾驶感知入门:如何用Python仿真FMCW毫米波雷达(测距、测速、测角完整流程)

自动驾驶感知实战:Python仿真FMCW毫米波雷达全流程解析 毫米波雷达正成为自动驾驶系统的核心传感器之一。想象一下,当你需要验证一个雷达算法却苦于没有价值数十万元的硬件设备时,代码仿真就成了最经济高效的解决方案。本文将带你用Python从零…...

Keras+CNN图像分类实战:从原理到工业级应用

1. 项目概述:基于Keras的CNN图像分类实战当你需要从海量图片中自动识别物体类别时,卷积神经网络(CNN)就像一位经验丰富的鉴图师。我在电商平台的商品自动分类系统中首次应用Keras实现的CNN模型时,单模型准确率就提升了…...

LSTM长序列处理优化方案与工程实践

1. 长序列处理的挑战与LSTM基础当我们需要处理文本、时间序列或任何具有长期依赖关系的数据时,传统的RNN会遇到梯度消失或爆炸的问题。LSTM(Long Short-Term Memory)网络通过引入门控机制,在一定程度上解决了这个问题。但在实际应…...

概率分布基础:从概念到机器学习应用

1. 概率分布基础概念解析 概率论作为数学的重要分支,其核心研究对象是随机现象的数量规律。当我们谈论概率分布时,实际上是在探讨随机变量所有可能取值与其对应概率的系统性描述框架。这种描述不仅限于单一事件的概率计算,更重要的是揭示了整…...

演讲时观众都在刷手机,Claper用下来确实能打破冷场

前言 做分享或者汇报的时候,最尴尬的场面不是内容讲得不好,而是你一个人在台上说,下面的观众全程低头刷手机。提问环节更不用想了,鸦雀无声,想互动一下都不知道从哪里切入。说到底,PPT 这种工具天生就是单…...

C++ MCP网关延迟突增23ms?别再查业务逻辑了——从RDTSC时间戳校准到Intel RAPL功耗反推,定位硬件级性能陷阱

更多请点击: https://intelliparadigm.com 第一章:C 编写高吞吐量 MCP 网关 性能调优指南 MCP(Model Control Protocol)网关作为 AI 模型服务的统一接入层,其吞吐能力直接决定多模型协同调度的实时性与稳定性。在 C 实…...

OceanBase-Desktop-Setup-1.6.0.exe

OceanBase-Desktop 安装 CPU虚拟化未启用。 当前状态: False 请在BIOS设置中启用虚拟化后重试。 请参考以下步骤手动启用虚拟化: https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000002866370 确定...

OceanBase-Desktop-Setup-1.0.0.exe

Microsoft Windows [版本 10.0.19045.6456] (c) Microsoft Corporation。保留所有权利。C:\Users\Administrator>wsl --status 此应用程序需要适用于 Linux 的 Windows 子系统可选组件。 通过运行安装它: wsl.exe --install --no-distribution 可能需要重新启动系…...

如何轻松实现i茅台自动预约:告别早起抢购的终极解决方案

如何轻松实现i茅台自动预约:告别早起抢购的终极解决方案 【免费下载链接】campus-imaotai i茅台app自动预约,每日自动预约,支持docker一键部署(本项目不提供成品,使用的是已淘汰的算法) 项目地址: https:…...

xSDR微型软件定义无线电模块:M.2 2230规格的嵌入式通信解决方案

1. 项目概述:xSDR——M.2 2230规格的微型软件定义无线电模块在嵌入式无线通信领域,硬件尺寸与性能往往难以兼得。Wavelet Lab最新推出的xSDR模块打破了这一困境——这款仅有30222mm的M.2 2230规格设备,集成了LMS7002M射频芯片和Artix-7 FPGA&…...

G-SHARP:基于高斯分布的实时手术3D重建技术

1. 项目概述G-SHARP是一项突破性的实时手术场景重建技术,它基于高斯分布(Gaussian Splatting)原理,专为微创手术中的3D组织建模需求而设计。这项技术的核心价值在于能够在手术过程中实时生成高保真度的可变形组织模型,…...

AI编程助手实战评测:Claude3(Opus)在复杂功能实现上如何领先通义灵码

1. 复杂编程任务下的AI助手对决 最近在开发者圈子里有个热门话题:当遇到稍微复杂的编程需求时,到底该选择哪款AI编程助手?我恰好有个实际需求——用Python整合Azure语音服务开发带图形界面的应用,于是拿通义灵码和Claude3(Opus)做…...

数据安全与操作可控:太极重命名的预览机制解析

在进行文件批量操作时,数据安全始终是用户最为关心的问题之一。 一次错误的操作可能导致成百上千个文件的命名混乱,修复起来费时费力。 太极重命名深刻理解用户的这一顾虑,在软件设计中融入了多重安全机制,确保每一次操作都在用…...

别再只用VideoPlayer了!Unity Windows平台播放RTSP/RTMP视频流插件深度横评(2024版)

2024年Unity Windows平台RTSP/RTMP视频流插件深度评测与技术选型指南 在工业数字孪生、智慧园区等企业级应用开发中,实时视频流接入已成为刚需场景。当甲方部署的监控系统要求接入RTSP/RTMP流时,Unity自带的VideoPlayer组件立即暴露出功能短板——它仅支…...

CDLF多级泵品牌推荐:上海上诚泵阀在工程应用中表现如何?

CDLF多级泵品牌推荐:上海上诚泵阀在工程应用中表现如何?在做供水、水处理、循环系统项目时,很多人都会问:👉 CDLF多级泵品牌怎么选?有没有靠谱推荐?如果只是看资料,很容易陷入一个误…...

Bamtone班通:PCB为什么要做耐电流测试?

在电子产品设计与制造中,印刷电路板(PCB)作为电子元器件的支撑体和电气连接的载体,其可靠性直接决定着整个设备的性能与安全。耐电流测试正是确保PCB在高负载条件下稳定运行的关键。这项测试通过模拟实际工况中的电流负荷&#xf…...

Mem Reduct深度解析:Windows内存清理与实时监控的终极解决方案

Mem Reduct深度解析:Windows内存清理与实时监控的终极解决方案 【免费下载链接】memreduct Lightweight real-time memory management application to monitor and clean system memory on your computer. 项目地址: https://gitcode.com/gh_mirrors/me/memreduct…...

Python聚类分析实战:k-means与层次聚类详解

1. Python聚类分析入门指南聚类分析作为无监督学习的重要技术,在商业智能、生物信息学和图像处理等领域有着广泛应用。今天我将通过两个实际案例,带大家掌握Python中k-means和层次聚类这两种最常用的聚类方法。不同于教科书式的理论讲解,本文…...

预警响应闭环与历史数据能力——Infoseek舆情系统谈两个被忽视的基础设施

很多企业在采购舆情监测工具时,把所有注意力都放在“能不能监测到”这个功能层面,却忽略了两个决定工具能否在企业内部真正产生价值的“基础设施”问题:预警响应闭环的可行性,以及历史数据沉淀和使用的能力。Infoseek舆情系统基于…...