当前位置: 首页 > article >正文

DolphinScheduler Agent 开源上线|从告警到自愈一键闭环,运维终于可以“躺着把活干了”

在 2026 Apache DolphinScheduler Meetup 技术分享中由刘小东带来的DolphinScheduler Agent解决方案一经亮相便成为社区焦点。这套打通「群聊告警→智能诊断→自动恢复→报告闭环」的全链路系统可以很好地解决传统运维碎片化、高耗时、反复跨系统跳转的痛点让大数据任务故障处理从“人肉奔波”迈入“智能自治”时代。目前项目核心支撑工具dolphinscheduler-clidsctl已正式在 GitHub 开源面向所有开发者免费使用传统运维之痛故障恢复慢不是命令难是跳转太碎日常使用 DolphinScheduler 时任务失败处理一直给运维带来不小的压力。你一定熟悉这样的流程飞书群弹出告警 → 打开 DS UI 查实例状态 → 翻日志定位失败原因 → 对照 Runbook 判断风险 → 人工决策操作 → 再回到群里回复结果……真正拖慢效率的从来不是执行某条命令而是上下文在多个系统间反复断裂。事实、证据、风险分散在不同工具里运维人员把大量时间浪费在“找信息、拼逻辑、补上下文”上协作断点多、排查成本高、故障恢复周期被无限拉长。而这一切在 DolphinScheduler Agent 面前将成为历史。全新升级从碎片化人肉协作到全链路智能闭环针对上述断点DolphinScheduler Agent 方案的目标非常清晰把一次失败告警变成一条连续、可追踪、可沉淀的处理链路。旧方式是告警、UI、日志、群聊、复盘各自独立全程依赖人肉协作新方式则以飞书告警为起点经由Channel 会话、智能编排、执行控制、验证回复最终沉淀为报告让故障从触发到闭环一气呵成不再需要人工在多系统间反复跳转。简单来说就是告警发出来Agent 自动接手处理完成自动在群内回复结果并输出完整事故报告。运维人员只需要看结论不再需要“跑断腿”。五层硬核架构不是简单脚本是安全可控的智能控制链很多人会误以为自动化运维就是“机器人脚本”。但 DolphinScheduler Agent 走了一条更稳健、更工程化的路——五层解耦控制链每一层各司其职层层递进既保证执行能力又牢牢守住安全边界。L1 事件与协作告警直接进入飞书线程支持人工随时介入与追问以 workflowInstanceId 作为唯一事故锚点信息不丢失、不分散。L2 会话接入飞书事件同步至本地会话全程保持上下文连贯彻底消除跨系统切换带来的断点问题。L3 智能编排由 Claude Code 负责信息组织与调用顺序编排Skill 承载 DS 领域专业规则让决策更精准。L4 执行控制由 dsctl 统一承担读证据、修故障、验结果的核心动作标准化命令稳定可复用。L5 沉淀治理自动完成飞书群快捷回帖、事故报告生成、审计日志留存兼顾实时协作与后续复盘。这样的设计切中运维人员的需求架构解耦能力才能稳定扩展边界清晰自动化才敢上线生产。四大核心模块端到端支撑故障自愈真正落地在五层架构之上四大模块紧密配合让整套系统“能用、好用、敢用”。 Channel飞书原生入口一站式协同飞书群既是告警入口、协作界面也是结果回执页。Agent、人工、值班流程在同一线程内协同群内只展示精简结论详细证据沉淀至报告沟通高效、证据可查。 Runtime智能编排引擎规则与执行分离Claude Code 负责会话逻辑编排Skill 承载故障响应、工作流设计、数据质量等专业规则。编排、规则、执行三层解耦系统可稳定扩展持续迭代升级。 Control Planedsctl 统一控制面自动化的“执行底座”dsctl 是整个 Agent 的能力核心提供标准化、可被自动化调用的 CLI 能力读证据doctor / digest / log 快速定位故障现场修实例recover-failed / edit --dry-run 安全修复支持预演验结果watch 实时监控状态digest 输出总结统一输出所有动作标准化返回可观测、可追溯、可审计正是有了 dsctl手动命令才能变成稳定的自动化能力。7 步标准闭环双路径保障生产环境更放心从告警触发到复盘沉淀Agent 严格遵循 7 步标准状态机告警解析 → 诊断 → 决策 → 执行 → 验证 → 回复 → 沉淀面对低风险、证据充足的场景自动走顺利路径读证据→生成执行计划→恢复失败任务→验证→群内短回帖 输出报告遇到证据不足、高风险或验证失败则走升级路径转交人工保留完整上下文不虚假上报成功全程可追溯、可审计、可复盘真正做到放心上线、稳定运行。 Safety四级风险管控安全是第一前提生产环境的自动化安全永远比速度更重要。系统按风险等级设置边界将操作分为四类自动默认允许只读查询、查看日志等无风险操作自动防护recover-failed 等低风险恢复操作人工审批实例修改等高风险动作必须人工确认禁止数据强制成功等高危操作直接拦截这样就明确了系统的核心安全主张Agent 的强大不在于“敢跑”而在于知道“什么时候不跑”。稳健路线图逐步放权走向自治运维为了保证在生产环境安全落地Agent 采用分步放权、小步迭代的路线以确保生产稳定MVP 阶段先实现只读诊断跑通短回帖闭环V1 阶段开放 recover-failed 低风险自动恢复V2 阶段接入审批机制扩展更多可控操作V3 阶段沉淀 Runbook / Skill面向社区共建。这套方案最有价值的不是某个提示词而是Channel Skill CLI Report Safety一整套可复制、可迁移的工程化边界。Demo演示为了大家能对 DolphinScheduler Agent 的能力有直观的理解刘小东还在现场进行了 Demo 演示详见文首视频 57:10 及以后内容。⬆️ 正式开源dsctl 已上线 GitHub欢迎体验共建好消息是支撑 DolphinScheduler Agent 实现全能力的核心项目dolphinscheduler-clidsctl已正式开源 GitHub 地址https://github.com/sketchmind/dolphinscheduler-cli项目提供完整命令行工具支持DolphinScheduler 配置与环境管理工作流编写、Lint 检查、DryRun 预演运行时监控、实例查看、日志拉取故障恢复、失败重跑、批量运维标准化输出完美适配自动化与 Agent 调用项目采用 Apache-2.0 开源协议支持 pip 一键安装兼容 DolphinScheduler 3.3.2 / 3.4.0 / 3.4.1 等主流版本开箱即用。写在最后DolphinScheduler Agent 的出现重新定义了大数据任务运维范式把人从重复、琐碎、跨系统跳转中解放出来让系统负责处理故障让人专注决策与治理。从告警弹出到自动恢复、自动回帖、自动沉淀报告一键闭环全程无忧。如果运行顺利运维真的可以说是“躺着把活干了”。欢迎所有 DolphinScheduler 用户、运维开发者、大数据工程师前往 GitHub 体验 dsctl一起参与社区共建让运维更简单、更智能、更高效

相关文章:

DolphinScheduler Agent 开源上线|从告警到自愈一键闭环,运维终于可以“躺着把活干了”

在 2026 Apache DolphinScheduler Meetup 技术分享中,由刘小东带来的 DolphinScheduler Agent 解决方案一经亮相,便成为社区焦点。这套打通「群聊告警→智能诊断→自动恢复→报告闭环」的全链路系统,可以很好地解决传统运维碎片化、高耗时、反…...

RealSense D400系列深度相机ROS2环境下使用

使用命令行直接启动RealSense相机,主要有 ros2 run 和 ros2 launch 两种方式。ros2 run 适合快速测试和简单参数调整,而 ros2 launch 则更适合需要加载复杂参数的场景。 ✅ 方法一:使用 ros2 run 直接启动节点 这种方法直接运行核心节点 re…...

PHP 9.0异步I/O瓶颈在哪?5大真实生产环境AI聊天机器人崩溃日志溯源,附可复用的AsyncSignalHandler修复补丁

更多请点击: https://intelliparadigm.com 第一章:PHP 9.0异步I/O架构演进与AI聊天机器人运行时特征 PHP 9.0 将原生引入协程驱动的异步 I/O 栈,彻底取代传统的 stream_select() 和 pcntl_fork 混合模型。核心变化在于将 Swoole 的成熟语义深…...

GeoRA:几何感知的低秩适配优化技术解析

1. 项目概述:GeoRA的核心创新与价值 在大型语言模型(LLM)的强化学习可验证奖励(Reinforcement Learning with Verifiable Rewards, RLVR)场景中,参数高效微调(Parameter-Efficient Fine-Tuning,…...

3步解决Chatbox API连接失败:快速搞定AI客户端网络配置问题

3步解决Chatbox API连接失败:快速搞定AI客户端网络配置问题 【免费下载链接】chatbox Powerful AI Client 项目地址: https://gitcode.com/GitHub_Trending/ch/chatbox 你是否正在使用Chatbox这个强大的AI桌面客户端时,突然遇到消息发送失败、API…...

终极卡牌设计神器:CardEditor让你的桌游制作效率飙升300%

终极卡牌设计神器:CardEditor让你的桌游制作效率飙升300% 【免费下载链接】CardEditor 一款专为桌游设计师开发的批处理数值填入卡牌生成器/A card batch generator specially developed for board game designers 项目地址: https://gitcode.com/gh_mirrors/ca/C…...

Nature | Anthropic:蒸的不止数据,还有 “灵魂”

一项近日发表在Nature的工作发现如果从一个模型“蒸馏”数据到另一个模型,即便蒸馏的数据跟被蒸馏模型的行为偏好完全无关(比如只是蒸馏生成的数字(还剔除了类似911这种有特殊含义的数字)、代码或者思维链)&#xff0c…...

从‘跑字典’到‘跑掩码’:John the Ripper 增量与掩码模式详解,搞定那些有规律的‘强密码’

从‘跑字典’到‘跑掩码’:John the Ripper 增量与掩码模式详解 在渗透测试和密码安全评估中,我们常常遇到这样的场景:目标系统要求密码必须符合特定规则,比如"公司名年份特殊字符"的组合。这类密码看似复杂&#xff0c…...

钰泰ETA6095, 单电感、2.5A 开关模式电池充电器,带1.5A USB 反向充电功能

1.描述ETA6095是一款开关型锂离子电池充电器,可为电池提供高达2.5A的充电电流,同时在升压OTG工作模式下可输出最高1.5A电流,充电模式与OTG模式均具备高效率特性。 充电环节采用专属控制架构,省去了传统恒流控制所需的电流检测电阻…...

工业虚拟仿真系统有哪些?

近年来,国家持续加码数字工业建设,多项重磅政策推动虚拟现实、数字孪生、虚拟仿真技术与制造业深度融合。《“十四五”数字经济发展规划》《虚拟现实与行业应用融合发展行动计划(2022—2026年)》等文件明确指出,要加速虚拟仿真技术在工业研发…...

MHmarkets迈汇平台:点差结构与交易成本控制

摘要: 在金融信息服务领域,参与者选择平台的关键考量因素之一在于其费用结构的清晰度与执行效率。MHmarkets迈汇平台通过精心设计的点差机制及全面的成本管理策略,致力于为全球参与者提供透明、公正的价值流转环境。本文深入解析该平台在点差…...

SQL统计分组内累计增长值_利用窗口函数优化实现

<p>累计增长值等于当前行值减去组内首行值后的差值再累计求和&#xff0c;正确写法是SUM(value - FIRST_VALUE(value) OVER(PARTITION BY group_col ORDER BY time_col)) OVER(PARTITION BY group_col ORDER BY time_col)。</p>怎么用 ROW_NUMBER() 和 SUM() OVER(…...

PHP-FPM在龙芯3A5000上性能骤降57%?揭秘GCC12编译链、内核参数与cgroup v2协同优化方案

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;PHP 容器化国产化适配 在信创战略推进背景下&#xff0c;PHP 应用容器化部署需同步满足国产操作系统&#xff08;如统信 UOS、麒麟 Kylin&#xff09;、国产 CPU 架构&#xff08;鲲鹏、飞腾、海光&am…...

2026年GEO优化工具|免费AI搜索优化方案整理

AI搜索的普及&#xff0c;彻底改变了用户获取信息的方式。现在越来越多的人用DeepSeek、Kimi、ChatGPT找答案&#xff0c;品牌如果不在AI搜索中占据一席之地&#xff0c;就会流失大量潜在用户。GEO&#xff08;生成式引擎优化&#xff09;&#xff0c;已经成为企业营销的新战场…...

Go语言轻量级分布式定时任务调度框架ClawJob设计与实践

1. 项目概述&#xff1a;一个轻量级、可扩展的定时任务调度框架最近在重构一个老项目的后台服务&#xff0c;里面零零散散塞了十几个定时任务&#xff0c;有用crontab直接写的&#xff0c;有用Spring Scheduler注解的&#xff0c;还有用Quartz配置的&#xff0c;管理起来简直是…...

现在不装就晚了!PHP开发者专属LLM长连接加速插件:GitHub Star破3.2k、Packagist周下载量14,862次,安装命令+证书白名单+内网离线包全公开

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;PHP Swoole 结合 LLM 长连接方案 插件下载与安装 插件获取渠道与版本兼容性 本方案依赖的官方插件 swoole-llm-bridge 已发布于 GitHub 开源仓库&#xff0c;支持 PHP 8.1 与 Swoole v5.0.3 及以上版本…...

CIMPro孪大师的孪生体编辑器功能解读

在数字孪生的技术体系中&#xff0c;“孪生体”是一个核心而 foundational 的概念。它是指物理实体在数字世界中具备完整信息映射和交互能力的虚拟对应物。而“孪生体编辑器”&#xff0c;则是创建、定义和管理这些数字灵魂的关键工具。本文将深入解读孪生体编辑器的功能内涵、…...

零依赖多市场股票行情查询工具:Python标准库实现与OpenClaw集成

1. 项目概述&#xff1a;一个纯粹、高效的股票行情查询工具最近在折腾一个叫 OpenClaw 的开源项目&#xff0c;它本质上是一个帮你连接各种服务和数据的“智能助理”。在它的生态里&#xff0c;一个核心概念叫“技能”&#xff08;Skill&#xff09;&#xff0c;你可以理解为一…...

GModPatchTool:彻底解决Garry‘s Mod浏览器问题的终极指南

GModPatchTool&#xff1a;彻底解决Garrys Mod浏览器问题的终极指南 【免费下载链接】GModPatchTool &#x1f1ec;&#x1fa79;&#x1f6e0; Patches for Garrys Mod. Updates/Improves CEF and Fixes common launch/performance issues (esp. on Linux/Proton/macOS). Form…...

构建高质量技术使用指南开源项目:从mcp-use看开发者体验优化

1. 项目概述&#xff1a;从“mcp-use/mcp-use”看开源协作的范式演进 看到“mcp-use/mcp-use”这个项目标题&#xff0c;我的第一反应是&#xff1a;这又是一个典型的GitHub仓库命名格式。作为一名在开源社区摸爬滚打超过十年的开发者&#xff0c;我深知这种“组织名/仓库名”…...

紧急预警!2024年起欧盟新规强制要求车载C#中控支持uLTC时间同步——你还在用DateTime.Now?

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;车载 C# 中控系统实时通信 现代智能座舱对中控系统的实时性、可靠性和低延迟提出严苛要求。C# 凭借其在 .NET 6 中对跨平台实时通信的深度优化&#xff08;如 System.IO.Pipelines 和 Memory 支持&…...

如何一键永久备份QQ空间全部历史说说:GetQzonehistory完整指南

如何一键永久备份QQ空间全部历史说说&#xff1a;GetQzonehistory完整指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心QQ空间里那些珍贵的青春记忆会随着时间流逝而消失&…...

PHP 9.0 Async API设计黄金法则:12条RFC级规范(含PSR-27草案对照)、3层错误传播模型、及AI会话状态原子性保障方案

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;PHP 9.0 异步编程与 AI 聊天机器人最佳实践全景图 PHP 9.0 正式引入原生协程&#xff08;Native Coroutines&#xff09;与事件驱动运行时&#xff08;Event-Driven Runtime&#xff09;&#xff0c;彻…...

【GraphWorX32】忘记最高权限密码解决方法(9.20)

CONICS GraphWorX32 如何修改管理员登录密码前言打开管理软件重新确认找到.sec安全文件重新进入账户管理软件相关资料下载地址前言 在使用ICONICS GraphWorX32软件时&#xff0c;自带密码保护系统&#xff0c;如果忘记了用户名或者密码可以按照文章内操作方法处理。 注意本操作…...

音节划分中常用前缀列表总结

第一类:普通前缀(约80%,重音在后,前缀弱读) 重音影响:主重音落在紧接前缀后面的音节(词根第一音节),前缀本身弱读。 前缀 发音(弱读式) 含义 示例 重音影响 a- /ə/ 在...之上/进入/不 arise /əˈraɪz/ 出现 v. 主重音在后 ab- /əb/ 离开/偏离 abnormal /bˈnɔ…...

告别VoxelNet!用PointPillars+KITTI数据集,手把手教你搭建自己的3D目标检测模型

从零实现PointPillars&#xff1a;基于KITTI的3D目标检测实战指南 在自动驾驶技术快速发展的今天&#xff0c;3D目标检测已成为感知系统的核心组件。不同于传统2D图像识别&#xff0c;点云数据的稀疏性和三维特性带来了独特的挑战。本文将带您从零开始构建一个完整的PointPilla…...

问卷设计大比拼:手工瞎编 vs 通用 AI vs 虎贲等考 AI|学术实证真正的差距在这里

一、为什么你的问卷永远过不了导师那一关&#xff1f; 一份合格的学术问卷&#xff0c;是毕业论文、课程论文、实证研究的核心根基。可 90% 的同学都在踩坑&#xff1a; 手工编题&#xff1a;维度混乱、题目口语化、无理论支撑&#xff0c;信效度根本过不了网上抄量表&#x…...

后缀列表、字母组合列表、辅音连缀列表

前一篇文章介绍了音节划分规则(https://blog.csdn.net/lanhuazui10/article/details/160630574?sharetype=blogdetail&sharerId=160630574&sharerefer=PC&sharesource=lanhuazui10&spm=1011.2480.3001.8118) 这里将常用的后缀,元音组合,辅音组合列出 问…...

idea中使用免费claude code的claude-opus-4-6模型202604

1、注册agentrouter 目前仅开放 Github 和 Linux .do 的注册&#xff0c;不支持邮箱/账号注册&#xff1b;暂不支持账号密码注册&#xff1b;https://agentrouter.org/register?affb4MG获取apikey2、idea中安装CC GUI配置如下&#xff1a;配置可使用模型&#xff0c;在agentro…...

MoS动态路由机制:多模态扩散模型的融合突破

1. 多模态扩散模型的融合困境与MoS的突破在当前的AI生成领域&#xff0c;多模态扩散模型已经成为文本到图像生成的主流技术框架。这类模型的核心挑战在于如何有效对齐文本和视觉这两种异构模态的特征表示。传统方法主要依赖三种固定模式的交互机制&#xff1a;跨注意力机制(Cro…...