Apache DolphinScheduler:一个可视化大数据工作流调度平台
Apache DolphinScheduler(海豚调度)是一个分布式易扩展的可视化工作流任务调度开源系统,适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。

Apache DolphinScheduler 旨在解决复杂的大数据任务依赖关系,并为应用程序提供数据和各种 OPS 编排中的关系。 解决数据研发 ETL 依赖错综复杂,无法监控任务健康状态的问题。 DolphinScheduler 以 DAG(Directed Acyclic Graph)流式方式组装任务,可以及时监控任务的执行状态,支持重试、指定节点恢复失败、暂停、恢复、终止任务等操作。
功能特性
Apache DolphinScheduler 的主要特性如下:
- 简单易用:提供 DAG 监控界面,所有流程定义都是可视化,通过拖拽任务完成定制 DAG,通过 API 方式与第三方系统集成, 一键部署。
- 丰富的使用场景:支持多租户,支持暂停恢复操作;紧密贴合大数据生态,提供 Spark、Hive、M/R、Python、Shell、SQL、子流程等近 20 种任务类型;支持跨语言,易于扩展。
- 高可靠性:去中心化设计,确保稳定性。 原生 HA 任务队列支持,提供过载容错能力,提供高度稳健的环境。
- 高扩展性: 支持多租户和在线资源管理。支持自定义任务类型,调度器使用分布式调度,调度能力随集群线性增长,支持百万个量级任务的稳定运行。
快速体验
对于初学者,建议使用单机版(standalone server)进行体验,使用 Docker 镜像启动一个 Apache DolphinScheduler 单机容器的命令如下:
$ DOLPHINSCHEDULER_VERSION=3.2.2
$ docker run --name dolphinscheduler-standalone-server -p 12345:12345 -p 25333:25333 -d apache/dolphinscheduler-standalone-server:"${DOLPHINSCHEDULER_VERSION}"
启动服务后,我们可以通过以下网址访问 Apache DolphinScheduler:
http://localhost:12345/dolphinscheduler/ui

默认的用户和密码分别为 admin 和 dolphinscheduler123。
接下来我们可以开始创建一个简单的工作流程。Apache DolphinScheduler 中所有的工作流都必须属于一个项目,所以我们需要首先创建一个项目。
我们可以通过单击在 DolphinScheduler Project 页面中创建一个项目 “Create Project” 按钮。

接下来我们为“tutorial”项目创建一个工作流程。 点击项目,转到“Workflow Definition”页面,单击“Create Workflow”按钮进入工作流详细信息页面。

然后就是创建任务,我们可以使用鼠标从工作流画布的工具栏中拖动要创建的任务。 创建一个 Shell 任务,输入任务的必要信息,对于这个简单的工作流程,我们只需将填写属性“Node Name”以及“Script”脚本即可。单击“Save”按钮将任务保存到工作流中。

使用相同的方式创建另一个任务。
此时,我们有两个具有不同名称和命令的不同任务在工作流中运行。接下来可以设置任务依赖性, 我们可以将鼠标箭头从上游任务拖到下游 然后松开,此时可以看到两个任务之间带有箭头的链接。 最后点击右上角的“Save”按钮保存工作流。

完成以上操作之后,我们可以通过单击“Online”,然后单击“Run”按钮来运行工作流工作流列表。 如果想要查看工作流实例,只需转到 “Workflow Instance” 页面,可以看到工作流实例正在运行,状态为 Executing。

如果需要查看任务日志,可以从工作流实例中点击工作流实例列表,然后找到要查看日志的任务,右击鼠标选择 View Log,就可以看到任务的详细日志。

官方网址:
https://dolphinscheduler.apache.org/zh-cn
相关文章:
Apache DolphinScheduler:一个可视化大数据工作流调度平台
Apache DolphinScheduler(海豚调度)是一个分布式易扩展的可视化工作流任务调度开源系统,适用于企业级场景,提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。 Apache DolphinScheduler 旨在解决复杂的大数据…...
再学:call与delegatecall、call转账 Bank合约
目录 1.call与delegatecall 2.transfer && call 3.若想内部传递abi编码 4.Bank合约 1.call与delegatecall call:切换上下文 delegatecall:不切换上下文 delegatecall可以理解为 A在调用B这个集成在A的方法 可升级合约,常用del…...
关于解决新版本spring项目请求测试接口返回406的问题
目录 一、问题产生 二、问题排查 (1)首先是打断点debug进行排查 (2)网上查找相关资料排查 (3)老项目测试 三、问题解决 一、问题产生 使用Apifox对后端发送请求进行接口测试时返回状态码406࿰…...
linux入侵排查_应急响应
1.实验目标 掌握linux系统中信息收集的方法 掌握linux系统中持久化操作方法及排查方式 掌握linux系统入侵排查思路 2.实验步骤 1.统计攻击者爆破次数 2.排查攻击者第一次使用恶意用户登录的时间 3.检查sudoer文件 4.排查计划任务 5.排查计划任务 6.排查恶意服务 7.排查…...
AI视频生成产品体验分享(第2趴):Vidu、Hailuo、Runway、Pika谁更胜一筹?
hi,大家,继上次体验完可灵、即梦和pixverse,今天打算从产品经理的角度再研究下Vidu、Hailuo、Runway、Pika这几款产品!欢迎加入讨论! 一、产品简介 1. Vidu:国产自研的「一致性标杆」 📌官网…...
R语言高效数据处理-自定义格式EXCEL数据输出
注:以下代码均为实际数据处理中的笔记摘录,所以很零散, 将就看吧,这一篇只是代表着我还在,所以可能用处不大,这一段时间都很煎熬! 在实际数据处理中为了提升效率,将Excel报表交付给…...
JavaScript基础-获取元素
在Web开发中,使用JavaScript动态地访问和操作网页上的元素是一项基本技能。通过获取页面上的特定元素,我们可以对其进行各种操作,比如修改内容、样式或属性等。本文将详细介绍几种获取DOM元素的方法,并探讨它们的特点及适用场景。…...
基于srpingboot高校智慧校园教学管理服务平台的设计与实现(源码+文档+部署讲解)
技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论…...
【小白向】Word|Word怎么给公式标号、调整公式字体和花括号对齐
【小白向】Word|Word怎么给公式标号、调整公式字体和花括号对齐 我的版本:Word 2021 如需快速查看关键步骤,请直接阅读标红部分。 如果遇到无法调整的情况,可以直接下载我的示例文档进行参考:花括号和其他的示例公式.…...
uniapp-x vue 特性
生命周期 在组合式API中,组件可以监听应用和页面的生命周期。但由于应用和页面都有onShow和onHide,导致重名。所以在组合式的组件中监听页面的显示隐藏,改为了onPageShow和onPageHide。 这个和uniapp不一样,uniapp自定义组件无法…...
js逆向-下载某音乐
首先点击播放音乐,会拿到这样一个数据包 查看参数两个参数都是加密的 返回包里面有一个url,url拿到访问发现就是音频链接 访问直接下载下来 要逆向这两个参数采用xhr断点 这里加上路径的一部分 发现这些参数都是加密的 往下跟栈&am…...
百度OCR调用记录
根据说明,调用测试 设置注册的API Key和Secret Key 调用类(官方文档中有) 这里改传入路径; 测试问题 1.{"error_code":110,"error_msg":"Access token invalid or no longer valid"} 查到说是 …...
GraphDPI:通过互信息最大化进行图表示学习来消除部分标签歧义
论文源地址 1. 内容概要 本文提出了一种新的弱监督学习方法GraphDPI,解决部分标签学习(Partial Label Learning,PLL)中的标签歧义问题。GraphDPI结合了图表示学习和互信息最大化,通过图卷积网络(GCN&…...
项目实战:基于瑞萨RA6M5构建多节点OTA升级-创建系统最小框架<三>
MCUBoot项目创建完成后,接下来我们需要搭建多节点OTA系统最小框架,再将系统分模块搭建逐层完善,直到实现最终完整系统。开始动手干吧! 目录 一、创建项目 二、配置FSP 2.1 配置RS485属性 2.2 配置定时器0 2.3 创建初始化进程并配置属性 2.4 创建RS485进程并…...
C/C++模版初阶
文章目录 C/C模版初阶泛型编程函数模版函数模版概念函数模版格式函数模版的原理函数模版的实例化模版参数的匹配原则 类模版类模版的定义格式类模版的实例化 结语 我们今天又见面了,给生活加点<font colorred>impetus!!开启今天的编程之…...
1.FastAPI简介与安装
文章目录 为什么选择FastAPI?FastAPI支持的功能FastAPI的安装第一个FastAPI应用运行应用 为什么选择FastAPI? python web开发: Django: 适合大型复杂项目;Flask:适合灵活开发,搭建小型项目;FastAPI: 兼具开…...
重生之我在学Vue--第14天 Vue 3 国际化(i18n)实战指南
重生之我在学Vue–第14天 Vue 3 国际化(i18n)实战指南 文章目录 重生之我在学Vue--第14天 Vue 3 国际化(i18n)实战指南前言一、Vue I18n 核心配置1.1 基础环境搭建1.2 初始化配置1.3 全局挂载 二、多语言实现方案2.1 基础使用2.2 动态切换语言2.3 高级功能实现复数处理日期/货币…...
Java集合的底层原理
目录 Collection Arraylist HashSet 介绍 哈希值 哈希表的基本概念 HashSet 的内部实现 HashMap 哈希碰撞的处理 总结 TreeSet 特点 红黑树的特性 红黑规则 TreeSet 的内部实现 1. 存储结构 2. 添加元素(重点) 3. 查找元素 4. 删除元…...
SPI驱动(九) -- SPI_Master驱动程序
文章目录 参考资料:一、SPI传输概述二、SPI传输的两种方法2.1 旧方法2.2 新方法 参考资料: 参考资料: 参考内核源码: drivers\spi\spi.c 一、SPI传输概述 SPI控制器的作用是发起与它下面挂接的SPI设备之间的数据传输,那么控制…...
MySQL常用函数详解及SQL代码示例
MySQL常用函数详解及SQL代码示例 引言当前日期和时间函数字符串函数数学函数聚合函数结论 引言 MySQL作为一种广泛使用的关系型数据库管理系统,提供了丰富的内置函数来简化数据查询、处理和转换。掌握这些函数可以大大提高数据库操作的效率和准确性。本文将详细介绍…...
Linux 进程的创建、终止、等待与程序替换函数 保姆级讲解
目录 一、 进程创建 fork函数 二、进程的终止: 1. 想明白:终止是在做什么? 2.进程终止的3种情况? a.退出码是什么?存在原因?为什么int main()return 0? b.第三种进程终止的情况…...
大数据(1.1)纽约出租车大数据分析实战:从Hadoop到Azkaban的全链路解析与优化
目录 一、背景与数据价值 二、技术选型与组件分工 三、数据准备与预处理 四、实战步骤详解 1. 数据上传至HDFS 2. Hive数据建模与清洗 4.2.1 建表语句(分区表按年份): 4.2.2 数据清洗(剔除无效…...
BSCAN2-1:load design
1. DFT Flow Using Tessent Shell Tessent BoundaryScan 具有一个基本的高层次流程顺序。下图展示了将 Tessent BoundaryScan 插入设计所需的高层次步骤顺序。图中的每个步骤都链接到有关可测试性设计(DFT)流程的更详细信息,包括示例。 Desi…...
个人学习编程(3-18) leetcode刷题
爬楼梯: 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢? 示例 1: 输入:n 2 输出:2 解释:有两种方法可以爬到楼顶。 1. 1 阶 1 阶 2. 2 …...
【css酷炫效果】纯CSS实现立体旋转立方体
【css酷炫效果】纯CSS实现立体旋转立方体 缘创作背景html结构css样式完整代码效果图 想直接拿走的老板,链接放在这里:https://download.csdn.net/download/u011561335/90492014 缘 创作随缘,不定时更新。 创作背景 刚看到csdn出活动了&am…...
Android Fresco 框架兼容模块源码深度剖析(六)
Android Fresco 框架兼容模块源码深度剖析 一、引言 在 Android 开发的多元环境中,兼容性是衡量一个框架优劣的重要指标。Fresco 作为一款强大的图片加载框架,其兼容模块在确保框架能在不同 Android 版本、不同设备和不同图片格式下稳定运行方面发挥着…...
ABSD基于架构的软件设计
基于架构的设计(ABSD)Architecture-Based Software Design是一种软件设计方法,强调软件架构设计应该由商业、质量和功能需求共同驱动。这种方法允许设计活动在明确项目总体功能框架的前提下开始,并且需求抽取和分析活动应与设计活…...
LLM中lora的梯度更新策略公式解析
LLM中lora的梯度更新策略公式解析 目录 LLM中lora的梯度更新策略公式解析区别如何使用LoRA代码中的参数更新方式二阶导数(如右侧公式关联的Fisher信息)的作用区别 定义与理论来源: 左公式 F ( w i ) = 1 n...
开源数据仓库全解 — 从原理到实践
🎯 一、什么是数据仓库? 数据仓库(Data Warehouse,简称 DW)是面向分析和决策的专门数据存储系统,旨在整合来自多个源的数据,支持复杂查询和大规模分析任务。 特点包括: 面向主题&…...
Mac下Ollama安装全攻略:开启本地大模型之旅
文章目录 Mac下Ollama安装全攻略:开启本地大模型之旅一、Ollama 是什么功能特点优势应用场景 二、安装前准备(一)系统要求(二)硬件要求 三、下载安装包(一)官网下载(二)其…...
