当前位置: 首页 > article >正文

Flink从入门到上天系列第十九篇:Flink当中的容错机制

一检查点的概念在流处理中我们可以用存档读档的思路就是将之前某个时间点所有的状态保存下来这份 “存档” 就是我们所谓的“检查点”checkpoint。遇到故障重启的时候我们可以从检查点中 “读档”恢复出之前的状态这样就可以回到当时保存的一刻接着处理数据了。这里所谓的 “检查”其实是针对故障恢复的结果而言的故障恢复之后继续处理的结果应该与发生故障前完全一致我们需要 “检查” 结果的正确性。所以有时又会把 checkpoint 叫做 “一致性检查点”。二检查点的保存1周期性的触发保存“随时存档”确实恢复起来方便可是需要我们不停地做存档操作。如果每处理一条数据就进行检查点的保存当大量数据同时到来时就会耗费很多资源来频繁做检查点数据处理的速度就会受到影响。所以在Flink中检查点的保存是周期性触发的间隔时间可以进行设置。2保存的时间点我们应该在所有任务算子都恰好处理完一个相同的输入数据的时候将它们的状态保存下来。这样做可以实现一个数据被所有任务算子完整地处理完状态得到了保存。一条数据从头走到尾了。是怎么确定的Barrair分界线。一种特殊的消息JobManager发出的从左到右会让一条正常消息完整执行完毕路过哪个子任务哪个子任务就做检查点。这样就可以保障分界线之前的数据完整的完成计算。如果出现故障我们恢复到之前保存的状态故障时正在处理的所有数据都需要重新处理我们只需要让源source任务向数据源重新提交偏移量、请求重放数据就可以了。当然这需要源任务可以把偏移量作为算子状态保存下来而且外部数据源能够重置偏移量kafka就是满足这些要求的一个最好的例子。3保存的具体流程检查点的保存最关键的就是要等所有任务将“同一个数据”处理完毕。下面我们通过一个具体的例子来详细描述一下检查点具体的保存过程。回忆一下我们最初实现的统计词频的程序——word count。这里为了方便我们直接从数据源读入已经分开的一个个单词例如这里输入的是“hello”“world”“hello”“flink”“hello”“world”“hello”“flink”…我们所需要的就是每个任务都处理完“hello”之后保存自己的状态。这里边体现的是状态。紫色的是状态。上边的一个方格代表一个槽。一个子任务。检查点就是对状态的一个备份是状态的一个副本是状态的一个快照。三检查点的保存和恢复流程1定期保存检查点当我们需要保存检查点时就是在所有任务处理完同一条数据后对状态做个快照保存下来。例如我们输入数据为hello, world, hello, flink, hello, world, hello, flink……我们所需要的就是每个任务都处理完 hello 之后保存自己的状态。2模拟处理过程发生故障比方说某子任务突然宕机。3通过最近检查点进行恢复首先需要重启计算机重新启动任务。此时任务中都是空的 然后读取检查点重置各个算子状态。4重置偏移量从检查点恢复状态后还有一个问题如果直接继续处理数据那么保存检查点之后、到发生故障这段时间内的数据也就是第 4、5 个数据flink hello就相当于丢掉了这会造成计算结果的错误。为了不丢数据我们应该从保存检查点后开始重新读取数据这可以通过 Source 任务向外部数据源重新提交偏移量offset来实现。做完了这些整个系统的状态已经完全退回到了检查点保存的那一刻。5继续处理数据即可继续处理数据即可首先是重放数据然后处理新数据即可。

相关文章:

Flink从入门到上天系列第十九篇:Flink当中的容错机制

一:检查点的概念在流处理中,我们可以用存档读档的思路,就是将之前某个时间点所有的状态保存下来,这份 “存档” 就是我们所谓的 “检查点”(checkpoint)。遇到故障重启的时候,我们可以从检查点中…...

基于Matlab的齿轮-轴-轴承系统非线性动力学模型及其转速混沌特性分析

基于matlab的齿轮-轴-轴承系统的含间隙非线性动力学模型,根据牛顿第二定律,建立齿轮系统啮合的非线性动力学方程,同时也主要应用修正Capone模型的滑动轴承无量纲化雷诺方程,利用这些方程推到公式建模;用MATLAB求解画出…...

AI要干掉老师傅?老马揭秘CV落地真相

《人工智能AI之计算机视觉:从像素到智能》 模块五:未来与生态——多模态、产业与思维升维(认知拓展) 第 18 篇 AI不只是“看图”:老马带你拆解CV重塑三大行业的底层真相 前两天,有个在大型制造企业干了二十多年的老伙计找我喝酒。 几杯酒下肚,他开始大吐苦水:“老马…...

高铁卖票这件事,比你的生产计划做得强多了

获取更多资讯,赶快关注公众号《AI制造新观察》吧! 文章目录你以为退票手续费是在罚你?那你想错了退票手续费演进历程候补购票,根本不是你想的那么简单第一层价值:把虚假需求和真实需求分开第二层价值:实时构…...

西安康德航测 1553B 线缆

西安康德航测 1553B 线缆1553B 线缆产品(M17/176-0002 等效,GJB289A)规格:78Ω、24AWG 镀银、PFA 绝缘、屏蔽双绞线、-55℃~200℃类型:裸线、成品组件(含 TRB 双轴接头)一、技术性能优势&#x…...

三相调速永磁同步电动机maxwell模型 1、案例采用180-8极一字型冲片 2、转速为150...

三相调速永磁同步电动机maxwell模型 1、案例采用180-8极一字型冲片 2、转速为1500转 功率22kW 3、超高效率可达到1级能效 4、提供冲片图纸及Rmxprt路算结果及maxwell模型,可提供2极至8极不同转速及不同功率的电磁方案计算单 提供有限元分析模型,可直接用…...

吉林省GEO营销哪个服务商技术强

在AI搜索时代,GEO(地理定位优化)营销已成为企业提升本地曝光、精准获客的关键手段。吉林省内,吉林省吉品信息科技公司(简称“吉品信息科技”)凭借自主技术、合规优化及全流程服务,成为中小企业数…...

python+Ai技术框架的健身房课程预约管理系统的设计与实现django flask

目录技术选型与框架对比核心功能模块设计数据库设计(Django示例)AI功能实现步骤前后端交互部署与优化测试与迭代项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作技术选型与框架对…...

GitNexus:零服务器代码知识图谱引擎,让代码理解更智能

GitNexus:零服务器代码知识图谱引擎,让代码理解更智能 今日 GitHub 热门:1,860 stars ⭐ | 当日星增 1,860 | 完全在浏览器中运行 🎯 核心特性 1️⃣ 零服务器架构 GitNexus 的最大亮点是完全在浏览器中运行: ┌──…...

72 编辑距离

题目 给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作: 插入一个字符 删除一个字符 替换一个字符 示例 1: 输入:word1 “horse”, word2 “ros” 输出&…...

Git CI/CD什么意思

Git CI/CD什么意思 Git CI/CD 是现代软件开发中用于自动化构建、测试和部署代码的核心实践。它通常指的是将 Git(版本控制系统)与 CI/CD(持续集成/持续交付或持续部署)流水线相结合的工作流。 更清晰地理解,我们可以将…...

数据可视化 Amazon QuickSight介绍和使用

第一章:Amazon QuickSight 基础概念1.1 什么是 Amazon QuickSight?Amazon QuickSight 是亚马逊云科技(AWS)提供的一项全托管的、基于云的商业智能(BI)服务。它的核心目标是帮助组织内的任何员工&#xff0c…...

1143. 最长公共子序列-day49

class Solution {public int longestCommonSubsequence(String text1, String text2) {int l1text1.length();int l2text2.length();int[][] dp new int[l11][l21];//dp 前n个最长公共子序列for(int i0;i<l1;i){for(int j0;j<l2;j){//如果用dp[i][j]可以用text1.charAt(i…...

手把手玩转STM32+BQ76940电池管理系统

基于STM32F103主控的MSB管理系统资料 主控芯片STM32F103C8T6&#xff0c;锂电池管理芯片BQ76940。 资料组成&#xff1a;原理图&#xff08;AD打开&#xff0c;无PCB文件&#xff09;&#xff0c;程序源码&#xff0c;上位机软件&#xff0c;bq76940说明文档&#xff0c;bq7694…...

Windows超级管理器:一款功能全面的系统管理工具,可以系统检测、文件清理、隐私保护、磁盘管理、文件粉碎等等实用功能

软件获取地址 Windows超级管理器 Windows超级管理器是一款功能全面的系统管理工具&#xff0c;其功能包括系统检测、文件清理、隐私保护、磁盘管理、文件粉碎等等实用功能。 软件是绿色单文件版&#xff0c;大小仅6.35 MB&#xff0c;非常小巧。软件主界面可以查看你电脑的基…...

AI教育轻创合伙人靠谱吗?机遇与陷阱的深度剖析

随着人工智能技术的飞速发展&#xff0c;AI教育已成为行业新风口&#xff0c;各类轻创合伙人模式应运而生&#xff0c;吸引着众多创业者的目光。然而&#xff0c;面对“AI教育轻创合伙人靠谱吗”这一核心问题&#xff0c;市场观点不一。本文将从行业视角出发&#xff0c;深度解…...

热销榜单:2026年北京本凡科技推荐的最值得的小程序开发平台TOP3,助力企业数字化转型

在数字化转型的背景下&#xff0c;选择一个合适的小程序开发平台至关重要。2026年&#xff0c;北京本凡科技推荐的三大平台&#xff0c;各自以不同的特点和优势支持企业的发展。首先&#xff0c;北京本凡科技凭借其丰富的经验和定制化服务&#xff0c;帮助企业实现个性化需求。…...

违章真的会让车险涨价吗?很多车主都搞错了,看完少花几千块!(违章真的会影响车险保费吗?一文讲清楚交强险和商业险的浮动规则)

文章目录 📖 介绍 📖 📒 违章与车险保费的关系 📒 📝 保费调整的两个板块 📝 交强险浮动规则 🔢 保费优惠情况 📍 重要:地区差异说明 ⚠️ 保费上浮情况 📌 关于普通违章的说明 📝 商业险浮动规则 📌 轻微违章不计入 📌 严重违章可能累加 📌 出险记…...

西门子S7-200Smart测速产量统计程序:实时记录当班与总生产数据及生产时间参数的MCGS...

西门子生产测速产量统计程序。 可以记录当班生产量和生产总量&#xff0c;生产时间参数。 PLC程序是西门子S7-200Smart编写。 触摸屏使用MCGS编写。厂里新上的生产统计系统用了西门子S7-200Smart PLC搭配MCGS触摸屏&#xff0c;这组合在中小型产线里挺常见。今天主要聊聊这个测…...

py列表小练习:成绩统计程序一些数据容器的小练习

编程练习题&#xff1a;学生成绩统计系统题目描述&#xff1a;请编写一个学生成绩统计程序&#xff0c;实现以下功能&#xff1a;循环接收用户输入的学生成绩&#xff08;整数&#xff09;&#xff0c;输入 q 时结束输入&#xff1b;输入过程中如果输入非数字&#xff08;且不是…...

企业内部人才选拔AI工具盘点:洞察未来,激活组织潜能

引言&#xff1a;AI驱动的内部人才选拔新范式在全球经济与产业结构剧烈变革的当下&#xff0c;企业对人才的战略需求日益凸显。内部人才的精准配置与高效发展&#xff0c;已成为企业持续增长的关键。传统人才管理模式在面对内部人才识别、评估与发展时&#xff0c;常受限于信息…...

2026 学术写作效率革命:Paperzz AI 初稿引擎,重构本科 / 硕博论文创作全链路

Paperzz-AI官网免费论文查重复率AIGC检测/开题报告/文献综述/论文初稿paperzz - 毕业论文-AIGC论文检测-AI智能降重-ai智能写作https://www.paperzz.cc/dissertation 一、开篇&#xff1a;当毕业季遇上智能工具&#xff0c;论文初稿写作迎来全新可能 每年毕业季&#xff0c;数…...

计算机毕业设计之springboot大学生志愿者管理系统

系统根据现有的管理模块进行开发和扩展&#xff0c;采用面向对象的开发的思想和结构化的开发方法对大学生志愿者管理的现状进行系统调查。采用结构化的分析设计&#xff0c;该方法要求结合一定的图表&#xff0c;在模块化的基础上进行系统的开发工作。在设计中采用“自下而上”…...

DDoS是什么?遇到后有哪些解决方法?

随着网际网络的发达&#xff0c;DDos攻击手法也变得越来越多元且难以防范&#xff0c;尤其官方网站、线上交易平台、使用者登入页面皆为攻击者之首选目标&#xff0c;DDos攻击让许多厂商与企业蒙上巨大的损失&#xff0c;那究竟有什么DDos防御措施能在遭受攻击事前进行部署与事…...

2026年2月亲测:清洁拖把实践分享

引言&#xff1a;清洁工具升级背后的消费逻辑2026年家居清洁市场正经历一场“效率革命”。行业报告显示&#xff0c;超70%消费者将“免手洗、无死角、抑菌性”列为清洁工具核心需求&#xff0c;传统拖把因操作繁琐、清洁不彻底逐渐被淘汰。作为深耕清洁领域14年的企业&#xff…...

网络安全岗位薪水多少?

网络安全行业薪资一直备受关注&#xff0c;也是很多人入行的重要原因。其薪酬受城市、经验、岗位影响较大&#xff0c;整体高于普通IT岗位&#xff0c;那么网络安全薪水一般多少?以下是具体内容介绍。网络安全岗位的薪水跨度较大&#xff0c;具体区间如下&#xff1a;初级职位…...

【量化工具推荐】2026年期货量化实盘前验证平台排名

一、前言 实盘前用历史数据回测、用模拟盘验证&#xff0c;能降低实盘风险。2026年哪些期货量化平台更适合做实盘前验证&#xff1f;本文从回测与实盘一致性、模拟真实性、验证流程便捷性等维度&#xff0c;对8款期货量化平台进行排名。 注意&#xff1a;本文仅排名期货量化实…...

基于LSTM多输出回归预测模型的完整程序:MATLAB 2018b版代码及其评测分析

LSTM多输出回归&#xff0c;基于长短期记忆神经网络(LSTM)的多输出回归预测(多输入多输出)程序已经调试好&#xff0c;无需更改代码替换数据集即可运行数据格式为excel 1、运行环境要求MATLAB版本为2018b及其以上 2、评价指标包括:R2、MAE、MBE、RMSE等&#xff0c;图很多&…...

维普/知网AI率太高?分享3款降ai率工具,实测把AI率降到10%(2026最新)

明明查重率只有5%&#xff0c;AI率却高达70%&#xff0c;这可能是现在让学弟学妹们很是头疼的问题。以前大家只关注查重&#xff0c;现在降低ai率成了能否顺利毕业的关键。 学校通常要求AI率在30%以下&#xff0c;一旦超标&#xff0c;轻则退回修改&#xff0c;重则取消答辩资…...

交通标识与信号灯数据集(1000张图片已划分、已标注)AI训练适用于目标检测任务

交通标识与信号灯数据集&#xff08;1000张图片已划分、已标注&#xff09;AI训练适用于目标检测任务 数据集分享链接 链接:https://pan.baidu.com/s/1Cih2VbAGbbuqZl92841VSA?pwdmpws 提取码:mpws 复制这段内容后打开百度网盘手机App&#xff0c;操作更方便哦 一、智能驾驶与…...