当前位置：首页 > news >正文

flink重温笔记（十一）：Flink 高级 API 开发——flink 四大基石之 Checkpoint（详解存储后端）

news 2025/11/9 5:20:25

Flink学习笔记

前言：今天是学习 flink 的第 11 天啦！学习了 flink 四大基石之 Checkpoint （检查点），主要是解决大数据领域持久化中间结果数据，以及取消任务，下次启动人可以恢复累加数据问题，结合自己实验猜想和代码实践，总结了很多自己的理解和想法，希望和大家多多交流！

Tips：检查点，检查的是历史记录！过去的时间值得怀念，未来的道路运气会继续累加，能力会继续提升，明天也要继续努力！

文章目录

Flink学习笔记
- 三、Flink 高级 API 开发
- - 4. Checkpoint
  - - 4.1 Checkpoint 介绍
    - - 4.1.1 流程简介：
      - 4.1.2 单流的 barrier
      - 4.1.3 双流的 checkpoint 实现
    - 4.2 持久化存储
    - - 4.2.1 MemStateBackend
      - 4.2.2 FsStateBackend
      - 4.2.3 RocksDBStateBackend
      - 4.2.4 配置参数用法
      - 4.2.5 修改 State Backend 的两种方式（简略，新版本前）
      - (1) 单任务调整（灵活）
        (2) 全局调整
      - 4.2.6 从传统后端迁移的三种情况（详细，新版本后）
      - (1) MemoryStateBackend
        (2) FsStateBackend
        (3) RocksDBStateBackend
      - 4.6.7 Checkpoint 案例演示
    - 4.3 Flink 的重启策略
    - - 4.3.1 概述
      - 4.3.2 固定延迟重启策略
      - (1) 全局配置 flink-conf.yaml
        (2) 代码设置
      - 4.3.3 失败率重启策略
      - (1) 全局配置 flink-conf.yaml
        (2) 代码设置
      - 4.3.4 无重启策略
      - (1) 全局配置 flink-conf.yaml
        (2) 代码设置
      - 4.3.5 重启策略的案例演示
    - 4.4 Savepoint
    - - 4.4.1 应用场景
      - 4.4.2 面试问题
      - 4.4.3 案例演示

三、Flink 高级 API 开发

4. Checkpoint

4.1 Checkpoint 介绍

4.1.1 流程简介：

1- Flink 检查点机制，CheckpointCoordinator （协调者）定期在数据流上生成 checkpoint barrier；
2- 当某个算子接收到 barrier（数据栅栏）时，会基于当前状态生成一份快照；
3- 后将 barrier 传递给下游算子，依次快照并传递下去，直到 sink；
4- 出现异常时，根据最近的快照数据，将所有算子恢复到之前状态；
5- CheckpointCoordinator 收到所有算子的报告后，才认为该周期快照成功。

在这里插入图片描述

4.1.2 单流的 barrier

每个 barier 都带有快照 id，并且 barrier之前的数据都进入了该快照；
一个数据源可以有多个 barrier，工作独立，互不干扰；

4.1.3 双流的 checkpoint 实现

一个算子有两个数据源，阻塞先收到 barrier 的快数据源，等慢数据源接到相同编号的 barrier，再制作自身快照。
（1）快慢不一，阻塞快源

（2）双源到齐，制作快照

4.2 持久化存储

4.2.1 MemStateBackend

1- 将状态维护在 Java 堆上的一个内部状态后端
2- 大小限制
- 默认状态限制 5Mb，可以通过其构造函数增加大小
- 状态大小 <= akka 帧大小（akka 是并发框架）
- 状态大小 <= job manager 内存大小
3- 适用场景
- debug 模式下使用，不适合生产环境使用

4.2.2 FsStateBackend

1- 将状态存储在 [本地文件/ HDFS]
- 使用本地文件：new FsStateBackend(“file:///Data”))，不推荐，集群间读文件难
- 使用 HDFS：new FsStateBackend(“hdfs:///lql/checkpoint”))
2- 适用场景：
- 具有大状态，长窗口，大键 / 值状态的作业
- 所有高可用性设置
3- 弊端：
- 分布式文件持久化，每次读写都会产生网络 IO，整体性能不佳

4.2.3 RocksDBStateBackend

1- RockDB 是一种嵌入式的本地数据库，默认是配置成异步快照（不需要等待所有信号结束才开始状态拷贝）
2- 适用场景：
- 最适合用于处理大状态，长窗口，或大键值状态的有状态处理任务
- 非常适合用于高可用方案
3- 也需要配置一个文件系统：本地 / HDFS
4- RocksDBStateBackend（flink1.13）唯一支持增量 checkpoint 的后端

4.2.4 配置参数用法

1- 设置checkpoint周期执行时间，即两个 checkpoint 之间的间距
- env.enableCheckpointing(5000);
2- 设置checkpoint的执行模式，最多执行一次（默认值）或者至少执行一次
- env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE)
- env.getCheckpointConifg().setCheckpointingMode(ChexkpointingMode.AT_LEAST_ONCE)
3- 设置checkpoint的超时时间（即一个checkpoint操作的最大允许时间）
- env.getCheckpointConfig().setCheckpointTimeout(60000);
4- 如果在只做快照过程中出现错误，是否让整体任务失败：true是 false不是
- env.getCheckpointConfig().setFailOnCheckpointingErrors(false);
5- 设置同一时间有多少个checkpoint可以同时执行
- env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);
6- 任务被 cancel，检查点被自动删除了，保留以前做的 checkpoint 可以启动外部检查点持久化
- env**.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.**RETAIN_ON_CANCELLATION)：在作业取消时保留检查点，注意，您必须在取消后手动清理检查点状态
- ExternalizedCheckpointCleanup.DELETE_ON_CANCELLATION：当作业被cancel时，删除检查点，检查点仅在作业失败时可用

4.2.5 修改 State Backend 的两种方式（简略，新版本前）

(1) 单任务调整（灵活）

修改方案1：env.setStateBackend(new FsStateBackend(“hdfs://node01:8020/flink/checkpoints”));
修改方案2：new MemoryStateBackend()
修改方案3：new RocksDBStateBackend(filebackend, true) 需要添加依赖

 <dependency><groupId>org.apache.flink</groupId><artifactId>flink-statebackend-rocksdb_2.11</artifactId><version>1.7.0</version></dependency>

(2) 全局调整

修改flink-conf.yaml
- state.backend: filesystem
- state.checkpoints.dir: hdfs://namenode:9000/flink/checkpoints
state.backend的值可以是下面几种
- jobmanager (MemoryStateBackend)
- filesystem (FsStateBackend)
- rocksdb (RocksDBStateBackend)

4.2.6 从传统后端迁移的三种情况（详细，新版本后）

从 Flink 1.13 版本开始，社区重新设计了其公共状态后端类，用户可以迁移现有应用程序以使用新 API，而不会丢失任何状态或一致性。

(1) MemoryStateBackend

以前的 MemoryStateBackend 相当于使用 HashMapStateBackend 和 JobManagerCheckpointStorage

全局配置 flink-conf.yaml

state.backend: hashmap# Optional, Flink will automatically default to JobManagerCheckpointStorage
# when no checkpoint directory is specified.
state.checkpoint-storage: jobmanager

代码设置

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();// 因为使用新的类：HashMapStateBackend
env.setStateBackend(new HashMapStateBackend());// 因为 JobManagerCheckpointStorage 即：checkpoint 与 jobmanager 有关
env.getCheckpointConfig().setCheckpointStorage(new JobManagerStateBackend());

(2) FsStateBackend

以前的 FsStateBackend 相当于使用 HashMapStateBackend 和 FileSystemCheckpointStorage

全局配置 flink-conf.yaml

state.backend: hashmap
state.checkpoints.dir: file:///checkpoint-dir/# Optional, Flink will automatically default to FileSystemCheckpointStorage
# when a checkpoint directory is specified.
state.checkpoint-storage: filesystem

代码设置

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();// 因为使用新的类：HashMapStateBackend
env.setStateBackend(new HashMapStateBackend());// 因为 JobManagerCheckpointStorage 即：checkpoint 与 jobmanager 有关
env.getCheckpointConfig().setCheckpointStorage("file:///checkpoint-dir");// 下面的设置更高级一点，可以传入参数，建议！
// Advanced FsStateBackend configurations, such as write buffer size
// can be set by manually instantiating a FileSystemCheckpointStorage object.
env.getCheckpointConfig().setCheckpointStorage(new FileSystemCheckpointStorage("file:///checkpoint-dir"));

(3) RocksDBStateBackend

以前的 RocksDBStateBackend相当于使用 EmbeddedRocksDBStateBackend 和 FileSystemCheckpointStorage

全局配置 flink-conf.yaml

state.backend: rocksdb
state.checkpoints.dir: file:///checkpoint-dir/# Optional, Flink will automatically default to FileSystemCheckpointStorage
# when a checkpoint directory is specified.
state.checkpoint-storage: filesystem

代码设置

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();// 因为使用新的类：EmbeddedRocksDBStateBackend
env.setStateBackend(new EmbeddedRocksDBStateBackend());env.getCheckpointConfig().setCheckpointStorage("file:///checkpoint-dir");// If you manually passed FsStateBackend into the RocksDBStateBackend constructor
// to specify advanced checkpointing configurations such as write buffer size,
// you can achieve the same results by using manually instantiating a FileSystemCheckpointStorage object.
env.getCheckpointConfig().setCheckpointStorage(new FileSystemCheckpointStorage("file:///checkpoint-dir"));

4.6.7 Checkpoint 案例演示

例子：socket 数据源，词频统计，开启 checkpoint，每隔 5s 写入 HDFS

package cn.itcast.day10.checkpoint;import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.runtime.state.CheckpointStorage;
import org.apache.flink.runtime.state.filesystem.FsStateBackend;
import org.apache.flink.runtime.state.filesystem.FsStateBackendFactory;
import org.apache.flink.runtime.state.hashmap.HashMapStateBackend;
import org.apache.flink.runtime.state.memory.MemoryStateBackend;
import org.apache.flink.runtime.state.storage.JobManagerCheckpointStorage;
import org.apache.flink.streaming.api.CheckpointingMode;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.CheckpointConfig;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;/*** 读取服务器node01中端口9999的内容,并切分单词,统计数量* 要求: 开启checkpoint支持,每隔5s钟写入HDFS一次*/
public class StreamCheckpointDemo {public static void main(String[] args) throws Exception {//todo 1）获取flink流处理的运行环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//todo 2）开启checkpoint//每隔5s周期性的生成barrier（栅栏），默认情况下没有开启checkpointenv.enableCheckpointing(5000L);//设置checkpoint的超时时间env.getCheckpointConfig().setCheckpointTimeout(2000L);//同一个时间只能有一个栅栏在运行env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);//设置checkpoint的执行模式。仅执行一次env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);//设置checkpoint最小时间间隔env.getCheckpointConfig().setMinPauseBetweenCheckpoints(1000L);//env.getCheckpointConfig().setFailOnCheckpointingErrors(false);//指定checkpoint的存储位置if(args.length< 1){//env.setStateBackend(new FsStateBackend("file:///D:\\checkpoint"));env.setStateBackend(new HashMapStateBackend());env.getCheckpointConfig().setCheckpointStorage("file:///D:\\checkpoint");}else{//env.setStateBackend(new FsStateBackend(args[0]));env.setStateBackend(new HashMapStateBackend());env.getCheckpointConfig().setCheckpointStorage(args[0]);} // 设置任务失败时候，能够外部持久化检查点env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);//todo 2）接入数据源，读取文件获取数据DataStreamSource<String> lines = env.socketTextStream("node01", 7777);//todo 3）数据处理//  3.1：使用flatMap对单词进行拆分SingleOutputStreamOperator<String> words = lines.flatMap(new FlatMapFunction<String, String>() {@Overridepublic void flatMap(String line, Collector<String> out) throws Exception {String[] words = line.split(" ");//返回数据for (String word : words) {out.collect(word);}}});//  3.2：对拆分后的单词进行记一次数SingleOutputStreamOperator<Tuple2<String, Integer>> wordAndOne = words.map(new MapFunction<String, Tuple2<String, Integer>>() {@Overridepublic Tuple2<String, Integer> map(String word) throws Exception {return Tuple2.of(word, 1);}});KeyedStream<Tuple2<String, Integer>, String> grouped = wordAndOne.keyBy(t -> t.f0);//  3.4：对分组后的key进行聚合操作SingleOutputStreamOperator<Tuple2<String, Integer>> sumed = grouped.sum(1);//todo 4）构建sink，输出结果sumed.print();//todo 5）启动运行env.execute();}
}

结果：

将程序打包成jar包放在flink的提交页面
# 启动 jobmanager 和 taskmanager
bin/start-cluster.sh输入地址参数，最终发现：
1. 手动取消作业，检查点文件没有消失
2. 输入hdfs地址参数，检查点文件生成在hdfs目录上

总结：

理解配置参数，修改后端的方法

4.3 Flink 的重启策略

4.3.1 概述

flink-conf.yaml 配置文件的 restart-strategy 配置参数决定重启策略。

重启策略	重启策略值	说明
Fixed delay	fixed-delay	固定延迟重启策略
Failure rate	failure-rate	失败率重启策略
No restart	None	无重启策略

4.3.2 固定延迟重启策略

配置参数	描述	默认值
restart-strategy.fixed-delay.attempts	在 Job 最终失败前，Flink 尝试执行的次数	如果启用 checkpoint 的话是Integer.MAX_VALUE
restart-strategy.fixed-delay.delay	延迟重启指一个执行失败后，不立即重启，等待一段时间。	akka.ask.timeout,如果启用checkpoint的话是1s

(1) 全局配置 flink-conf.yaml

restart-strategy: fixed-delay
restart-strategy.fixed-delay.attempts: 3
restart-strategy.fixed-delay.delay: 10 s

(2) 代码设置

// 1. 初始化流处理环境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setRestartStrategy(RestartStrategies.fixedDelayRestart(3, // 尝试重启的次数Time.of(10, TimeUnit.SECONDS) // 延时
))

4.3.3 失败率重启策略

配置参数	描述	默认值
restart-strategy.failure-rate.max-failures-per-interval	在一个Job认定为失败之前，最大的重启次数	1
restart-strategy.fixed-delay.delay	计算失败率的时间间隔	1分钟
restart-strategy.failure-rate.delay	两次连续重启尝试之间的时间间隔	akka.ask.timeout

(1) 全局配置 flink-conf.yaml

restart-strategy: failure-rate
restart-strategy.failure-rate.max-failures-per-interval: 3
restart-strategy.failure-rate.failure-rate-interval: 5 min
restart-strategy.failure-rate.delay: 10 s意思就表明为：
失败重启之间的间隔是10秒
如果5分钟内，失败3次，就不会在重启了，直接结束任务

(2) 代码设置

env.setRestartStrategy(RestartStrategies.failureRateRestart(3, // 每个测量时间间隔最大失败次数Time.of(5, TimeUnit.MINUTES), //失败率测量的时间间隔Time.of(10, TimeUnit.SECONDS) // 两次连续重启尝试的时间间隔
))

4.3.4 无重启策略

(1) 全局配置 flink-conf.yaml

restart-strategy: none

(2) 代码设置

// 直接失败，不会重启
env.setRestartStrategy(RestartStrategies.noRestart());

4.3.5 重启策略的案例演示

例子：基于之前的单词统计案例改造,当遇到"laowang"字符串的时候,程序抛出异常,出现3次异常后,程序退出.

/*** 演示flink的重启策略* flink的重启策略是，在配置了checkpoint的前提下，不停的重启的重启，如果不配置checkpoint不能使用重启策略，作业直接停止* flink有三种重启策略的方式：* 固定延迟重启策略：*      设置失败重启的次数，以及两次重启的时间间隔，如：设置重启失败次数是3次，每次间隔5秒钟，那么输入三次异常以后，尝试重启三次，第四次依然失败，则作业停止* 失败率重启策略：*      给定一定时间，如果这个时间内设置了n次失败重启，一旦超过了N次，则作业停止，如：3分钟失败五次，每次时间间隔10秒，则任务结束* 无重启策略：*      表示运行失败以后，立刻停止作业运行*/
public class FixedDelayRestartStrategyDemo {public static void main(String[] args) throws Exception {/*** 实现步骤：* 1）初始化flink的流处理的运行环境* 2）开启checkpint* 3）配置重启策略* 4）接入数据源* 5）对字符串进行空格拆分，每个单词记一次数* 6）分组聚合* 7）打印测试* 8）运行作业*///TODO 1）初始化flink流处理的运行环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//TODO 2）开启checkpoint//周期性的生成barrier（栅栏），默认情况下checkpoint是没有开启的env.enableCheckpointing(5000L);//设置checkpoint的超时时间env.getCheckpointConfig().setCheckpointTimeout(6000L);//设置同一个时间只能有一个栅栏在运行env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);// 设置checkpoint的执行模式，最多执行一次或者至少执行一次env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);//Checkpointing最小时间间隔env.getCheckpointConfig().setMinPauseBetweenCheckpoints(500);//指定checkpoint的存储位置if(args.length < 1) {env.setStateBackend(new FsStateBackend("file:///E:\\checkpoint"));}else{env.setStateBackend(new FsStateBackend(args[0]));}env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);//TODO 3）配置重启策略//固定延迟重启策略，程序出现异常的时候，重启三次，每次延迟五秒钟重启，超过三次，则程序退出env.setRestartStrategy(RestartStrategies.fixedDelayRestart(3, Time.seconds(5)));//TODO 4）接入数据源DataStreamSource<String> socketTextStream = env.socketTextStream("node1", 9999);//TODO 5）对字符串进行空格拆分，每个单词记一次数SingleOutputStreamOperator<Tuple2<String, Long>> wordAndOne = socketTextStream.flatMap(new FlatMapFunction<String, Tuple2<String, Long>>() {@Overridepublic void flatMap(String line, Collector<Tuple2<String, Long>> collector) throws Exception {if(line.startsWith("laowang")){System.out.println(line);int i = 1/0;System.out.println(i);throw  new RuntimeException("老王驾到，程序挂了！");}String[] words = line.split(" ");for (String word : words) {collector.collect(Tuple2.of(word, 1L));}}});//TODO 6）分组聚合SingleOutputStreamOperator<Tuple2<String, Long>> sumed = wordAndOne.keyBy(0).sum(1);//TODO 7）打印测试sumed.print();//TODO 8）运行作业env.execute();}
}

总结：

抛出异常：throw new RuntimeException();

4.4 Savepoint

4.4.1 应用场景

savepoint的目的是为了从上一次保存的中间结果中恢复过来，比如：在生产环境中运行着一个作业，因为今晚要升级作业，因此需要将生产环境的作业停止掉，将升级后的jar进行部署和发布，希望重新发布以后可以将上一个作业的运行结果恢复后继续运行

4.4.2 面试问题

checkpoint和savepoint的区别？

checkpoint：周期性定期运行，生成barrier（栅栏）发送到job作业的每个算子，当算子收到 barrier以后会将state的中间计算结果快照存储到分布式文件系统中
savepoint：将指定的checkpoint的结果恢复过来，恢复到当前的作业中，继续运行

4.4.3 案例演示

例子：代码和之前一样

/*** savepoint的目的是为了从上一次保存的中间结果中恢复过来* 举例：* 在生产环境中运行着一个作业，因为今晚要升级作业，因此需要将生产环境的作业停止掉，将升级后的jar进行部署和发布* 希望重新发布以后可以将上一个作业的运行结果恢复后继续运行** 所以这时候可以使用savepoint进行解决这个问题问题** 面试问题：* checkpoint和savepoint的区别？* checkpoint：周期性定期运行，生成barrier（栅栏）发送到job作业的每个算子，当算子收到barrier以后会将state的中间计算结果快照存储到分布式文件系统中* savepoint：将指定的checkpoint的结果恢复过来，恢复到当前的作业中，继续运行** TODO 当作业重新递交的时候，并行度发生了概念，在flink1.10版本中，可以正常的递交作业，且能够恢复历史的累加结果* 但是之前版本中一旦发生并行度的变化，作业无法递交*/
public class SavepointDemo {public static void main(String[] args) throws Exception {/*** 实现步骤：* 1）初始化flink流处理的运行环境* 2）开启checkpoint* 3）指定数据源* 4）对字符串进行空格拆分，然后每个单词记一次数* 5）对每个单词进行分组聚合操作* 6) 打印测试* 7）执行任务，递交作业*///TODO 1）初始化flink流处理的运行环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//TODO 2）开启checkpoint//周期性的生成barrier（栅栏），默认情况下checkpoint是没有开启的env.enableCheckpointing(5000L);//设置checkpoint的超时时间env.getCheckpointConfig().setCheckpointTimeout(6000L);//设置同一个时间只能有一个栅栏在运行env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);// 设置checkpoint的执行模式，最多执行一次或者至少执行一次env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);//Checkpointing最小时间间隔env.getCheckpointConfig().setMinPauseBetweenCheckpoints(500);//指定checkpoint的存储位置if(args.length < 1) {env.setStateBackend(new FsStateBackend("file:///E:\\checkpoint"));}else{env.setStateBackend(new FsStateBackend(args[0]));}env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);//TODO 3）指定数据源DataStreamSource<String> socketTextStream = env.socketTextStream("node1", 9999);//TODO 4）对字符串进行空格拆分，然后每个单词记一次数SingleOutputStreamOperator<Tuple2<String, Long>> wordAndOne = socketTextStream.flatMap(new FlatMapFunction<String, Tuple2<String, Long>>() {@Overridepublic void flatMap(String line, Collector<Tuple2<String, Long>> collector) throws Exception {String[] words = line.split(" ");for (String word : words) {collector.collect(Tuple2.of(word, 1L));}}});//TODO 5）对每个单词进行分组聚合操作SingleOutputStreamOperator<Tuple2<String, Long>> sumed = wordAndOne.keyBy(0).sum(1);//TODO 6) 打印测试sumed.print();//TODO 7）执行任务，递交作业env.execute();}
}

结果：

(hadoop,4)
取消程序后，再次运行，
结果累加上一次取消任务的结果：
(hadoop,5)

总结：

打包 jar 包到 flink 平台时，不可以修改并行度，并行度保持一致，不然会报错
指定 flink 平台提交任务的 savepoint 地址，即指定为上一次取消程序的 checkpoint 地址，即可恢复上一次的累加数据
上一次取消程序的 checkpoint 地址：flink 8081 web页面上 checkpoint 页面有历史记录地址哦！

flink重温笔记（十一）：Flink 高级 API 开发——flink 四大基石之 Checkpoint（详解存储后端）

Flink学习笔记前言：今天是学习 flink 的第 11 天啦！学习了 flink 四大基石之 Checkpoint （检查点），主要是解决大数据领域持久化中间结果数据，以及取消任务，下次启动人可以恢复累加数据问题&…...

编程日记 2024/3/7 6:41:33

React富文本编辑器开发（九）位置

位置是指在使用Slate编辑器中进行插入、删除或执行其它操作时引用文档中特定位置的方式。有几种不同类型的位置接口，每种接口都用于不同的用例。 Path路径路径是引用位置的最低级别的方法。每个路径都是一个简单的数字数组，它通过文档树下每个祖先节点…...

编程日记 2024/3/7 6:40:32

一次直播和图像识别技术应用的探索之旅

背景 Think Better 很多行业都在“卷”，作为金融科技行业的信也，也不例外。除了卷云计算、大数据和人工智能这些非常有深度的技术以外，信也向着技术融合创新的方向逐步探索，做得更好一些，为用户提供更好的价值&#xf…...

编程日记 2024/3/7 6:39:31

Ubuntu 下使用 Pybind11 实现 C++ 调用 Python 接口的示例

Pybind11 是一个轻量级的库，它提供了在 C 中无缝集成 Python 代码的能力。使用 Pybind11，你可以很容易地从 C 调用 Python 代码，反之亦然。下面我将通过一个简单的例子来展示如何在 Ubuntu 系统上使用 Pybind11 从 C 调用 Python 接口。安装…...

编程日记 2024/3/7 6:38:30

1. 启动zookeeper Kafka依赖zookeeper, 首先安装zookeeper -p：设置映射端口（默认2181） docker run --name zookeeper \--network app-tier \-e ALLOW_ANONYMOUS_LOGINyes \--restartalways \-d bitnami/zookeeper:latest2. 启动kafka docker…...

编程日记 2024/3/7 6:37:30

CTP-API开发系列之接口对接准备

CTP-API开发系列之接口对接准备 CTP-API开发系列之接口对接准备CTP-API文件清单CTP-API通用规则命名规则Spi与Api CTP-API通讯模式开发语言选择 CTP-API开发系列之接口对接准备 CTP-API文件清单文件名说明ThostFtdcTraderApi.h交易接口，C头文件，包括 …...

编程日记 2024/3/7 6:36:28

C++小记 -链表

链表文章目录链表链表基础理论链表的类型单链表双链表循环链表链表的存储方式链表的定义链表的操作添加节点删除节点性能分析构建链表删除节点（内存泄漏的坑）1.直接移除2.使用虚拟头结点3.delete指针后，要将指针置为NULL！&…...

编程日记 2024/3/7 6:34:26

网络协议学习DAY1

1.网络协议模型: OSI协议模型应用层实际发送的数据表示层发送的数据是否加密会话层是否建立会话连接传输层数据传输的方式（数据报、流式） 网…...

编程日记 2024/3/7 6:33:25

vue3中全局变量的定义和获取

在vue项目中，我们知道vue2定义全局变量是在main.js文件将变量挂载到vue.prototype.name"lisi"，在页面通过this.name去调用。但是在vue3中，这个定义全局变量有所改变： const app createApp(App) app.config.globalProp…...

编程日记 2024/3/7 6:32:24

1.2 数据模型数据库系统概论

目录 1.2.1 两类数据模型 1.2.2 概念模型 1.信息世界中的基本概念 （1）实体 （2）属性 （3）码 （4）实体型 （5）实体集 （6）联系 2.…...

编程日记 2024/3/7 6:31:22

C#中openFileDialog 对话框不在最顶层，TopMost的异常情况

重点！！！若当前窗体this的TopMost是false，可以设置为true，这样打开的对话框就是最顶层 /// <summary> /// 设置窗体TopMost，缺点和其他程序ide有冲突。例如VS有断点的调试会卡死 /// </summary&g…...

编程日记 2024/3/7 6:29:21

信息安全与阿里云等保三级方案实践总结

信息安全在当今数字化时代变得至关重要，企业和组织需要采取有效措施来保护其数据和信息资产。阿里云作为中国领先的云服务提供商，提供了等保三级方案，帮助用户满足国家信息安全等级保护的要求。本文将探讨信息安全和阿里云等保三级方案的重要…...

编程日记 2024/3/7 6:28:20

嵌入式学习记录——线程

线程基本概念: 线程:线程是一个轻量级的进程,位于进程空间内部,一个进程中可以创建多个线程 1.线程创建: 线程独占栈空间,文本段、数据段和堆区与进程共享 2.线程调度: 与进程调度是一样的宏观并行,微观串行 3.线程消亡: 与进程消亡是一样的 4.进程和线程…...

编程日记 2024/3/7 6:27:19

同步服务器操作系统公网仓库到本地 _ 统信UOS _ 麒麟KYLINOS

原文链接：同步服务器操作系统公网仓库到本地 | 统信UOS | 麒麟KYLINOS 在如今快速发展的信息技术时代，维护和更新服务器操作系统变得越来越重要。无论是为了提高安全性、增加新功能还是提升系统稳定性，同步公网源仓库到本地都是一个关键步骤。…...

编程日记 2024/3/7 6:26:18

【数仓】flume常见配置总结，以及示例

相关文章【数仓】基本概念、知识普及、核心技术【数仓】数据分层概念以及相关逻辑【数仓】Hadoop软件安装及使用（集群配置）【数仓】Hadoop集群配置常用参数说明【数仓】zookeeper软件安装及集群配置【数仓】kafka软件安装及集群配置【数仓】flume软件安…...

编程日记 2024/3/7 6:25:17

统计信息锁定

在导入成功后我要收集下这些表的信息，结果发现好几张表都没法收集，用DBMS_STATS包显示ORA-20005：object statistics are locked (stattype ALL)，用Analyze命令显示ORA-38029： 对象统计信息已锁定。解决办法很明确&a…...

编程日记 2024/3/7 6:24:16

光猫改为bridge模式

注意事项： 改成桥接模式后，光猫将不再拨号上网，建议提前记录自己的宽带账号，打10010申请修改自己的宽带密码。光猫改好桥接之后，把宽带账号和密码输入到负责拨号上网的终端设备中，完成宽带PPPOE拨号设置。…...

编程日记 2024/3/7 6:23:15

回溯算法01-组合(Java)

1.组合题目描述给定两个整数 n 和 k，返回范围 [1, n] 中所有可能的 k 个数的组合。你可以按任何顺序返回答案。示例 1： 输入：n 4, k 2 输出： [[2,4],[3,4],[2,3],[1,2],[1,3],[1,4]]示例 2： 输入&#x…...

编程日记 2024/3/7 6:21:13

初始网络 --- 网络基础

目录 0、前言 1、计算机网络发展背景 1.1. 局域网(LAN) && 广域网(WAN) 2、认识并理解协议 3、初始网络协议 3.1. 协议分层 4、 TCP/IP 五层(或四层)模型 4.1. 简单了解TCP/IP层状体系 4.2. TCP/IP协议层状结构和计算机层状结构的关系 5、 OSI七层模型 …...

编程日记 2024/3/7 6:20:12

在Linux/Ubuntu/Debian中计算MD5,SHA256的方法

MD5（消息摘要算法 5）和 SHA-256（安全哈希算法 256 位）等流行的哈希算法广泛用于从任意数据生成固定大小的哈希值或校验和。以下是这些算法及其计算方式的简要概述： MD5（消息摘要算法5）&#x…...

编程日记 2024/3/7 6:19:11

基于算法竞赛的c++编程（28）结构体的进阶应用

结构体的嵌套与复杂数据组织在C中，结构体可以嵌套使用，形成更复杂的数据结构。例如，可以通过嵌套结构体描述多层级数据关系： struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

编程新知 2025/10/17 16:01:19

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别，用于控制事务之间的并发访问以及数据的可见性，不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式，具体如下：隔离级别脏读不可重复读幻读性能特点及锁机制读未提交（READ UNCOMMITTED）允许出现允许…...

编程新知 2025/9/16 21:01:58

连锁超市冷库节能解决方案：如何实现超市降本增效

在连锁超市冷库运营中，高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术，实现年省电费15%-60%，且不改动原有装备、安装快捷、…...

编程新知 2025/9/18 22:35:44

c++ 面试题(1)-----深度优先搜索（DFS）实现

操作系统：ubuntu22.04 IDE:Visual Studio Code 编程语言：C11 题目描述地上有一个 m 行 n 列的方格，从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子，但不能进入行坐标和列坐标的数位之和大于 k 的格子。例…...

编程新知 2025/11/5 20:18:24

06 Deep learning神经网络编程基础激活函数 --吴恩达

深度学习激活函数详解一、核心作用引入非线性：使神经网络可学习复杂模式控制输出范围：如Sigmoid将输出限制在(0,1)梯度传递：影响反向传播的稳定性二、常见类型及数学表达 Sigmoid σ ( x ) = 1 1 +...

编程新知 2025/10/2 18:05:53

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库，专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性，并提供了一个通用的框架&…...

编程新知 2025/10/30 3:23:02

九天毕昇深度学习平台 | 如何安装库？

pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子： 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

编程新知 2025/11/7 20:31:11

让回归模型不再被异常值“带跑偏“，MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中，损失函数的选择对模型性能具有决定性影响。均方误差（MSE）作为经典的损失函数，在处理干净数据时表现优异，但在面对包含异常值的噪声数据时，其对大误差的二次惩罚机制往往导致模型参数…...

编程新知 2025/11/7 21:04:33

Netty从入门到进阶（二）

二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架，用于…...

编程新知 2025/11/8 2:29:54

使用LangGraph和LangSmith构建多智能体人工智能系统

现在，通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战，比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。在这篇博客〔原作者&a…...

编程新知 2025/11/8 2:57:48

Flink学习笔记

文章目录

三、Flink 高级 API 开发

4. Checkpoint

4.1 Checkpoint 介绍

4.1.1 流程简介：

4.1.2 单流的 barrier

4.1.3 双流的 checkpoint 实现

4.2 持久化存储

4.2.1 MemStateBackend

4.2.2 FsStateBackend

4.2.3 RocksDBStateBackend

4.2.4 配置参数用法

4.2.5 修改 State Backend 的两种方式（简略，新版本前）

(1) 单任务调整（灵活）

(2) 全局调整

4.2.6 从传统后端迁移的三种情况（详细，新版本后）

(1) MemoryStateBackend

(2) FsStateBackend

(3) RocksDBStateBackend

4.6.7 Checkpoint 案例演示

4.3 Flink 的重启策略

4.3.1 概述

4.3.2 固定延迟重启策略

(1) 全局配置 flink-conf.yaml

(2) 代码设置

4.3.3 失败率重启策略

(1) 全局配置 flink-conf.yaml

(2) 代码设置

4.3.4 无重启策略

(1) 全局配置 flink-conf.yaml

(2) 代码设置

4.3.5 重启策略的案例演示

4.4 Savepoint

4.4.1 应用场景

4.4.2 面试问题

4.4.3 案例演示

相关文章：