当前位置：首页 > news >正文

Flink——进行数据转换时，报：Recovery is suppressed by NoRestartBackoffTimeStrategy

news 2025/12/5 12:16:34

热词统计案例：

用flink中的窗口函数（apply）读取kafka中数据，并对热词进行统计。

apply:全量聚合函数，指在窗口触发的时候才会对窗口内的所有数据进行一次计算（等窗口的数据到齐，才开始进行聚合计算，可实现对窗口内的数据进行排序等需求）。

代码演示：

kafka发送消息端：

package com.bigdata.Day04;import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;import java.util.Properties;
import java.util.Random;public class Demo01_windows_kafka发消息 {public static void main(String[] args) throws Exception {// Properties 它是map的一种Properties properties = new Properties();// 设置连接kafka集群的ip和端口properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"bigdata01:9092");properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG,"org.apache.kafka.common.serialization.StringSerializer");properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,"org.apache.kafka.common.serialization.StringSerializer");// 创建了一个消息生产者对象KafkaProducer kafkaProducer = new KafkaProducer<>(properties);String[] arr = {"联通换猫","遥遥领先","恒大歌舞团","恒大足球队","郑州烂尾楼"};Random random = new Random();for (int i = 0; i < 500; i++) {ProducerRecord record = new ProducerRecord<>("topic1",arr[random.nextInt(arr.length)]);// 调用这个里面的send方法kafkaProducer.send(record);Thread.sleep(50);}kafkaProducer.close();}
}

kafka接受消息端：

package com.bigdata.Day04;import org.apache.commons.lang3.time.DateFormatUtils;
import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.common.serialization.SimpleStringSchema;import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.util.Collector;
import org.apache.kafka.clients.consumer.KafkaConsumer;import java.util.Properties;public class Demo02_kafka收消息 {public static void main(String[] args) throws Exception {//1. env-准备环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC);//2. source-加载数据Properties properties = new Properties();properties.setProperty("bootstrap.servers","bigdata01:9092");properties.setProperty("group.id", "g2");FlinkKafkaConsumer<String> kafkaSource = new FlinkKafkaConsumer<String>("topic1",new SimpleStringSchema(),properties);DataStreamSource<String> dataStreamSource = env.addSource(kafkaSource);// transformation-数据处理转换DataStream<Tuple2<String,Integer>> mapStream = dataStreamSource.map(new MapFunction<String, Tuple2<String,Integer>>() {@Overridepublic Tuple2<String,Integer> map(String word) throws Exception {return Tuple2.of(word,1);}});KeyedStream<Tuple2<String, Integer>, String> keyedStream = mapStream.keyBy(tuple2 -> tuple2.f0);keyedStream.window(TumblingProcessingTimeWindows.of(Time.seconds(5)))// 第一个泛型是输入数据的类型，第二个泛型是返回值类型   第三个是key 的类型， 第四个是窗口对象.apply(new WindowFunction<Tuple2<String, Integer>, String, String, TimeWindow>() {@Overridepublic void apply(String key,  // 分组key    {"俄乌战争",[1,1,1,1,1]}TimeWindow window, // 窗口对象Iterable<Tuple2<String, Integer>> input, // 分组key在窗口的所有数据Collector<String> out  // 用于输出) throws Exception {long start = window.getStart();long end = window.getEnd();// lang3 包下的工具类String startStr = DateFormatUtils.format(start,"yyyy-MM-dd HH:mm:ss");String endStr = DateFormatUtils.format(end,"yyyy-MM-dd HH:mm:ss");int sum = 0;for(Tuple2<String,Integer> tuple2: input){sum += tuple2.f1;}out.collect(key +"," + startStr +","+endStr +",sum="+sum);}}).print();//5. execute-执行env.execute();}
}

当执行kafka接收消息端时，会报如下错误：

错误原因：在对kafka中数据进行KeyBy分组处理时，使用了lambda表达式

解决方法：

在使用KeyBy时，将函数的各种参数类型都写清楚，修改后的代码如下：

package com.bigdata.Day04;import org.apache.commons.lang3.time.DateFormatUtils;
import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.common.serialization.SimpleStringSchema;import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.util.Collector;
import org.apache.kafka.clients.consumer.KafkaConsumer;import java.util.Properties;public class Demo02_kafka收消息 {public static void main(String[] args) throws Exception {//1. env-准备环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC);//2. source-加载数据Properties properties = new Properties();properties.setProperty("bootstrap.servers","bigdata01:9092");properties.setProperty("group.id", "g2");FlinkKafkaConsumer<String> kafkaSource = new FlinkKafkaConsumer<String>("topic1",new SimpleStringSchema(),properties);DataStreamSource<String> dataStreamSource = env.addSource(kafkaSource);// transformation-数据处理转换DataStream<Tuple2<String,Integer>> mapStream = dataStreamSource.map(new MapFunction<String, Tuple2<String,Integer>>() {@Overridepublic Tuple2<String,Integer> map(String word) throws Exception {return Tuple2.of(word,1);}});KeyedStream<Tuple2<String, Integer>, String> keyedStream = mapStream.keyBy(new KeySelector<Tuple2<String, Integer>, String>() {@Overridepublic String getKey(Tuple2<String, Integer> tuple2) throws Exception {return tuple2.f0;}});keyedStream.window(TumblingProcessingTimeWindows.of(Time.seconds(5)))// 第一个泛型是输入数据的类型，第二个泛型是返回值类型   第三个是key 的类型， 第四个是窗口对象.apply(new WindowFunction<Tuple2<String, Integer>, String, String, TimeWindow>() {@Overridepublic void apply(String key,  // 分组key    {"俄乌战争",[1,1,1,1,1]}TimeWindow window, // 窗口对象Iterable<Tuple2<String, Integer>> input, // 分组key在窗口的所有数据Collector<String> out  // 用于输出) throws Exception {long start = window.getStart();long end = window.getEnd();// lang3 包下的工具类String startStr = DateFormatUtils.format(start,"yyyy-MM-dd HH:mm:ss");String endStr = DateFormatUtils.format(end,"yyyy-MM-dd HH:mm:ss");int sum = 0;for(Tuple2<String,Integer> tuple2: input){sum += tuple2.f1;}out.collect(key +"," + startStr +","+endStr +",sum="+sum);}}).print();//5. execute-执行env.execute();}
}

Flink——进行数据转换时，报：Recovery is suppressed by NoRestartBackoffTimeStrategy

热词统计案例： 用flink中的窗口函数（apply）读取kafka中数据，并对热词进行统计。 apply:全量聚合函数，指在窗口触发的时候才会对窗口内的所有数据进行一次计算（等窗口的数据到齐，才开始进行聚合…...

编程日记 2024/11/30 3:14:39

技能之发布自己的依赖到npm上

目录开始解决步骤一： 步骤二： 步骤三： 运用一直以为自己的项目在github上有了（之传了github）就可以进行npm install下载，有没有和我一样萌萌的同学。没事，萌萌乎乎的不犯罪。偶然的机…...

编程日记 2024/11/30 3:10:35

COMSOL工作站：配置指南与性能优化

COMSOL Multiphysics 求解的问题类型相当广泛，提供了仿真单一物理场以及灵活耦合多个物理场的功能，供工程师和科研人员来精确分析各个工程领域的设备、工艺和流程。软件内置的#模型开发器#包含完整的建模工作流程，可实现从几何建模、材料参数…...

编程日记 2024/11/30 3:08:33

Qt导出Excel图表

目的就是利用Qt导出Excel图表,如果直接画Excel 图表，比较麻烦些，代码写得也复杂了；而直接利用Excel模块就简单了，图表在模块当中已经是现成的了，Qt程序只更改数据就可以了，这篇文章就是记录一下利用模块上…...

编程日记 2024/11/30 3:07:32

分布式协同 - 分布式系统的特性与互斥问题

文章目录导图概述分布式系统的特性与挑战分布式互斥算法的目标分布式互斥算法集中互斥算法集中互斥算法示意图集中互斥算法流程基于许可的互斥算法Lamport 算法示意图Lamport 流程令牌环互斥算法令牌环互斥算法示意图 1. 集中互斥算法（Centralized Mutual Exclus…...

编程日记 2024/11/30 3:04:30

windows安装itop

本文介绍 win10 安装 itop 安装WAMP集成环境前先安装visual c 安装itop前需要安装WAMP集成环境(windowsApacheMysqlPHP) 所需文件百度云盘通过网盘分享的文件：itop.zip 链接: https://pan.baidu.com/s/1D5HrKdbyEaYBZ8_IebDQxQ 提取码: m9fh 步骤一&#xff1…...

编程日记 2024/11/30 2:57:23

LAMP环境的部署

一、软件安装介绍在Linux系统中安装软件有rpm安装、yum安装、源码安装等方法，在这里主要给大家介绍 yum 安装，这是一种最简单方便的一种安装方法。 YUM（Yellow dog Upadate Modifie）是改进版的 RPM 管理器，很好地解…...

编程日记 2024/11/30 2:54:20

Go语言压缩文件处理

目录 Go 语言压缩文件处理1. 压缩文件：Zip函数2. 解压文件：UnZip 函数3. 小结 Go 语言压缩文件处理在现代的应用开发中，处理压缩文件（如 .zip 格式）是常见的需求。Go 语言提供了内置的 archive/zip 包来处理 .zip 文…...

编程日记 2024/11/30 2:53:19

rocylinux9.4安装prometheus监控

一.上传软件包具体的软件包如下，其中kubernetes-mixin是下载的监控kubernetes的一些监控规则、dashbaordd等。二.Prometheus配置 1.promethes软件安装 #解压上传后的软件包 [rootlocalhost ] cd /opt [rootlocalhost opt]# tar xf prometheus-2.35.3.linux-amd…...

编程日记 2024/11/30 2:51:17

屏幕分辨率|尺寸|颜色深度指纹

一、前端通过window.screen接口获取屏幕分辨率尺寸颜色深度，横屏竖屏信息。二、window.screen c接口实现： 1、third_party\blink\renderer\core\frame\screen.idl // https://drafts.csswg.org/cssom-view/#the-screen-interface[ExposedWindow ] …...

编程日记 2024/11/30 2:50:16

docker-elasticsearch-kibana-logstash

一、安装 Elasticsearch 尝试直接拉取 Elasticsearch 镜像： 执行 docker pull docker.elastic.co/elasticsearch/elasticsearch，拉取失败，错误提示为 “Error response from daemon: manifest for docker.elastic.co/elasticsearch/elasticse…...

编程日记 2024/11/30 2:49:11

C#设计模式——抽象工厂模式（重点）

文章目录项目地址一、抽象工厂模式1.1 特性1.2 使用反射获取特性标记的类1.3 完整代码项目地址教程作者：教程地址： 代码仓库地址： 所用到的框架和插件： dbt airflow一、抽象工厂模式工厂方法模式依然存在一个问题就是&…...

编程日记 2024/11/30 2:44:05

全新AI模型家族登场：完全可复现的开源语言模型OLMo 2

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…...

编程日记 2024/11/30 2:41:00

用Matlab和SIMULINK实现DPCM仿真和双边带调幅系统仿真

1、使用SIMULINK或Matlab实现DPCM仿真 1.1 DPCM原理差分脉冲编码调制，简称DPCM，主要用于将模拟信号转换为数字信号，同时减少数据的冗余度以实现数据压缩。在DPCM中，信号的每个抽样值不是独立编码的，而是通过预测前一…...

编程日记 2024/11/30 2:39:59

RabbitMQ的交换机总结

1.direct交换机 2.fanout交换机...

编程日记 2024/11/30 2:36:56

Android so库的编译

在没弄明白so库编译的关系前，直接看网上博主的博文，常常会觉得云里雾里的，为什么一会儿通过Android工程cmake编译，一会儿又通过NDK命令去编译。两者编译的so库有什么区别？ android版第三方库编译总体思路：对于新手小白来说搞明白上面的总体思路图很有必…...

编程日记 2024/11/30 2:34:54

2024年底-Arch linux或转为0BSD许可证！

原文：https://archlinux.org/news/providing-a-license-for-package-sources/ 解读：Arch Linux社区通过RFC 40达成共识，决定将所有软件包源代码更改为0BSD许可证。 0BSD许可证是什么？：这是一个非常自由的开源许可证&a…...

编程日记 2024/11/30 2:32:52

深入解析音视频流媒体SIP协议交互过程

一、引言在音视频流媒体传输过程中，SIP（Session Initiation Protocol）协议发挥着举足轻重的作用。本文将详细全面地介绍音视频流媒体传输中的SIP协议，包括其基本概念、交互过程、关键信令以及应用场景二、SIP协议基本概念 1.…...

编程日记 2024/11/30 2:29:48

linux安装mysql8.0.40

一、下载MySQL安装包 1.查看glibc版本 rpm -qa | grep glibc 2.到mysql官网下载安装包二、解压安装 1.上传压缩包纸/usr/local 目录下，解压： tar -xvf mysql-8.0.40-linux-glibc2.17-x86_64.tar.xz 2.重命名： mv mysql-8.0.40-linux-…...

编程日记 2024/11/30 2:28:47

Java基础之控制语句：开启编程逻辑之门

一、Java控制语句概述 Java 中的控制语句主要分为选择结构、循环结构和跳转语句三大类，它们在程序中起着至关重要的作用，能够决定程序的执行流程。选择结构用于根据不同的条件执行不同的代码路径，主要包括 if 语句和 switch 语句。if 语句有…...

编程日记 2024/11/30 2:25:45

Python｜GIF 解析与构建（5）：手搓截屏和帧率控制

目录 Python｜GIF 解析与构建（5）：手搓截屏和帧率控制一、引言二、技术实现：手搓截屏模块 2.1 核心原理 2.2 代码解析：ScreenshotData类 2.2.1 截图函数：capture_screen 三、技术实现&…...

编程新知 2025/11/14 3:06:30

MPNet：旋转机械轻量化故障诊断模型详解python代码复现

目录一、问题背景与挑战二、MPNet核心架构 2.1 多分支特征融合模块（MBFM） 2.2 残差注意力金字塔模块（RAPM） 2.2.1 空间金字塔注意力（SPA） 2.2.2 金字塔残差块（PRBlock） 2.3 分类器设计三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

编程新知 2025/12/4 2:16:34

从WWDC看苹果产品发展的规律

WWDC 是苹果公司一年一度面向全球开发者的盛会，其主题演讲展现了苹果在产品设计、技术路线、用户体验和生态系统构建上的核心理念与演进脉络。我们借助 ChatGPT Deep Research 工具，对过去十年 WWDC 主题演讲内容进行了系统化分析，形成了这份…...

编程新知 2025/12/2 15:57:59

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2025/12/2 10:02:32

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现，这取决于你是想在组件内部直接设置，还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法： 1. 内联样式你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

编程新知 2025/10/6 20:49:11

Neo4j 集群管理：原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档，本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石，用于构建高可用、可扩展且一致的图数据库服务…...

编程新知 2025/7/4 0:49:28

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2025/12/1 13:20:45

CMake 从 GitHub 下载第三方库并使用

有时我们希望直接使用 GitHub 上的开源库，而不想手动下载、编译和安装。可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码我们将以 fmt 这个流行的格式化库为例，演示如何：使用 FetchContent 从 GitH…...

编程新知 2025/12/2 11:33:33

Go 并发编程基础：通道（Channel）的使用

在 Go 中，Channel 是 Goroutine 之间通信的核心机制。它提供了一个线程安全的通信方式，用于在多个 Goroutine 之间传递数据，从而实现高效的并发编程。本章将介绍 Channel 的基本概念、用法、缓冲、关闭机制以及 select 的使用。一、Channel…...

编程新知 2025/12/4 8:54:35

相关文章：