当前位置：首页 > news >正文

Spring Cloud Stream实现数据流处理

news 2026/2/10 12:37:27

1.什么是Spring Cloud Stream？

Spring Cloud Stream的核心是Stream，准确来讲Spring Cloud Stream提供了一整套数据流走向（流向）的API，它的最终目的是使我们不关心数据的流入和写出，而只关心对数据的业务处理我们举一个例子：你们公司有一套系统，这套系统由多个模块组成，你负责其中一个模块。数据会从第一个模块流入，处理完后再交给下一个模块。对于你负责的这个模块来说，它的功能就是接收上一个模块处理完成的数据，自己再加工加工，扔给下一个模块。
在这里插入图片描述
我们很容易总结出每个模块的流程：

1、从上一个模块拉取数据
2、处理数据
3、将处理完成的数据发给下一个模块

其中流程1和3代表两个模块间的数据交互，这种数据交互往往会采用一些中间件（middleware）。比如模块1和模块2间数据可能使用的是kafka，模块1向kafka中push数据，模块2向kafka中poll数据。而模块2和模块3可能使用的是rabbitMQ。很明显，它们的功能都是一样的：提供数据的流向，让数据可以流入自己同时又可以从自己流出发给别人。但由于中间件的不同，需要使用不同的API。为了消除这种数据流入（输入）和数据流出（输出）实现上的差异性，因此便出现了Spring Cloud Stream。

2.环境准备

采用docker-compose搭建kafaka环境

version: '3'networks:kafka:ipam:driver: defaultconfig:- subnet: "172.22.6.0/24"services:zookepper:image: /zookeeper:latestcontainer_name: zookeeper-serverrestart: unless-stoppedvolumes:- "/etc/localtime:/etc/localtime"environment:ALLOW_ANONYMOUS_LOGIN: yesports:- "2181:2181"networks:kafka:ipv4_address: 172.22.6.11kafka:image: /kafka:3.4.1container_name: kafkarestart: unless-stoppedvolumes:- "/etc/localtime:/etc/localtime"environment:ALLOW_PLAINTEXT_LISTENER: yesKAFKA_CFG_ZOOKEEPER_CONNECT: zookepper:2181KAFKA_CFG_ADVERTISED_LISTENERS: PLAINTEXT://10.11.68.77:9092ports:- "9092:9092"depends_on:- zookeppernetworks:kafka:ipv4_address: 172.22.6.12kafka-map:image: /kafka-mapcontainer_name: kafka-maprestart: unless-stoppedvolumes:- "./kafka/kafka-map/data:/usr/local/kafka-map/data"environment:DEFAULT_USERNAME: adminDEFAULT_PASSWORD: 123456ports:- "9080:8080"depends_on:                         - kafkanetworks:kafka:ipv4_address: 172.22.6.13

run

docker-compose -f docker-compose-kafka.yml -p kafka up -d

3.代码工程

实验目标

1、生成UUID并将其发送到Kafka主题batch-in。
2、从batch-in主题接收UUID的批量消息，移除其中的数字，并将结果发送到batch-out主题。
3、监听batch-out主题并打印接收到的消息。

pom.xml
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"><parent><artifactId>springcloud-demo</artifactId><groupId>com.et</groupId><version>1.0-SNAPSHOT</version></parent><modelVersion>4.0.0</modelVersion><artifactId>spring-cloud-stream-kafaka</artifactId><properties><maven.compiler.source>17</maven.compiler.source><maven.compiler.target>17</maven.compiler.target></properties><dependencies><!-- Spring Boot Starter Web --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><!-- Spring Boot Starter Test --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId><scope>test</scope></dependency><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-stream-kafka</artifactId></dependency><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter</artifactId></dependency><dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId></dependency></dependencies></project>

处理流

package com.et;import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.context.annotation.Bean;
import org.springframework.kafka.annotation.KafkaListener;
import org.springframework.messaging.Message;
import org.springframework.messaging.support.MessageBuilder;import java.util.List;
import java.util.UUID;
import java.util.function.Function;
import java.util.function.Supplier;@SpringBootApplication
public class CloudStreamsFunctionBatch {public static void main(String[] args) {SpringApplication.run(CloudStreamsFunctionBatch.class, args);}@Beanpublic Supplier<UUID> stringSupplier() {return () -> {var uuid = UUID.randomUUID();System.out.println(uuid + " -> batch-in");return uuid;};}@Beanpublic Function<List<UUID>, List<Message<String>>> digitRemovingConsumer() {return idBatch -> {System.out.println("Removed digits from batch of " + idBatch.size());return idBatch.stream().map(UUID::toString)// Remove all digits from the UUID.map(uuid -> uuid.replaceAll("\\d","")).map(noDigitString -> MessageBuilder.withPayload(noDigitString).build()).toList();};}@KafkaListener(id = "batch-out", topics = "batch-out")public void listen(String in) {System.out.println("batch-out -> " + in);}}

定义一个名为stringSupplier的Bean，它实现了Supplier接口。这个方法生成一个随机的UUID，并打印到控制台，表示这个UUID将被发送到batch-in主题。
定义一个名为digitRemovingConsumer的Bean，它实现了Function<List, List<Message>>接口。这个方法接受一个UUID的列表，打印出处理的UUID数量，然后将每个UUID转换为字符串，移除其中的所有数字，最后将结果封装为消息并返回。
使用@KafkaListener注解定义一个Kafka监听器，监听batch-out主题。当接收到消息时，调用listen方法并打印接收到的消息内容。

配置文件

spring:cloud:function:definition: stringSupplier;digitRemovingConsumerstream:bindings:stringSupplier-out-0:destination: batch-indigitRemovingConsumer-in-0:destination: batch-ingroup: batch-inconsumer:batch-mode: truedigitRemovingConsumer-out-0:destination: batch-outkafka:binder:brokers: localhost:9092bindings:digitRemovingConsumer-in-0:consumer:configuration:# Forces consumer to wait 5 seconds before polling for messagesfetch.max.wait.ms: 5000fetch.min.bytes: 1000000000max.poll.records: 10000000

参数解释
1、spring.cloud.function.definition：定义了两个函数，stringSupplier和digitRemovingConsumer。这两个函数将在应用程序中被使用。

spring:cloud:function:definition: stringSupplier;digitRemovingCon

2、stream.bindings.stringSupplier-out-0.destination：将stringSupplier函数的输出绑定到Kafka主题batch-in。

stream:bindings:stringSupplier-out-0:destination: batch-in

3、stream.bindings.digitRemovingConsumer-in-0.destination：将digitRemovingConsumer函数的输入绑定到Kafka主题batch-in。

digitRemovingConsumer-in-0:destination: batch-ingroup: batch-inconsumer:batch-mode: true

4、group: batch-in：指定消费者组为batch-in，这意味着多个实例可以共享这个组来处理消息。

5、consumer.batch-mode: true：启用批处理模式，允许消费者一次处理多条消息。

6、stream.bindings.digitRemovingConsumer-out-0.destination：将digitRemovingConsumer函数的输出绑定到Kafka主题batch-out。

digitRemovingConsumer-out-0:destination: batch-out

4.测试

启动弄Spring Boot应用，可以看到控制台输出日志如下：

291ea6cc-1e5e-4dfb-92b6-5d5ea43d4277 -> batch-in
c746ba4e-835e-4f66-91c5-7a5cf8b01068 -> batch-in
a661145b-2dd9-4927-8806-919ad258ade5 -> batch-in
db150918-0f0b-49f6-b7bb-77b0f580de4c -> batch-in
b0d4917b-6777-4d96-a6d0-bb96715b5b20 -> batch-in
Removed digits from batch of 5
batch-out -> eacc-ee-dfb-b-dead
batch-out -> cbae-e-f-c-acfb
batch-out -> ab-dd—adade
batch-out -> db-fb-f-bbb-bfdec
batch-out -> bdb–d-ad-bbbb

Spring Cloud Stream实现数据流处理

1.什么是Spring Cloud Stream？

2.环境准备

3.代码工程

4.测试

相关文章：

Spring Cloud Stream实现数据流处理

列表上移下移功能实现

升级智享 AI 直播三代：领航原生直播驶向自动化运营新航道

Llmcad: Fast and scalable on-device large language model inference

Hbase2.2.7集群部署

【青牛科技】D1671 75Ω 带4级低通滤波的单通道视频放大电路芯片介绍

[NeurIPS 2022] Leveraging Inter-Layer Dependency for Post-Training Quantization

ubuntu+ROS推视频流至网络

PHP 去掉特殊不可见字符 “\u200e“

深度学习—BP算法梯度下降及优化方法Day37

elasticsearch8.16 docker-compose 多机器集群安装

Flink--API 之 Source 使用解析

uniapp在小程序连接webScoket实现余额支付

Spring Boot【三】

R 因子

【博主推荐】C# Winform 拼图小游戏源码详解（附源码）

深入解析 MySQL 启动方式：`systemctl` 与 `mysqld` 的对比与应用

【python】windows pip 安装 module 提示 Microsoft Visual C++ 14.0 is required 处理方法

python爬虫案例——猫眼电影数据抓取之字体解密，多套字体文件解密方法（20）

go sync.WaitGroup

＜6＞-MySQL表的增删查改

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

《用户共鸣指数（E）驱动品牌大模型种草：如何抢占大模型搜索结果情感高地》

cf2117E

【配置 YOLOX 用于按目录分类的图片数据集】

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

Python如何给视频添加音频和字幕

rnn判断string中第一次出现a的下标

C++.OpenGL （14/64）多光源（Multiple Lights）

处理vxe-table 表尾数据是单独一个接口，表格tableData数据更新后，需要点击两下，表尾才是正确的