当前位置：首页 > news >正文

Flink Flink中的分流

news 2026/4/21 17:26:22

一、什么是分流

所谓“分流”，就是将一条数据流拆分成完全独立的两条、甚至多条流。也就是基于一个DataStream，定义一些筛选条件，将符合条件的数据拣选出来放到对应的流里。
在这里插入图片描述

二、基于filter算子的简单实现分流

其实根据条件筛选数据的需求，本身非常容易实现：只要针对同一条流多次独立调用.filter()方法进行筛选，就可以得到拆分之后的流了。
案例需求：读取一个整数数字流，将数据流划分为奇数流和偶数流。

package com.flink.DataStream.SplitStream;import org.apache.flink.api.common.functions.FilterFunction;
import org.apache.flink.configuration.Configuration;
import org.apache.flink.configuration.RestOptions;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;public class FlinkSplitStreamByFilter {public static void main(String[] args) throws Exception {//TODO 创建Flink上下文执行环境StreamExecutionEnvironment streamExecutionEnvironment = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(new Configuration().set(RestOptions.BIND_PORT, "8081"));//.getExecutionEnvironment();//TODO 设置全局并行度为2streamExecutionEnvironment.setParallelism(2);DataStreamSource<String> dataStreamSource = streamExecutionEnvironment.socketTextStream("localhost", 8888);//TODO 先将输入流转为Integer类型SingleOutputStreamOperator<Integer> mapResult = dataStreamSource.map((input) -> {int i = Integer.parseInt(input);return i;});//TODO 使用匿名函数分流偶数流SingleOutputStreamOperator<Integer> ds1 = mapResult.filter(new FilterFunction<Integer>() {@Overridepublic boolean filter(Integer a) throws Exception {return a % 2 == 0;}});//TODO 使用lamda表达式分流奇数流SingleOutputStreamOperator<Integer> ds2 = mapResult.filter((a) -> a % 2 == 1);ds1.print("偶数流");ds2.print("奇数流");streamExecutionEnvironment.execute();}
}

执行结果

奇数流:1> 1
偶数流:2> 2
偶数流:1> 2
偶数流:2> 4
奇数流:1> 3
奇数流:2> 1Process finished with exit code 130 (interrupted by signal 2: SIGINT)

这种实现非常简单，但代码显得有些冗余——我们的处理逻辑对拆分出的三条流其实是一样的，却重复写了三次。而且这段代码背后的含义，是将原始数据流 stream 复制三份，然后对每一份分别做筛选；这明显是不够高效的。我们自然想到，能不能不用复制流，直接用一个算子就把它们都拆分开呢？

三、使用测输出流

关于处理函数中侧输出流的用法，我们已经在 7.5 节做了详细介绍。简单来说，只需要调用上下文 ctx 的.output()方法，就可以输出任意类型的数据了。而侧输出流的标记和提取，都离不开一个“输出标签”（OutputTag），指定了侧输出流的 id 和类型。

Flink Flink中的分流

一、什么是分流

二、基于filter算子的简单实现分流

三、使用测输出流

相关文章：

Flink Flink中的分流

传输层协议[精选]

LeetCode算法题解|474. 一和零

一种太阳能风能市电互补路灯方案介绍

世微 dc-dc降压恒流 LED汽车大灯单灯 14V5A 68W车灯驱动方案 AP5191

基于时隙的多重冗余流指纹模型

Visual Studio 2019 C# System.BadImageFormatException 解决方法

深度学习之基于YoloV5车辆和行人目标检测系统

Django框架之中间件

BTC 复兴：Ordinals 带来创新活力，BitVM 与 BitStream 相继问世

STM32 CAN协议讲解以及代码

京东数据分析（京东大数据）：2023年10月京东手机行业品牌销售排行榜

计算机毕业设计基于Hadoop的物品租赁系统的设计与实现 Java实战项目附源码+文档+视频讲解

pop链反序列化 [MRCTF2020]Ezpop1

yolov5从英伟达平台移植到华为昇腾开发板上的思路

网络运维与网络安全学习笔记2023.11.25

Trustzone/TEE/安全面试100问

【数据结构】D : 图的顶点可达闭包

链表？细！详细知识点总结！

【数据结构实验】排序（三）快速排序算法的改进（三者取中法）

避开Fluent计算崩溃：用这3种网格划分策略彻底解决floating error问题

嵌入式系统动态控制模型架构与实现解析

告别FPS采样慢！用RandLA-Net的随机采样高效处理大规模点云（附S3DIS数据集实战）

从QNX到Android Auto：车载Camera软件栈全解析，高通8155平台上的IFE、BPS、IPE都干了啥？

告别Windows！在Ubuntu 22.04上搞定NI-VISA驱动，用C++控制你的USB示波器

Qwen2.5-VL-7B-Instruct在智能导航系统中的应用：牢记回家路

3个思维转变：让Fiji图像处理软件启动速度提升500%的颠覆性方法

Windows Cleaner终极指南：5分钟解决C盘爆红问题，快速释放空间提升电脑性能

Windows Cleaner深度解析：彻底解决C盘爆红问题的开源利器

番茄小说下载器：终极离线阅读解决方案，随时随地畅享小说世界