当前位置: 首页 > news >正文

flink:自定义数据分区

shuffle随机地将数据分配到下游的子任务。
rebalance用round robbin模式将数据分配到下游的子任务。
global把所有的数据都分配到一个分区。
partitionCustom: 自定义数据分区。

package cn.edu.tju.demo;

import org.apache.flink.api.common.functions.;
import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.configuration.Configuration;
import org.apache.flink.streaming.api.collector.selector.OutputSelector;
import org.apache.flink.streaming.api.datastream.
;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.co.CoMapFunction;
import org.apache.flink.streaming.api.functions.source.SourceFunction;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.apache.flink.util.Collector;
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.common.serialization.StringDeserializer;
import org.apache.kafka.common.serialization.StringSerializer;

import java.util.*;

public class Test12 {
public static void main(String[] args) throws Exception {
StreamExecutionEnvironment environment = StreamExecutionEnvironment
.getExecutionEnvironment();

    DataStreamSource<String> mySource = environment.addSource(new MySourceFunction());SingleOutputStreamOperator<Tuple2<String, Integer>> mapStream = mySource.map(new MapFunction<String, Tuple2<String, Integer>>() {@Overridepublic Tuple2<String, Integer> map(String value) throws Exception {return new Tuple2<>(value, new Random().nextInt(10));}});DataStream<Tuple2<String, Integer>> resultStream = mapStream.partitionCustom(new MyPartitioner(), 1);resultStream.print();environment.execute("my job");}public static class MyPartitioner implements Partitioner<Integer>{@Overridepublic int partition(Integer key, int partitions) {return key % partitions;}
}public static class MySourceFunction implements SourceFunction<String> {private boolean runningFlag = true;@Overridepublic void run(SourceContext<String> ctx) throws Exception {while (runningFlag){ctx.collect("hi world");ctx.collect("hello world");Thread.sleep(30000);}}@Overridepublic void cancel() {runningFlag = false;}
}

}

相关文章:

flink:自定义数据分区

shuffle随机地将数据分配到下游的子任务。 rebalance用round robbin模式将数据分配到下游的子任务。 global把所有的数据都分配到一个分区。 partitionCustom: 自定义数据分区。 package cn.edu.tju.demo; import org.apache.flink.api.common.functions.; import org.apache…...

力扣图论篇

以下思路来自代码随想录以及官方题解。 文章目录 797.所有可能的路径200.岛屿数量130.被围绕的区域1020.飞地的数量 797.所有可能的路径 给你一个有 n 个节点的 有向无环图&#xff08;DAG&#xff09;&#xff0c;请你找出所有从节点 0 到节点 n-1 的路径并输出&#xff08;不…...

图腾柱PFC工作原理:一张图

视屏链接&#xff1a; PFC工作原理...

MongoDB开启事务

MongoDB开启事务 配置单节点。到路径C:\Program Files\MongoDB\Server\4.0\bin 使用记事本以管理员权限打开文件mongod.cfg添加如下配置&#xff1a; replication:replSetName: rs02. 重启MongoDB服务 3. 重启后执行命令 rs.initiate()...

风车IM即时通讯系统APP源码DJ2403版完整苹果安卓教程

关于风车IM&#xff0c;你在互联网上能随便下载到了基本都是残缺品&#xff0c; 经过我们不懈努力最终提供性价比最高&#xff0c;最完美的版本&#xff0c; 懂货的朋友可以直接下载该版本使用&#xff0c;经过严格测试&#xff0c;该版本基本完美无缺。 1.宝塔环境如下: Ngin…...

新增流计算计数窗口,TDengine 3.2.3.0 八大板块功能更新

自发布以来&#xff0c;TDengine 3.0 版本在研发人员和社区用户的共同努力下不断优化&#xff0c;产品的稳定性和易用性获得了大幅提升&#xff0c;在知轮科技的智慧轮胎系统、黑格智能 3D 打印业务、韵达快递业务、中国地震台网中心、中移物联智慧出行场景等众多企业项目中获得…...

【架构笔记3】做“用心”之人

凡事就怕“用心”二字&#xff0c;但是用心做事&#xff0c;其实如果没有前提和详情&#xff0c;这本就是一句正确的废话&#xff0c;在一些项目开发和落地过程中&#xff0c;我也有了一些新的体会&#xff0c;自认为不是多余。 我觉得心这个词至少包含四个含义&#xff1a;“…...

前端加密面面观:常见场景与方法解析

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…...

突破编程_前端_JS编程实例(目录导航)

1 开发目标 目录导航组件旨在提供一个滚动目录导航功能&#xff0c;使得用户可以方便地通过点击目录条目快速定位到对应的内容标题位置&#xff0c;同时也能够随着滚动条的移动动态显示当前位置在目录中的位置&#xff1a; 2 详细需求 2.1 标题提取与目录生成 组件需要能够自…...

扩展学习|系统理解数字经济

文献来源&#xff1a;[1]肖静华,胡杨颂,吴瑶.成长品&#xff1a;数据驱动的企业与用户互动创新案例研究[J].管理世界,2020,36(03):183-205.DOI:10.19744/j.cnki.11-1235/f.2020.0041. [2]陈晓红,李杨扬,宋丽洁等.数字经济理论体系与研究展望[J].管理世界,2022,38(02):208-22413…...

前端学习之列表标签

目录 有序列表 结果 无序标签 结果 数据标签 结果 有序列表 &#xff08;注&#xff1a;注释是解释&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Document</title> </…...

华为OD面试分享14(2024年)

双非本,机试400分,部门流程与IT,base西安 分享面经攒人品 10.27 一面 深挖项目,面试官很友好,根据项目的每个技术点和场景来提问,比如项目中数据库数据量级有多大,什么时候会出现缓慢,如何解决的,有没有经过压力测试,经过优化后性能怎么样,项目中用到的Kafka和redis…...

安全测试报告-模板内容

1. 概述 为检验XXXX平台 系统的安全性&#xff0c;于 XXXX年 XX 月 XX 日至 XXXX年 XX 月 XX日对目标系统进行了安全测试。在此期间测试人员将使用各 种非破坏性质的攻击手段&#xff0c;对目标系统做深入的探测分析&#xff0c;进而挖掘系统中的安 全漏洞和风险隐患。研发团队…...

FreeRTOS学习笔记-基于stm32(3)中断管理

一、什么是中断 通俗点讲就是让CPU停止当前在做的事&#xff0c;转而去做更紧急的事。 二、中断优先级分组 这个紧急的事也有一个等级之分&#xff0c;优先级越高越先执行。stm32使用中断优先配置寄存器的高4位&#xff0c;共16级的中断优先等级。 stm32的中断优先等级可以分为…...

android pdf框架-6,文本生成pdf

前文介绍如何使用图片生成pdf,这里介绍如何使用文本生成pdf 使用mupdf生成 mupdf生成的pdf略大,字体可以自定义. 生成的代码不复杂,也有好几种,以story的方式生成为例 fun createPdfFromText(sourcePath: String, destPath: String): Boolean {val text EncodingDetect.rea…...

关于springboot一个接口请求后,主动取消后,后端是否还在跑

1、最近在思考一个问题&#xff0c;如果一个springboot的请求的接口比较耗时&#xff0c;中途中断该请求后&#xff0c;则后端服务是否会终止该线程的处理&#xff0c;于是写了一个demo RequestMapping(value "/test", method RequestMethod.GET)public BasicResul…...

理解自相关图AC和偏自相关图PAC Plots

when we talk about the time-series data, many factors affect the time series, but the only thing that affects the lagged version of the variable is the time series data itself. by Yugesh Verma 时序数据按照时间点的先后顺序进行排列,变化是在邻近的时间段之间发…...

.NetCore6.0实现ActionFilter过滤器记录接口请求日志

文章目录 目的实现案例&#xff1a;一.首先我们新建一个WebApi项目二.配置 appsettings.json 文件&#xff0c;配置日志存放路径三.创建 Model 文件夹&#xff0c;创建AppConfig类和ErrorLog类1.在AppConfig类中编写一个GetConfigInfo方法获取配置文件中的值2.在ErrorLog类中&a…...

代码详解:2024美团春招实习笔试第一场0309,是难还是简单?

前言: 1.第一题&#xff08;模拟&#xff09; 2.第二题&#xff08;模拟&#xff09; 3.第三题&#xff08;二维前缀和&#xff09; 4.第四题的思维&#xff08;双指针&#xff09; 5.第五题难度比较大&#xff08;并查集删边离散化&#xff09; 一.小美的MT MT 是美团的…...

平衡二叉树

前言 在关键字排列随机的情况下&#xff0c;二叉排序树的平均查找长度和 l o g n log n logn是等数量级的。在某些情况下&#xff0c;尚需在构成二叉排序树的过程中进行“平衡化”处理&#xff0c;使其成为平衡二叉树。 如果任何初始化序列构成的二叉排序树都是平衡二叉树&…...

一条命令搞定OpenClaw部署?先看清PPClaw的真实代价

先说结论PPClaw的核心价值在于将OpenClaw的部署从本地环境配置转为云端托管&#xff0c;用API Key和命令行替代了服务器运维。它确实降低了初始部署门槛&#xff0c;但引入了新的依赖&#xff1a;PPIO平台、API Key计费模型和网络稳定性。更适合小团队快速验证或原型开发&#…...

运动声源的到达结构仿真

概要 运动声源的到达结构仿真中&#xff0c;由于声传播速度远高于声源运动速度&#xff0c;而且声源辐射出声波后&#xff0c;介质的振子传递声波几乎不受声源影响&#xff0c;因此可以将根据每个时间帧的声源位置&#xff0c;使用bellhop计算到达结构&#xff0c;数字离散采样…...

Qwen3.5-4B-Claude-Opus-GGUF开发者案例:Python异常堆栈解读与调试路径推荐

Qwen3.5-4B-Claude-Opus-GGUF开发者案例&#xff1a;Python异常堆栈解读与调试路径推荐 1. 模型能力概述 Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF是一个专注于代码分析与逻辑推理的轻量级AI模型。作为Qwen3.5-4B的推理蒸馏版本&#xff0c;它特别强化了以下能力…...

别再手动拼接Prompt了!用ChatML结构化你的大模型对话(以Llama 2/3为例)

别再手动拼接Prompt了&#xff01;用ChatML结构化你的大模型对话&#xff08;以Llama 2/3为例&#xff09; 当你在深夜调试代码时&#xff0c;是否曾被这样的场景折磨&#xff1a;为了构造一个多轮对话的prompt&#xff0c;不得不反复拼接user:、assistant:等字符串&#xff0c…...

宝塔面板如何实现网站重定向_配置301永久跳转与域名更换

宝塔面板中301重定向在网站设置页的「重定向」选项卡配置&#xff0c;需勾选“301永久重定向”&#xff0c;源目录填/实现整站跳转&#xff1b;路径映射复杂时须手动编辑Nginx配置文件添加rewrite规则并加permanent标志。宝塔面板里 301 重定向在哪配就在网站设置页的「重定向」…...

保姆级教程:用ncnn和Android Studio把YOLOv11模型部署到手机上(附完整代码)

从零实现YOLOv11模型在Android端的全流程部署实战 最近在开发一个工业质检应用时&#xff0c;需要将训练好的YOLOv11模型部署到Android设备上。作为移动端AI部署的新手&#xff0c;我花了两周时间才走通整个流程。现在把完整的踩坑经验和优化技巧整理成这份保姆级教程&#xf…...

大数据入门:Hadoop Spark 简介

大数据入门&#xff1a;Hadoop & Spark 简介 在数字化时代&#xff0c;数据已成为驱动决策的核心资源。如何高效处理海量数据&#xff1f;Hadoop与Spark作为两大主流框架&#xff0c;为大数据分析提供了强大支持。本文将从基础概念、核心优势、应用场景三方面&#xff0c;…...

零基础转行大模型选哪个岗位方向最易上手区别

零基础转行大模型选哪个岗位方向最易上手区别 标签&#xff1a;#人工智能、#深度学习、#自然语言处理、#神经网络、#机器学习、#计算机视觉、#ai ### 先打破一个误区&#xff1a;大模型≠只有算法岗&#xff0c;普通人也能进### 大模型岗位&#xff1a;哪些对数学/代码要求最低…...

VSCode Cortex-M 调试进阶:从基础断点到国产芯片适配

1. VSCode Cortex-M调试环境搭建 对于嵌入式开发者来说&#xff0c;VSCode已经成为一个不可或缺的开发工具。相比传统的Keil、IAR等IDE&#xff0c;VSCode凭借其轻量级、可扩展性强等优势&#xff0c;正在被越来越多的工程师采用。特别是在国产芯片开发领域&#xff0c;VSCode的…...

REX-UniNLU与Dify平台集成实战

REX-UniNLU与Dify平台集成实战 1. 场景价值&#xff1a;为什么需要这样的集成 在日常的AI应用开发中&#xff0c;我们经常遇到这样的困境&#xff1a;有一个很强大的自然语言理解模型&#xff0c;但要把它变成实际可用的服务&#xff0c;需要处理一大堆部署、接口、前后端联调…...