当前位置：首页 > news >正文

基于Java多线程处理数据

news 2026/4/6 4:34:11

基于Java多线程处理数据

背景
代码实现

背景

在日常工作中，有一个同步企微客户-学员关系接口的定时任务在执行中随着数据量的不断增长，定时任务的执行结束时间也出现了当天执行不完的情况，影响到了正常业务的运行。基于这种情况，在对该定时任务的业务逻辑代码分析验证后得出是调用企微客户-学员关系接口时耗时引起的，但是查阅企微接口文档，又不支持批量调用，只能逐个调用。那么这种情况下既然批量调用接口不支持，那么可以采用多线程并发调用的方式来降低定时任务整体的执行时间，于是就需要用到线程池来进行多线程操作。

代码实现

在这里我将会使用spring自带的线程池类 ThreadPoolTaskExecutor 来进行处理， ThreadPoolTaskExecutor 是对 ThreadPoolExecutor 进行了封装处理，源代码中可以看到
在这里插入图片描述
而线程池类ThreadPoolExecutor 是JDK的线程池类，继承 AbstractExecutorService ，
public class ThreadPoolExecutor extends AbstractExecutorService {
AbstractExecutorService 实现 ExecutorService，
public abstract class AbstractExecutorService implements ExecutorService {
ExecutorService 继承 Executor
public interface ExecutorService extends Executor {
下面开始初始化线程池类 ThreadPoolTaskExecutor，配置类 ThreadPoolConfig 代码如下

/*** 线程池配置***/@Configurationpublic class ThreadPoolConfig{// 核心线程池大小private int corePoolSize = 50;// 最大可创建的线程数private int maxPoolSize = 200;// 队列最大长度private int queueCapacity = 1000;// 线程池维护线程所允许的空闲时间private int keepAliveSeconds = 300;@Bean(name = "threadPoolTaskExecutor")public ThreadPoolTaskExecutor threadPoolTaskExecutor(){ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();executor.setMaxPoolSize(maxPoolSize);executor.setCorePoolSize(corePoolSize);executor.setQueueCapacity(queueCapacity);executor.setKeepAliveSeconds(keepAliveSeconds);// 线程池对拒绝任务(无线程可用)的处理策略executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());return executor;}}

补充同步企微客户-学员关系定时任务 SyncWechatWorkCustomerLinkDetailHandler 代码如下

@Component@JobHandler("syncWechatWorkCustomerLinkDetailHandler")public class SyncWechatWorkCustomerLinkDetailHandler extends IJobHandler {@Autowiredprivate IWechatCustomerLinkDetailService wechatCustomerLinkDetailService;@Overridepublic ReturnT<String> execute(String params) throws Exception {wechatCustomerLinkDetailService.syncWechatWorkCustomerLinkDetail(params);return ReturnT.SUCCESS;}}

业务处理实现类 syncWechatWorkCustomerLinkDetail 代码如下

    @Overridepublic void syncWechatWorkCustomerLinkDetail(String params) {XxlJobLogger.log("补充任务开始执行...[{}]",params);//查询条件对象WechatCustomerLinkDetail searchparam = new WechatCustomerLinkDetail();if (StringUtils.isNotEmpty(params)) {Long[] ids = Convert.toLongArray(params);//根据ids查询数据searchparam.setLinkIds(ids);}// 分页查询企微获客助手客户链接int pageNo = 0;int pageSize = 200;while(true){pageNo++;XxlJobLogger.log("第【{}】页数据开始补充...",pageNo);PageHelper.startPage(pageNo, pageSize);PageHelper.orderBy("id asc");List<WechatCustomerLinkDetail> list = wechatCustomerLinkDetailMapper.selectWechatCustomerLinkDetailList(searchparam);PageHelper.clearPage();if (CollUtil.isEmpty(list) ) {break;}//开始补充数据multiThreadProcessData(list);XxlJobLogger.log("第【{}】页数据补充完成...",pageNo);}}

多线程处理列表中的数据类 multiThreadProcessData 代码如下

    /*** 使用多线程处理列表中的数据* @param list 待处理的微信客户链接详情列表*/public void multiThreadProcessData(List<WechatCustomerLinkDetail> list) {// 将大集合分割为多个小集合，以便多线程处理List<List<WechatCustomerLinkDetail>> partitionData = partitionData(list, 10);// 获取线程池执行器ThreadPoolTaskExecutor executor = SpringUtils.getBean("threadPoolTaskExecutor");// 创建计数器，用于线程同步CountDownLatch latch = new CountDownLatch(partitionData.size());for (List<WechatCustomerLinkDetail> details : partitionData) {// 提交任务给线程池执行，每个任务负责处理一个分割后的列表executor.execute(() -> {try {for (WechatCustomerLinkDetail detail : details) {//打印线程名称//System.out.println("name========"+Thread.currentThread().getName());// 对每个详情进行处理，填充微信用户名称信息  这里就是业务逻辑处理的地方fillWechatUserNameInfo(detail);}} catch (Exception e) {// 捕获异常并打印，避免线程异常中断e.printStackTrace();} finally {// 处理完成后，计数器减一，用于线程同步latch.countDown();}});}// 等待所有任务完成try {latch.await();} catch (InterruptedException e) {// 线程被中断，打印异常信息e.printStackTrace();}}

分割数据列表 partitionData 代码

   /*** 分割数据列表成多个小块。* @param dataList 待分割的数据列表，包含微信客户链接详情。* @param partitionSize 每个分区的大小。* @return 分割后的数据列表，每个元素是一个分区，分区内部保持原有顺序。*/private List<List<WechatCustomerLinkDetail>> partitionData(List<WechatCustomerLinkDetail> dataList, int partitionSize) {List<List<WechatCustomerLinkDetail>> partitions = new ArrayList<>();// 总数据量int size = dataList.size();// 每个分区的实际大小，整除操作保证每个分区大小尽量均匀int batchSize = size / partitionSize;// 遍历分区数量次，为每个分区添加数据for (int i = 0; i < partitionSize; i++) {// 当前分区的起始索引int fromIndex = i * batchSize;// 当前分区的结束索引，如果是最后一个分区，则包含所有剩余数据int toIndex = (i == partitionSize - 1) ? size : fromIndex + batchSize;// 将当前分区的数据添加到分区列表中partitions.add(dataList.subList(fromIndex, toIndex));}return partitions;}

到这里整个基于多线程处理数据的代码就整理完了，代码结构并不复杂，主要是注意数据查询以及服务器最大线程数相关数据，防止线程不够用的情况。

基于Java多线程处理数据

基于Java多线程处理数据

背景

代码实现

相关文章：

基于Java多线程处理数据

日常知识点之遇到问题结构体按位构造协议时和期望不一致，研究记录一下

spring mvc 文件下载

Qt WebEngine基于WebEngineScript注入js脚本

案例分享-国外UI设计界面赏析

用PyTorch 从零开始构建 BitNet 1.58bit

信创安全 | 新一代内网安全方案—零信任沙盒

Redis的回收策略(淘汰策略)

Electron-builder 打包

笔试练习day3

企业想要将大模型技术应用到企业管理中需具备什么条件？

go 事件机制（观察者设计模式）

RISC-V竞赛｜第二届 RISC-V 软件移植及优化锦标赛报名正式开始！

【VTK】ubuntu手动编译VTK9.3 Generating qmltypes file 失败

学习java的日子 Day64 学生管理系统 web2.0 web版本

【第14章】Spring Cloud之Gateway路由断言(IP黑名单)

3、pnpm yarn npm

❄️5. Kubernetes核心资源之名称空间和Pod实战

锂电池充电板电路设计

工业互联网产教融合实训基地解决方案

Linux栈机制解析：从原理到实践应用

蒙特卡洛方法与科学计算十大经典算法解析

ESP32/ESP8266旋转编码器驱动库：支持加速度响应与复合按键事件

2026届学术党必备的降AI率平台横评

宫外孕打掉需要住院吗？术后修护核心指南

信通院：AI4SE行业现状调查报告 2026

OpenCV直线检测避坑指南：HoughLinesP参数调优实战（Python版）

若依微服务版实战：5分钟搞定积木报表1.5.6集成与权限控制

Vivado团队协作效率翻倍：如何用企业级Vivado_init.tcl统一团队编译环境？

BetterJoy终极指南：在Windows电脑上完美使用Switch手柄玩游戏