当前位置：首页 > news >正文

JPA 批量插入较大数据解决性能慢问题

news 2026/3/31 15:27:52

JPA 批量插入较大数据解决性能慢问题

使用jpa saveAll接口的话需要了解原理：

	@Transactional@Overridepublic <S extends T> List<S> saveAll(Iterable<S> entities) {Assert.notNull(entities, "Entities must not be null!");List<S> result = new ArrayList<>();// 使用for循环遍历for (S entity : entities) {result.add(save(entity));}return result;}@Transactional@Overridepublic <S extends T> S save(S entity) {Assert.notNull(entity, "Entity must not be null.");// 每条数据都会查询之后 做下判断if (entityInformation.isNew(entity)) {em.persist(entity);return entity;} else {return em.merge(entity);}}public boolean isNew(T entity) {ID id = getId(entity);Class<ID> idType = getIdType();if (!idType.isPrimitive()) {// 如果id有值，则认为不是新数据，则更新操作，否则就是写入操作return id == null;}if (id instanceof Number) {return ((Number) id).longValue() == 0L;}throw new IllegalArgumentException(String.format("Unsupported primitive id type %s", idType));}

以上是jpa源码，所以导致写入数据很慢。因为for遍历一行一行数据写入，而且还要判断；

以下为亲测两种解决方案：

第一种：自己编写写入逻辑，引入 EntityManager entityManager，代码如下
批量写入一批数据。一次事务提交一批。

@Value("${spring.jpa.properties.hibernate.jdbc.batch_size:1000}")private int batchSize;@PersistenceContextprivate EntityManager entityManager;public <T> void batchInsert(List<T> list) {if (!ObjectUtils.isEmpty(list)){for (int i = 1; i <= list.size(); i++) {// 写入操作entityManager.persist(list.get(i - 1));if (i % batchSize == 0) {entityManager.flush();entityManager.clear();}}if (list.size() % batchSize != 0) {//flush() 同步持久上下文环境，即将持久上下文环境的所有未保存实体的状态信息保存到数据库中。entityManager.flush();//clear() 清除持久上下文环境，断开所有关联的实体。如果这时还有未提交的更新则会被撤消。entityManager.clear();}}}public <T> void batchUpdate(List<T> list) {if (!ObjectUtils.isEmpty(list)){for (int i = 1; i < list.size(); i++) {entityManager.merge(list.get(i - 1));if (i % batchSize == 0) {entityManager.flush();entityManager.clear();}}if (list.size() % batchSize != 0) {entityManager.flush();entityManager.clear();}}}

第二种：不需要自己编写逻辑，使用jpa saveAll()方法
开启JPA批处理
在这里插入图片描述

jpa 表映射@Table 下对主键使用序列，postgre支持创建序列，可以使用，其他数据源不一定。

    @GeneratedValue(strategy = SEQUENCE, generator = "seqGen")@SequenceGenerator(name = "seqGen", sequenceName = "seq", initialValue = 1)

这样做的逻辑saveAll()不需要判断isNew,直接走em.persist(entity);

两种的性能差不多，记录下

JPA 批量插入较大数据解决性能慢问题

JPA 批量插入较大数据解决性能慢问题使用jpa saveAll接口的话需要了解原理： TransactionalOverridepublic <S extends T> List<S> saveAll(Iterable<S> entities) {Assert.notNull(entities, "Entities must not be null!");List<…...

编程日记 2023/7/5 4:37:18

为啥离不了 linux

Linux与Windows都是十分常见的电脑操作系统，相信你对它们二者都有所了解！在你的使用过程中，是否有什么事让你觉得在Linux上顺理成章，换到Windows上就令你费解？亦或者关于这二者你有任何想要分享的，都可以在…...

编程日记 2023/7/5 4:03:57

基于分形的置乱算法和基于混沌系统的置乱算法哪种更安全？

在信息安全领域中，置乱算法是一种重要的加密手段，它可以将明文进行混淆和打乱，从而实现保密性和安全性。常见的置乱算法包括基于分形的置乱算法和基于混沌系统的置乱算法。下面将从理论和实践两方面，对这两种置乱算法进行比较和分…...

编程日记 2023/7/5 3:30:37

首先连接pve主机的终端下载ubuntu22.04的cloud-image镜像 wget -P /opt https://mirrors.cloud.tencent.com/ubuntu-cloud-images/jammy/current/jammy-server-cloudimg-amd64.img创建虚拟机，id设为9000，使用VirtIO SCSI控制器 qm create 9000 -core…...

编程日记 2023/7/5 2:57:15

shiro入门

1、概述 Apache Shiro 是一个功能强大且易于使用的 Java 安全(权限)框架。借助 Shiro 您可以快速轻松地保护任何应用程序一一从最小的移动应用程序到最大的 Web 和企业应用程序。作用：Shiro可以帮我们完成 ：认证、授权、加密、会话管理、与 Web 集成、…...

编程日记 2023/7/5 2:23:54

开源 sysgrok — 用于分析、理解和优化系统的人工智能助手

作者：Sean Heelan 在这篇文章中，我将介绍 sysgrok，这是一个研究原型，我们正在研究大型语言模型 (LLM)（例如 OpenAI 的 GPT 模型）如何应用于性能优化、根本原因分析和系统工程领域的问题。你可以在 GitHub …...

编程日记 2023/7/5 1:50:33

Gitlab保护分支与合并请求

目录引言 1、成员角色指定 1、保护分支设置 2、合并请求引言熟悉了Git工作流之后，有几个重要的分支，如Master(改名为Main)、Develop、Release分支等，是禁止开发成员随意合并和提交的，在此分支上的提交和推送权限仅限项目负责…...

编程日记 2023/7/5 1:17:12

ad18学习笔记九：输出文件

一般来说提供给板卡厂的文件里要包括以下这些文件 1、装配图 2、bom文件 3、gerber文件 4、转孔文件 5、坐标文件 6、ipc网表 AD_PCB：Gerber等各类文件的输出 - 哔哩哔哩原点|钻孔_硬件设计AD 生成 Gerber 文件 1、装配图如何输出装配图？ 【…...

编程日记 2023/7/5 0:43:51

PostgreSQL 内存配置与 MemoryContext 的生命周期

PostgreSQL 内存配置与MemoryContext的生命周期 PG/GP 内存配置数据库可用的内存 gp_vmem 整个 GP 数据库可用的内存 gp_vmem： >>> RAM 128 * GB >>> gp_vmem ((SWAP RAM) - (7.5*GB 0.05 * RAM)) / 1.7 >>> print(gp_vmem / G…...

编程日记 2023/7/5 0:10:30

vue3 组件间通信的方式(setup语法糖写法)

vue3 组件间通信的方式(setup语法糖写法) 1. Props方式该方式用于父传子，父组件以数据绑定的形式声明要传递的数据，子组件通过defineProps()方法创建props对象，即可拿到父组件传来的数据。 // 父组件 <template><div><son…...

编程日记 2023/7/4 23:37:09

【Cache】Rsync远程同步

文章目录一、rsync 概念二、rysnc 服务器部署1. 环境配置2. rysnc 同步源服务器2.1 安装 rsync2.2 建立 rsyncd.conf 配置文件2.3 创建数据文件（账号密码）2.4 启动服务2.5 数据配置 3. rysnc 客户端3.1 设置同步方法一方法二 3.2 免交互设置 4. rysnc 认…...

编程日记 2023/7/4 23:03:48

Gitlab升级报错一：rails_migration[gitlab-rails] (gitlab::database_migrations line 51)

Gitlab-ce从V14.0.12升级到V14.3.6或V14.10.5时报错：如下图： 解决办法： 先停掉gitlab: gitlab-ctl stop 单独启动数据库，如果不单独启动数据库，就会报以上错误 sudo gitlab-ctl start postgresql 解决办法&#x…...

编程日记 2023/7/4 22:30:27

chatGPT流式回复是怎么实现的

chatGPT流式回复是怎么实现的先说结论： chatGPT的流式回复用的就是HTTP请求方案中的server-send-event流式接口，也就是服务端向客户端推流数据。那eventStream流式接口怎么实现呢，下面就进入正题！ 文章目录 chatGPT流式回复…...

编程日记 2023/7/4 21:57:06

使用SpringEL获得字符串中的表达式运算结果

概述有时候会遇上奇怪的需求，比如解析字符串中表达式的结果。这个时候自己写解析肯定是比较麻烦的， 正好SprinngEL支持加()、减(-)、乘(*)、除(/)、求余（%）、幂（^）运算，可以免去造轮子的功夫…...

编程日记 2023/7/4 21:23:43

力扣 39. 组合总和

题目来源：https://leetcode.cn/problems/combination-sum/description/ C题解： 递归法。递归前对数组进行有序排序，可方便后续剪枝操作。递归函数参数：定义两个全局变量，二维数组result存放结果集，数组pa…...

编程日记 2023/7/4 20:50:21

基于BES系列蓝牙耳机NTC充电电池保护电路设计

+hezkz17进数字音频系统研究开发交流答疑一在充电电路中NTC作用？在充电电路中，NTC（Negative Temperature Coefficient）热敏电阻通常被用于温度检测和保护。它具有随温度变化而变化的电阻值。以下是NTC在充电电路中的几种常见作用：温度监测：NTC热敏电阻可以用来测量…...

编程日记 2023/7/4 20:17:00

13-C++算法笔记-递归

📚 Introduction 递归是一种常用的算法设计和问题求解方法。它基于问题可以分解为相同类型的子问题，并通过解决子问题来解决原始问题的思想。递归算法在实际编程中具有广泛的应用。 🎯 递归算法解决问题的特点递归算法具有以下特点&#…...

编程日记 2023/7/4 19:43:39

从古代八卦探究计算机的八进制

八进制，即八卦，是中国古代哲学体系中非常重要的一个概念，它被广泛应用于易经、道家、儒家等诸多领域。随着计算机科学的快速发展，人们开始思考：八进制是否可以应用到计算机上？ 一、什么是八进制&#xff1…...

编程日记 2023/7/4 19:10:18

Linux shell mkfs.ext4命令参数使用

mkfs mkfs是个综合命令 mkfs 然后按两下tab 查看系统支持哪些文件系统的格式化功能 mkfs -t 文件系统格式名以指定的文件系统格式来进行磁盘格式化 > 等于 mkfs.文件系统格式名比如： mkfs -t xfs mkfs.xfs 常见的磁盘格式…...

编程日记 2023/7/4 18:36:57

【Docker】子系统与其相关名词的界定、Control Groups等详细讲解

前言 Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux或Windows操作系统的机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。 📕作者简介：热…...

编程日记 2023/7/4 18:03:35

解锁Claude无限潜能：技能生态系统的构建艺术

解锁Claude无限潜能：技能生态系统的构建艺术【免费下载链接】awesome-claude-skills A curated list of awesome Claude Skills, resources, and tools for customizing Claude AI workflows 项目地址: https://gitcode.com/GitHub_Trending/aw/awesome-claude-s…...

编程新知 2026/3/31 15:10:35

StructBERT WebUI部署教程：CSDN GPU Pod环境下5000端口服务配置与防火墙适配

StructBERT WebUI部署教程：CSDN GPU Pod环境下5000端口服务配置与防火墙适配 1. 项目概述 StructBERT文本相似度服务是一个基于百度StructBERT大模型的高精度中文句子相似度计算工具。这个工具能够准确判断两个中文句子在语义上的相似程度，为各种文本处…...

编程新知 2026/3/31 14:34:05