当前位置：首页 > news >正文

MySQL 中快速插入大量数据

news 2026/4/1 10:38:41

在 MySQL 中快速插入大量数据（例如 20 万条记录）可以通过多种方法实现。以下是一些优化技巧和步骤，可以帮助你高效地插入大量数据：

1. 禁用索引和约束（如果可能）

在插入大量数据之前，禁用索引和外键约束可以显著提高插入速度。在插入完成后，再重新启用它们并重建索引。

sql
-- 禁用外键约束
SET foreign_key_checks = 0;

-- 禁用唯一性检查
SET unique_checks = 0;

-- 禁用自动提交
SET autocommit = 0;

-- 禁用索引更新（对于MyISAM）
-- ALTER TABLE your_table DISABLE KEYS;

2. 使用批量插入

批量插入可以显著减少插入操作的开销。例如，使用 INSERT INTO ... VALUES (...), (...), ... 语法。

sql
INSERT INTO your_table (column1, column2, column3)
VALUES
(value1_1, value1_2, value1_3),
(value2_1, value2_2, value2_3),
-- 继续添加更多行，直到达到合理的批量大小（如几千行）
(valueN_1, valueN_2, valueN_3);

3. 使用事务

在事务中执行批量插入可以减少每次提交的开销。

sql
START TRANSACTION;

-- 批量插入语句
INSERT INTO your_table (column1, column2, column3)
VALUES
(value1_1, value1_2, value1_3),
-- 继续添加更多行
(valueN_1, valueN_2, valueN_3);

COMMIT;

4. 禁用二进制日志（如果不需要复制或恢复点）

如果你的数据库不需要复制或增量备份，可以临时禁用二进制日志。

sql
SET sql_log_bin = 0;
注意：禁用二进制日志后，数据库将无法进行增量备份或复制操作，请谨慎使用。

5. 调整 MySQL 配置

根据需要调整 MySQL 配置，以提高插入性能。例如，增加 innodb_buffer_pool_size、innodb_log_file_size 和 innodb_flush_log_at_trx_commit。

6. 使用 LOAD DATA INFILE

对于非常大的数据集，使用 LOAD DATA INFILE 可以比 INSERT 语句快得多。

sql
LOAD DATA INFILE '/path/to/your/file.csv'
INTO TABLE your_table
FIELDS TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;

7. 重新启用索引和约束

在插入完成后，重新启用之前禁用的索引和外键约束。

sql
-- 启用外键约束
SET foreign_key_checks = 1;

-- 启用唯一性检查
SET unique_checks = 1;

-- 启用自动提交
SET autocommit = 1;

-- 启用索引更新（对于MyISAM）
-- ALTER TABLE your_table ENABLE KEYS;
示例脚本
以下是一个综合示例脚本，用于快速插入 20 万条数据：

sql
-- 禁用外键约束、唯一性检查和自动提交
SET foreign_key_checks = 0;
SET unique_checks = 0;
SET autocommit = 0;

-- 开始事务
START TRANSACTION;

-- 批量插入（示例，这里只展示少量数据，实际应扩展到 20 万条）
INSERT INTO your_table (column1, column2, column3)
VALUES
(value1_1, value1_2, value1_3),
(value2_1, value2_2, value2_3),
-- 重复插入直到达到 20 万条数据
-- ...
(value200000_1, value200000_2, value200000_3);

-- 提交事务
COMMIT;

-- 启用外键约束、唯一性检查和自动提交
SET foreign_key_checks = 1;
SET unique_checks = 1;
SET autocommit = 1;
注意事项
备份数据：在进行批量插入之前，务必备份你的数据，以防数据丢失或损坏。
测试环境：先在测试环境中验证这些操作，以确保它们不会影响生产环境的性能和稳定性。
监控性能：监控数据库的性能，确保批量插入操作不会对数据库服务器造成过大的负载。
通过这些优化技巧，你应该能够高效地插入 20 万条数据到 MySQL 数据库中。

MySQL 中快速插入大量数据

在 MySQL 中快速插入大量数据（例如 20 万条记录）可以通过多种方法实现。以下是一些优化技巧和步骤，可以帮助你高效地插入大量数据： 1. 禁用索引和约束（如果可能） 在插入大量数据之前，禁用索引和…...

编程日记 2024/12/23 10:49:07

腾讯云智能结构化OCR：以多模态大模型技术为核心，推动跨行业高效精准的文档处理与数据提取新时代

🎼个人主页：【Y小夜】 😎作者简介：一位双非学校的大三学生，编程爱好者， 专注于基础和实战分享，欢迎私信咨询！ 🎆入门专栏：🎇【MySQL&#xff0…...

编程日记 2024/12/23 10:45:00

最大似然检测在通信解调中的应用

最大似然检测（Maximum Likelihood Detection，MLD），也称为最大似然序列估计（Maximum Likelihood Sequence Estimation，MLSE），是一种在通信系统中广泛应用的解调方法。其核心思想是在给…...

编程日记 2024/12/23 10:42:51

SKETCHPAD——允许语言模型生成中间草图,在几何、函数、图算法和游戏策略等所有数学任务中持续提高基础模型的性能

概述论文地址：https://arxiv.org/pdf/2406.09403 素描是一种应用广泛的有效工具，包括产生创意和解决问题。由于素描能直接传达无法用语言表达的视觉和空间信息，因此从古代岩画到现代建筑图纸，素描在世界各地被用于各种用途。儿童…...

编程日记 2024/12/23 10:39:47

[JAVA备忘录] Lambda 表达式简单介绍

目录前言函数式接口 Lambda 表达式使用实例简单示例 1. 无参数，无返回值 2. 有参数，无返回值 3. 无参数，有返回值 4. 有参数，有返回值解释： 集合框架 1.forEach：遍历集合 2.排序&#xff1…...

编程日记 2024/12/23 10:38:44

[python]使用flask-caching缓存数据

简介 Flask-Caching 是 Flask 的一个扩展，为任何 Flask 应用程序添加了对各种后端的缓存支持。它基于 cachelib 运行，并通过统一的 API 支持 werkzeug 的所有原始缓存后端。开发者还可以通过继承 flask_caching.backends.base.BaseCache 类来开发自己的…...

编程日记 2024/12/23 10:34:41

裸机按键输入实验

一、硬件原理分析按键就两个状态：按下或弹起，将按键连接到一个 IO 上，通过读取这个 IO 的值就知道按键是按下的还是弹起的。至于按键按下的时候是高电平还是低电平要根据实际电路来判断。前面几章我们都是讲解 I.MX6U 的 GPIO 作为输出使用…...

编程日记 2024/12/23 10:32:37

GaussDB运维管理工具（二）

GaussDB运维管理工具（二） 集群管理组件cm_ctl工具介绍cm_ctl工具使用查询集群状态启停集群主备切换重建备DN检测进程运行查看实例配置文件手动剔除故障CNCM参数获取和配置停止仲裁 Cluster Manager（缩写为CM）是GaussDB的集群管理工…...

编程日记 2024/12/23 10:31:25

【HarmonyOS之旅】HarmonyOS开发基础知识(一)

目录 1 -> 应用基础知识 1.1 -> 用户应用程序 1.2 -> 用户应用程序包结构 1.3 -> Ability 1.4 -> 库文件 1.5 -> 资源文件 1.6 -> 配置文件 1.7 -> pack.info 1.8 -> HAR 2 -> 配置文件简介 2.1 -> 配置文件的组成 3 -> 配置文…...

编程日记 2024/12/23 10:30:20

Mysql数据究竟是如何存储的

Mysql行列式开篇笔者这几日在学习mysql是这么运行的这本书，感觉书中的内容受益匪浅，想整理成自己的话分享给大家，平时大家工作和生活中可能没有时间去专心投入读取一本书，而mysql是这么运行的这本书需要投入大量的时间的学…...

编程日记 2024/12/23 10:27:13

STM32单片机使用CAN协议进行通信

CAN总线（控制器局域网总线） 理论知识 CAN总线是由BOSCH公司开发的一种简洁易用、传输速度快、易扩展、可靠性高的串行通信总线 CAN总线特征两根通信线（CAN_H、CAN_L），线路少，无需共地差分信号通信&…...

编程日记 2024/12/23 10:26:11

Docker 入门：如何使用 Docker 容器化 AI 项目（二）

四、将 AI 项目容器化：示例实践 - 完整的图像分类与 API 服务让我们通过一个更完整的 AI 项目示例，展示如何将 AI 项目容器化。我们以一个基于 TensorFlow 的图像分类模型为例，演示如何将训练、推理、以及 API 服务过程容器化。 4.1 创建 …...

编程日记 2024/12/23 10:23:05

MVVM、MVC、MVP 的区别

MVVM（Model-View-ViewModel）、MVC（Model-View-Controller）和MVP（Model-View-Presenter）是三种常见的软件架构模式，它们在客户端应用开发中被广泛使用。每种模式都有其特定的设计理念和应用场景&…...

编程日记 2024/12/23 10:19:02

【Verilog】期末复习

数字逻辑电路分为哪两类？它们各自的特点是什么？ 组合逻辑电路：任意时刻的输出仅仅取决于该时刻的输入，而与电路原来的状态无关没有记忆功能，只有从输入到输出的通路，没有从输出到输入的回路时序逻辑电路&…...

编程日记 2024/12/23 10:16:59

C#都可以找哪些工作？

在国内学习C#，可以找的工作主要是以下4个： 1、游戏开发需要学习C#编程、Unity引擎操作、游戏设计和3D图形处理等。 2、PC桌面应用开发需要学习C#编程、WinForm框架/WPF框架、MVVM设计模式和UI/UX设计等。 3、Web开发需要学习C#编程、ASP.NET框架…...

编程日记 2024/12/23 10:13:55

机器学习Python使用scikit-learn工具包详细介绍

一、简介 Scikit-learn是一个开源的机器学习库，用于Python编程语言。它建立在NumPy、SciPy和matplotlib这些科学计算库之上，提供了简单有效的数据挖掘和数据分析工具。Scikit-learn库包含了许多用于分类、回归、聚类和降维的算法，包括支持向量…...

编程日记 2024/12/23 10:12:54

蓝桥杯真题 - 扫雷 - 题解

题目链接：https://www.lanqiao.cn/problems/549/learning/ 个人评价：难度 1 星（满星：5） 前置知识：无整体思路按题意模拟；为了减少不必要的“数组越界”判断，让数组下标从 1 1 1…...

编程日记 2024/12/23 10:11:53

vue3项目结合Echarts实现甘特图（可拖拽、选中等操作）

效果图： 图一：选中操作图二：上下左右拖拽操作本案例在echarts示例机场航班甘特图的基础上修改封装ganttEcharts组件，测试数据 airport-schedule.jsonganttEcharts代码: 直接复制粘贴可测…...

编程日记 2024/12/23 10:09:50

Log4j2 插件的简单使用

代码: TestPlugin.java package com.chenjiacheng.webapp.plugins;import org.apache.logging.log4j.core.LogEvent; import org.apache.logging.log4j.core.config.plugins.Plugin; import org.apache.logging.log4j.core.lookup.StrLookup;/*** Created by chenjiacheng on …...

编程日记 2024/12/23 10:08:49

MySQL 中快速插入大量数据

1. 禁用索引和约束（如果可能）

2. 使用批量插入

3. 使用事务

4. 禁用二进制日志（如果不需要复制或恢复点）

5. 调整 MySQL 配置

6. 使用 LOAD DATA INFILE

7. 重新启用索引和约束

相关文章：

MySQL 中快速插入大量数据

腾讯云智能结构化OCR：以多模态大模型技术为核心，推动跨行业高效精准的文档处理与数据提取新时代

最大似然检测在通信解调中的应用

SKETCHPAD——允许语言模型生成中间草图,在几何、函数、图算法和游戏策略等所有数学任务中持续提高基础模型的性能

[JAVA备忘录] Lambda 表达式简单介绍

[python]使用flask-caching缓存数据

裸机按键输入实验

GaussDB运维管理工具（二）

【HarmonyOS之旅】HarmonyOS开发基础知识(一)

Mysql数据究竟是如何存储的

STM32单片机使用CAN协议进行通信

Docker 入门：如何使用 Docker 容器化 AI 项目（二）

MVVM、MVC、MVP 的区别

【Verilog】期末复习

C#都可以找哪些工作？

机器学习Python使用scikit-learn工具包详细介绍

蓝桥杯真题 - 扫雷 - 题解

vue3项目结合Echarts实现甘特图（可拖拽、选中等操作）

Log4j2 插件的简单使用

Linux之RPM和YUM命令

intv_ai_mk11保姆级教学：输入‘你好’→追问第2点→指定表格输出，完整交互链路演示

Python自动化脚本：从零构建《三国杀》钓鱼辅助

企业级母婴商城系统管理系统源码｜SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】

HDSceneColor节点]原理解析与实际应用

Amlogic S9XXX Armbian刷机完全指南：从入门到进阶的5个关键问题

深入解析Android系统分区：从启动到恢复的完整指南

快手数据采集引擎：无水印解析与多源内容整合工具

别再找插件了！手把手教你用uni-app的Canvas API画一个带渐变和刻度的环形进度条

RB3201-RBProtocol：ESP32机器人轻量通信协议栈解析

像素史诗智识终端效果展示：自动提取数据关键指标并生成结论段落