Linux·数据库INSERT优化
在业务中,我们经常会要对数据进行存储,对于少量数据插入时,我们可以直接使用 INSERT 插入数据,但是当我们需要插入的数据比较多时,使用 INSERT 插入的话时间消耗是很大的,具体而言单次插入600+时,就需要十几秒,显然这个时间是用户无法忍受的,那么有没有什么办法优化数据插入时间呢?
那么我们应该先搞清楚为什么 INSERT 插入这么耗时间,原因是 INSERT 每次都会触发磁盘同步(fsync()),写入磁盘本身就是一个耗时的操作,每次插入一点数据就同步一点数据,对于磁盘而言更是雪上加霜。到这里其实我们想到的第一个优化点,应该就是对于要插入的数据,一次性同步到磁盘,这样可以减少多次同步磁盘带来的时间消耗。
具体的,可以使用事务 BEGIN TRANSACTION;
具体插入方式:
BEGIN TRANSACTION;
INSERT INTO my_table (id, value) VALUES (1, 'A');
INSERT INTO my_table (id, value) VALUES (2, 'B');
INSERT INTO my_table (id, value) VALUES (3, 'C');
COMMIT;
🔹 优点:
- 避免每条
INSERT都触发fsync(),提升写入速度。 - 适用于数据较少的批量写入(几十到几百行)。
虽然比单条 INSERT 更快,但仍然会触发多次索引更新。
进一步优化,使用 sqlite3_prepare_v2()(C 语言,高性能)
在 C 语言中,推荐使用 预编译 SQL + 绑定参数,避免 SQL 解析开销:
#include <stdio.h>
#include <sqlite3.h>
void batch_insert(sqlite3 *db) { const char *sql = "INSERT INTO my_table (id, value) VALUES (?, ?);"; sqlite3_stmt *stmt; if (sqlite3_prepare_v2(db, sql, -1, &stmt, NULL) != SQLITE_OK) { printf("Failed to prepare statement: %s\n", sqlite3_errmsg(db)); return; } sqlite3_exec(db, "BEGIN TRANSACTION;", 0, 0, 0); // 开启事务 for (int i = 1; i <= 1000; i++) { // 数据组装sqlite3_bind_int(stmt, 1, i); sqlite3_bind_text(stmt, 2, "Sample", -1, SQLITE_STATIC); if (sqlite3_step(stmt) != SQLITE_DONE) { printf("Insert failed: %s\n", sqlite3_errmsg(db)); } // 复用 statement sqlite3_reset(stmt); } sqlite3_exec(db, "COMMIT;", 0, 0, 0);// 提交事务 sqlite3_finalize(stmt);
}
int main() { sqlite3 *db; sqlite3_open("test.db", &db); batch_insert(db); // 批量插入 1000 条数据 sqlite3_close(db); return 0;
}
🔹 优点:
- 使用
sqlite3_prepare_v2()预编译 SQL,避免 SQL 解析开销。 sqlite3_bind_*()绑定参数,防止 SQL 注入。- 批量插入 1000 行,仅触发 1 次事务提交,写入速度极快。
- 适用于大规模数据插入(几千行以上)。
再进一步优化
1. 开启 WAL 模式
PRAGMA journal_mode=WAL; PRAGMA synchronous=NORMAL;
🔹 优势:
- WAL 模式支持并发读写,写入更快。
2. 关闭 fsync() 提高速度(仅适用于低风险场景)
PRAGMA synchronous=OFF;
⚠️ 注意:这样可能导致断电时丢数据,适用于非关键数据。
🚀 结论
| 方法 | 适用场景 | 速度 |
|---|---|---|
BEGIN TRANSACTION; | 小批量插入(几十到几百行) | ⭐⭐⭐ |
sqlite3_prepare_v2() + sqlite3_bind_*() | 大批量插入(1000+ 行) | ⭐⭐⭐⭐⭐ |
👉 如果数据量较大(1000+ 行),推荐 sqlite3_prepare_v2() 方式,搭配 WAL 模式,能达到最佳写入速度。
🔥 性能对比
| 方法 | 1000 条数据写入时间 |
|---|---|
单条 INSERT(无事务) | 约 5-10 秒 |
批量 INSERT(事务模式) | 约 50-200 毫秒 |
| 预编译 SQL + 事务 | 约 5-20 毫秒 |
如果数据量更大,比如 10 万行,普通 INSERT 可能需要 几分钟,但 使用事务 + 预编译 只需 几秒。
对于多表也支持,完整示例:
#include <stdio.h>
#include <sqlite3.h>#define DB_PATH "test.db" // 数据库文件路径
#define NUM_INSERTS 500 // 每张表插入 500 行,总共 1000 行void batch_insert(sqlite3 *db) {const char *sql1 = "INSERT INTO my_table (time, ip, dir, new, count) VALUES (?, ?, ?, ?, ?);";const char *sql2 = "INSERT INTO netflow_app_live (time, id, new, count) VALUES (?, ?, ?, ?);";sqlite3_stmt *stmt1, *stmt2;// 预编译 SQL 语句if (sqlite3_prepare_v2(db, sql1, -1, &stmt1, NULL) != SQLITE_OK ||sqlite3_prepare_v2(db, sql2, -1, &stmt2, NULL) != SQLITE_OK) {printf("Failed to prepare statement: %s\n", sqlite3_errmsg(db));return;}// 开启事务sqlite3_exec(db, "BEGIN TRANSACTION;", 0, 0, 0);for (int i = 0; i < NUM_INSERTS; i++) {// 插入 my_tablesqlite3_bind_int(stmt1, 1, 1610000000 + i); // timesqlite3_bind_text(stmt1, 2, "192.168.1.1", -1, SQLITE_STATIC); // ipsqlite3_bind_int(stmt1, 3, i % 2); // dirsqlite3_bind_int(stmt1, 4, i); // newsqlite3_bind_int(stmt1, 5, i * 10); // countif (sqlite3_step(stmt1) != SQLITE_DONE) {printf("Insert into my_table failed: %s\n", sqlite3_errmsg(db));}sqlite3_reset(stmt1); // 复用 statement1// 插入 netflow_app_livesqlite3_bind_int(stmt2, 1, 1610000000 + i); // timesqlite3_bind_int(stmt2, 2, i); // idsqlite3_bind_int(stmt2, 3, i); // newsqlite3_bind_int(stmt2, 4, i * 10); // countif (sqlite3_step(stmt2) != SQLITE_DONE) {printf("Insert into netflow_app_live failed: %s\n", sqlite3_errmsg(db));}sqlite3_reset(stmt2); // 复用 statement2}// 提交事务sqlite3_exec(db, "COMMIT;", 0, 0, 0);// 释放 statementsqlite3_finalize(stmt1);sqlite3_finalize(stmt2);
}int main() {sqlite3 *db;// 打开数据库if (sqlite3_open(DB_PATH, &db) != SQLITE_OK) {printf("Cannot open database: %s\n", sqlite3_errmsg(db));return -1;}// 设置 WAL 模式,提高写入性能sqlite3_exec(db, "PRAGMA journal_mode=WAL;", 0, 0, 0);sqlite3_exec(db, "PRAGMA synchronous=NORMAL;", 0, 0, 0);// 批量插入数据batch_insert(db);// 关闭数据库sqlite3_close(db);printf("Batch insert completed.\n");return 0;
}
相关文章:
Linux·数据库INSERT优化
在业务中,我们经常会要对数据进行存储,对于少量数据插入时,我们可以直接使用 INSERT 插入数据,但是当我们需要插入的数据比较多时,使用 INSERT 插入的话时间消耗是很大的,具体而言单次插入600时,…...
Sourcetrail 代码分析工具
Sourcetrail 概述 Sourcetrail 是一个代码分析工具,它旨在帮助开发人员理解和导航复杂的代码库。它可以创建代码库的可视化图形,显示代码中的类、函数、变量、依赖关系等信息,从而帮助开发人员更好地理解代码结构和关系,降低维护…...
从数据到决策,永洪科技助力良信电器“智”领未来
在数字经济浪潮汹涌的时代,数字化转型已成为企业增强竞争力、实现可持续发展的必由之路。良信电器,作为国内知名的电气设备制造企业,积极响应时代号召,携手永洪科技,共同开启了数字化转型的新篇章。 上海良信电器股份有…...
Python-04BeautifulSoup网络爬虫
2025-03-04-BeautifulSoup网络爬虫 记录BeautifulSoup网络爬虫的核心知识点 文章目录 2025-03-04-BeautifulSoup网络爬虫 [toc]1-参考网址2-学习要点3-核心知识点1. 安装2. 导入必要的库3. 发送 HTTP 请求4. 创建 BeautifulSoup 对象5. 解析 HTML 内容5.1 查找标签5.2 根据属性…...
Spring框架自带的定时任务:Spring Task详解
文章目录 一、基本使用1、配置:EnableScheduling2、触发器:Scheduled 二、拓展1、修改默认的线程池2、springboot配置 三、源码分析参考资料 一、基本使用 1、配置:EnableScheduling import org.springframework.context.annotation.Config…...
深入探索像ChatGPT这样的大语言模型
参考 【必看珍藏】2月6日,安德烈卡帕西最新AI普及课:深入探索像ChatGPT这样的大语言模型|Andrej Karpathy fineweb知乎翻译介绍 fineweb-v1原始连接 fineweb中文翻译版本 Chinese Fineweb Edu数据集 查看网络的内部结果,可以参…...
week 3 - More on Collections - Lecture 3
一、Motivation 1. Java支持哪种类型的一维数据结构? Java中用于在单一维度中存储数据的数据结构,如arrays or ArrayLists. 2. 如何在Java下创建一维数据结构?(1-dimensional data structure) 定义和初始化这些一…...
机器学习11-经典网络解析
机器学习11-经典网络解析 AlexNetImageNet 大规模视觉识别挑战赛一、赛事背景与目的二、数据集与任务设置三、参赛规则与流程四、评审标准与机制五、历史与影响六、中国团队的表现 贡献解析CONV1层MaxP00L1层NORM1层CONV2层 CONV3、CONV4层CONV4,Max POOL3 层FC6、F…...
【AI深度学习基础】NumPy完全指南入门篇:核心功能与工程实践(含完整代码)
NumPy系列文章 入门篇进阶篇终极篇 一、NumPy简介 NumPy(Numerical Python)是Python中科学计算的核心库,提供了高性能的多维数组对象和各种用于数组操作的函数。它是Python数据分析和科学计算的基础,被广泛应用于机器学习、数据…...
【数据结构】链表与顺序表的比较
链表和顺序表是两种常见的数据结构,各有优缺点,适用于不同的场景。 ### 顺序表(数组) 顺序表在内存中连续存储元素,支持随机访问。 **优点:** 1. **随机访问**:通过索引直接访问元素…...
【JavaScript—前端快速入门】JavaScript 基础语法
JavaScript 基础语法 1. 变量 创建变量(变量定义 / 变量声明 / 变量初始化),JS 声明变量有3种方式 2. 通过打印日志,查看变量类型 JavaScript 是一门动态弱类型语言,变量可以存放不同类型的值(动态) 接下来,我们通过使用 log 指令…...
deepseek助力运维和监控自动化
将DeepSeek与Agent、工作流及Agent编排技术结合,可实现IT运维与监控的智能化闭环管理。以下是具体应用框架和场景示例: 一、智能Agent体系设计 多模态感知Agent 日志解析Agent:基于DeepSeek的NLP能力,实时解析系统日志中的语义&a…...
日志分析集群安装部署(ELK) 保姆级教程
创建用户es不用root用户 创建的用户是elasticsearch密码:elasticsearch useradd elasticsearch && echo elasticsearch|passwd --stdin elasticsearch 1.优化最打进程数、最大文件打开数、优化虚拟内存 、elastic.co vim /etc/security/limit.conf * soft nofile 65…...
springboot在业务层校验对象/集合中字段是否符合要求
springboot在业务层校验对象参数是否必填 1.场景说明2.代码实现 1.场景说明 为什么不在控制层使用Validated或者Valid注解直接进行校验呢?例如通过excel导入数据,将excel数据转为实体类集合后,校验集合中属性是否符合要求。 2.代码实现 定义…...
【UCB CS 61B SP24】Lecture 17 - Data Structures 3: B-Trees 学习笔记
本文以 2-3-4 树为例详细讲解了 B 树的概念,逐步分析其操作,并用 Java 实现了标准的多阶 B 树。 1. 2-3 & 2-3-4 Trees 上一节课中讲到的二叉搜索树当数据是随机顺序插入的时候能够使得树变得比较茂密,如下图右侧所示,时间复…...
论文阅读笔记:UniFace: Unified Cross-Entropy Loss for Deep Face Recognition
论文阅读笔记:UniFace: Unified Cross-Entropy Loss for Deep Face Recognition 1 背景2 创新点3 方法3.1 回顾softmax损失3.2 统一交叉熵损失3.3 人脸验证中的UCE损失3.4 进一步的优化3.4.1 边际UCE损失3.4.2 平衡BCE损失 4 实验4.1 消融实验4.2 和SOTA方法对比 论…...
从零开始用react + tailwindcss + express + mongodb实现一个聊天程序(十) 收发消息
1.聊天框 首先我们完善前端的消息输入框 components下面新建MessageInput组件 import { useState,useRef } from "react" import {X,Image,Send} from "lucide-react"import { useChatStore } from "../store/useChatStore" import toast from…...
数据仓库的特点
数据仓库的主要特点可以概括为:面向主题、集成性、非易失性、时变性、高性能和可扩展性、支持复杂查询和分析、分层架构以及数据质量管理。 1. 面向主题(Subject-Oriented) 数据仓库是面向主题的,而不是面向事务的。这意味着数据…...
5分钟看懂Deepseek开源周之六:Deepseek-V3/R1推理系统设计----揭开深度求索模型系统设计和运营成本之谜
前言 众所周知,四大天王一般有五个人。所以开源周五连发有第六天也很正常。贴上了开源周活动的github主贴,大家可以不上推特就能了解详情。 deepseek-ai/open-infra-index: Production-tested AI infrastructure tools for efficient AGI development a…...
DICOM服务中的C-STORE、 C-FIND、C-MOVE、C-GET、Worklist
DICOM服务说明 DICOM(Digital Imaging and Communications in Medicine)是一种用于处理、存储、打印和传输医学影像的标准。DICOM定义了多种服务类,其中C-STORE、C-FIND、C-MOVE和C-GET是与影像数据查询和检索相关的四个主要服务类ÿ…...
C++发展
目录 编辑C 的发展总结:编辑 1. C 的早期发展(1979-1985) 2. C 标准化过程(1985-1998) 3. C 标准演化(2003-2011) 4. C11(2011年) 5. C14(2014年&a…...
vue3中 组合式~测试深入组件:事件 与 $emit()
一、语法(props) 第一步:在组件模板表达式中,可以直接用$emit()方法触发自定义事件, <!-- MyComponent --> <button click"$emit(someEvent)">Click Me</button> 第二步父组件可以通过 v-on (缩写为 ) 来监听…...
动态规划/贪心算法
一、动态规划 动态规划 是一种用于解决优化问题的算法设计技术,尤其适用于具有重叠子问题和最优子结构性质的问题。它通过将复杂问题分解为更简单的子问题,并保存这些子问题的解以避免重复计算,从而提高效率。 动态规划的核心思想 最优子结…...
python全栈-Linux基础
python全栈-Linux基础 文章目录 Linux安装/配置网络配置配置Linux远程登录配置虚拟机内部ip配置真机的ip安装XShell和Xftp目录结构用户和用户组用户管理添加用户useradd查看用户id修改用户usermod (选项)(参数)用户密码设置passed (选项)(参数)删除用户userdel [选项] 用户名 用…...
基于https虚拟主机配置
一、https介绍 http 明文,80/tcp https 密文,443/tcp 二、安全性保障 1、数据安全性 数据加密 2、数据完整性 3、验证身份的真实性、有效性 三、数据安全性 手段:加密 发送方加密数据,接收方解密数据 对称加密算法 加密、解密数据…...
Kmeans算法来实现RFM指标计算步骤
K-Means(K均值)是一种经典的无监督聚类算法,主要用于将数据集划分为 KKK 个不同的簇(Cluster)。 它基于最小化簇内样本的平方误差,即最小化数据点与簇中心的距离之和。 1. K-Means 算法原理 (1) 主要步骤 …...
LeetCode 1745.分割回文串 IV:动态规划(用III或II能直接秒)
【LetMeFly】1745.分割回文串 IV:动态规划(用III或II能直接秒) 力扣题目链接:https://leetcode.cn/problems/palindrome-partitioning-iv/ 给你一个字符串 s ,如果可以将它分割成三个 非空 回文子字符串,…...
Vue2-3 优雅的在子组件修改父组件传递过来的v-model
在子组件修改父组件传递过来的v-model,这样会破坏单向数据流,造成屎山代码,为了避免这个问题,需要给一个中间层来相对舒服的使用v-model。方法就是用computed去拦截v-model,然后在computed 里面去触发 emit 事件来修改父组件传来的…...
threejs:用着色器给模型添加光带扫描效果
第一步:给模型添加光带 首先创建一个立方体,不进行任何缩放平移操作,也不要set position。 基础代码如下: 在顶点着色器代码里varying vec3 vPosition;vPosition position;获得threejs自动计算的顶点坐标插值(也就…...
1.从0搭建前端Vue项目工程
我们通过vue官方提供的脚手架Vue-cli来快速生成一个Vue的项目模板。 **注意:**需要先安装NodeJS,然后才能安装Vue-cli。 环境准备好了,接下来我们需要通过Vue-cli创建一个vue项目,然后再学习一下vue项目的目录结构。Vue-cli提供了…...
