Linux上用C++和GCC开发程序实现两个不同MySQL实例下单个Schema稳定高效的数据迁移到其它MySQL实例
设计一个在Linux上运行的GCC C++程序,同时连接三个不同的MySQL实例,其中两个实例中分别有两个Schema的表结构分别与第三实例中两个Schema个结构完全相同,同时复制两个实例中两个Schema里的所有表的数据到第三个实例中两个Schema里,使用以下快速高效的方法,加入异常处理,支持每隔固定时间重试一定次数,每张表的复制运行状态和记录条数,开始结束时间戳,运行时间,以及每个批次的运行状态,开始结束时间戳,运行时间,总记录条数都要到运行日志文件里,日志文件全部放在logs目录下,每天一个.log扩展名的文本文件,文件名带日期,所有运行参数写在json配置文件中。
C++解决方案,采用模块化设计并包含详细注释:
该实现结合了C++的高效性和现代C++的特性,同时利用MySQL X DevAPI提供的高性能接口,能够有效处理大规模数据复制需求。
#include <iostream>
#include <fstream>
#include <chrono>
#include <thread>
#include <vector>
#include <map>
#include <mysqlx/xdevapi.h>
#include <nlohmann/json.hpp>
#include <filesystem>
#include <mutex>using namespace std;
using namespace mysqlx;
using json = nlohmann::json;
namespace fs = filesystem;// 配置结构体
struct Config {struct DBConfig {string host;int port;string user;string password;};DBConfig source1;DBConfig source2;DBConfig target;int max_retries = 3;int retry_interval = 60; // secondsmap<string, vector<string>> schema_mapping;
};// 日志管理器类
class Logger {
private:mutex log_mutex;string log_dir = "logs";string get_current_date() {auto now = chrono::system_clock::now();time_t t = chrono::system_clock::to_time_t(now);tm tm = *localtime(&t);char buffer[11];strftime(buffer, sizeof(buffer), "%Y%m%d", &tm);return string(buffer);}public:Logger() {if (!fs::exists(log_dir)) {fs::create_directory(log_dir);}}void log(const string& message) {lock_guard<mutex> lock(log_mutex);ofstream log_file(log_dir + "/" + get_current_date() + ".log",ios::app);auto now = chrono::system_clock::now();time_t t = chrono::system_clock::to_time_t(now);log_file << put_time(localtime(&t), "%Y-%m-%d %H:%M:%S") << " | " << message << endl;}
};// 数据库操作类
class DBOperator {Config& config;Logger& logger;Session connect_db(const Config::DBConfig& db_conf) {try {return Session(db_conf.host, db_conf.port, db_conf.user, db_conf.password);} catch (const Error& e) {logger.log("Connection error: " + string(e.what()));throw;}}public:DBOperator(Config& cfg, Logger& log) : config(cfg), logger(log) {}void copy_table_data(Schema& source_schema, Schema& target_schema,const string& table_name,int batch_size = 1000) {auto start_time = chrono::system_clock::now();string log_prefix = "Table[" + table_name + "] ";try {Table source_table = source_schema.getTable(table_name);Table target_table = target_schema.getTable(table_name);int total_rows = 0;RowResult res = source_table.select("*").execute();while (const Row row = res.fetchOne()) {vector<Row> batch;for (int i = 0; i < batch_size && row; ++i) {batch.push_back(row);total_rows++;if (i < batch_size-1) row = res.fetchOne();}target_table.insert().rows(batch).execute();}auto end_time = chrono::system_clock::now();auto duration = chrono::duration_cast<chrono::milliseconds>(end_time - start_time);logger.log(log_prefix + "SUCCESS | Rows: " + to_string(total_rows) +" | Duration: " + to_string(duration.count()) + "ms");} catch (const Error& e) {logger.log(log_prefix + "ERROR: " + string(e.what()));throw;}}void copy_schema(Session& source_session, Session& target_session,const string& source_schema_name,const string& target_schema_name,const vector<string>& tables) {Schema source_schema = source_session.getSchema(source_schema_name);Schema target_schema = target_session.getSchema(target_schema_name);for (const auto& table : tables) {for (int attempt = 0; attempt < config.max_retries; ++attempt) {try {copy_table_data(source_schema, target_schema, table);break;} catch (...) {if (attempt == config.max_retries-1) {logger.log("Table[" + table + "] FAILED after " + to_string(config.max_retries) + " attempts");}this_thread::sleep_for(chrono::seconds(config.retry_interval));}}}}
};int main(int argc, char** argv) {try {// 加载配置文件ifstream config_file("config.json");json config_json = json::parse(config_file);Config config;config.source1 = config_json["source1"];config.source2 = config_json["source2"];config.target = config_json["target"];config.schema_mapping = config_json["schema_mapping"];Logger logger;DBOperator db_operator(config, logger);// 连接数据库Session source1 = db_operator.connect_db(config.source1);Session source2 = db_operator.connect_db(config.source2);Session target = db_operator.connect_db(config.target);// 执行复制任务for (const auto& [source_schema, target_schema] : config.schema_mapping) {vector<string> tables = config.schema_mapping[source_schema];// 从第一个源复制db_operator.copy_schema(source1, target, source_schema, target_schema, tables);// 从第二个源复制db_operator.copy_schema(source2, target, source_schema, target_schema, tables);}} catch (const exception& e) {cerr << "Fatal error: " << e.what() << endl;return 1;}return 0;
}
配置文件示例 (config.json):
{"source1": {"host": "source1.example.com","port": 3306,"user": "user","password": "password"},"source2": {"host": "source2.example.com","port": 3307,"user": "user","password": "password"},"target": {"host": "target.example.com","port": 3308,"user": "user","password": "password"},"max_retries": 3,"retry_interval": 60,"schema_mapping": {"source_schema1": ["table1", "table2"],"source_schema2": ["table3", "table4"]}
}
关键特性说明:
- 配置管理:
- 使用JSON配置文件存储数据库连接参数和复制参数
- 支持灵活的模式映射配置
- 可配置重试策略和批量大小
- 日志系统:
- 自动创建日志目录
- 按天滚动日志文件
- 详细记录每个操作的元数据
- 线程安全的日志写入
- 数据复制:
- 使用MySQL X DevAPI进行高效数据操作
- 批量插入机制提升性能
- 自动重试机制和错误隔离
- 表级并行复制(可扩展)
- 异常处理:
- 多级异常捕获机制
- 连接失败自动重试
- 数据操作错误隔离
- 资源自动释放保障
- 扩展性:
- 模块化设计便于功能扩展
- 支持动态表列表配置
- 可扩展的多线程支持
编译运行:
# 安装依赖
sudo apt-get install libmysqlcppconn-dev nlohmann-json3-dev# 编译
g++ -std=c++17 -o db_sync main.cpp -lmysqlcppconn8 -lpthread# 运行
./db_sync
建议的优化扩展方向:
- 并行处理:
- 使用线程池实现表级并行复制
- 异步IO提升吞吐量
- 连接池管理数据库连接
- 监控增强:
- 实时进度报告
- Prometheus指标导出
- 健康检查端点
- 高级功能:
- 增量复制支持
- 模式校验机制
- 数据一致性校验
- 自动断点续传
- 部署优化:
- Docker容器化封装
- Systemd服务集成
- 配置热加载支持
相关文章:
Linux上用C++和GCC开发程序实现两个不同MySQL实例下单个Schema稳定高效的数据迁移到其它MySQL实例
设计一个在Linux上运行的GCC C程序,同时连接三个不同的MySQL实例,其中两个实例中分别有两个Schema的表结构分别与第三实例中两个Schema个结构完全相同,同时复制两个实例中两个Schema里的所有表的数据到第三个实例中两个Schema里,使…...
Lua的table(表)
Lua表的基本概念 Lua中的表(table)是一种多功能数据结构,可以用作数组、字典、集合等。表是Lua中唯一的数据结构机制,其他数据结构如数组、列表、队列等都可以通过表来实现。 表的实现 Lua的表由两部分组成: 数组部分…...
51页精品PPT | 农产品区块链溯源信息化平台整体解决方案
PPT展示了一个基于区块链技术的农产品溯源信息化平台的整体解决方案。它从建设背景和需求分析出发,强调了农产品质量安全溯源的重要性以及国际国内的相关政策要求,指出了食品安全问题在流通环节中的根源。方案提出了全面感知、责任到人、定期考核和追溯反…...
Jenkins 自动打包项目镜像部署到服务器 ---(前端项目)
Jenkins 新增前端项目Job 指定运行的节点 选择部署运行的节点标签,dev标签对应开发环境 节点的远程命令执行配置 jenkins完整流程 配置源码 拉取 Credentials添加 触发远程构建 配置后可以支持远程触发jenkins构建(比如自建的CICD自动化发布平台&…...
使用AoT让.NetFramework4.7.2程序调用.Net8编写的库
1、创建.Net8的库,双击解决方案中的项目,修改如下,启用AoT: <Project Sdk"Microsoft.NET.Sdk"><PropertyGroup><OutputType>Library</OutputType><PublishAot>true</PublishAot>&…...
第49天:Web开发-JavaEE应用SpringBoot栈模版注入ThymeleafFreemarkerVelocity
#知识点 1、安全开发-JavaEE-开发框架-SpringBoot&路由&传参 2、安全开发-JavaEE-模版引擎-Thymeleaf&Freemarker&Velocity 一、开发框架-SpringBoot 参考:https://springdoc.cn/spring-boot/ 访问SpringBoot创建的网站 1、路由映射 RequestMapping…...
学习笔记08——ConcurrentHashMap实现原理及源码解析
1. 概述 为什么需要ConcurrentHashMap? 解决HashMap线程不安全问题:多线程put可能导致死循环(JDK7)、数据覆盖(JDK8) 优化HashTable性能:通过细粒度锁替代全局锁,提高并发度 对比…...
数据集笔记:NUSMods API
1 介绍 NUSMods API 包含用于渲染 NUSMods 的数据。这些数据包括新加坡国立大学(NUS)提供的课程以及课程表的信息,还包括上课地点的详细信息。 可以使用并实验这些数据,它们是从教务处提供的官方 API 中提取的。 该 API 由静态的…...
SpringBoot新闻推荐系统设计与实现
随着信息时代的快速发展,新闻推荐系统成为用户获取个性化内容的重要工具。本文将介绍一个幽络源的基于SpringBoot开发的新闻推荐系统,该系统功能全面,操作简便,能够满足管理员和用户的多种需求。 管理员模块 管理员模块为系统管…...
谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
去年 12 月,谷歌推出了 PaliGemma 2 ,这是Gemma系列中的升级版视觉语言模型。该版本包含不同大小(3B、10B 和 28B 参数)的预训练检查点,可轻松针对各种视觉语言任务和领域进行微调,例如图像分割、短视频字幕…...
深入浅出Spring Boot框架:从入门到精通
引言 在现代软件开发中,Java 语言及其生态系统一直是构建企业级应用的首选之一。Spring Boot 是 Java 社区中最具影响力的项目之一,它继承了 Spring 框架的优点,并通过简化配置和加速开发流程,使得开发者能够更加专注于业务逻辑的…...
Spring Boot spring-boot-maven-plugin 参数配置详解
一 spring-boot-maven-plugin 插件的5个Goals spring-boot:repackage,默认goal。在mvn package之后,再次打包可执行的jar/war,同时保留mvn package生成的jar/war为.origin;重新打包存在的jar或者war包从而使他们可以在命令行使用…...
linux中断调用流程(arm)
文章目录 ARM架构下Linux中断处理全流程解析:从硬件触发到驱动调用 ⚡**一、中断触发与硬件层响应** 🔌**1. 设备触发中断** 📡 **二、CPU阶段:异常入口与上下文处理** 🖥️**1. 异常模式切换** 🔄**2. 跳转…...
考研复试问题总结-数据结构(1)
1. 说一下你对数据结构的理解 我觉得数据结构不仅仅是存数据的“容器”,更是一种思维方式。其实,在我们写程序时,经常会遇到各种各样的数据操作需求,而不同的数据结构能解决问题的效率和方式都不一样,所以选择合适的数…...
250301-OpenWebUI配置DeepSeek-火山方舟+硅基流动+联网搜索+推理显示
A. 最终效果 B. 火山方舟配置(一定要点击添加) C. 硅基流动配置(最好要点击添加,否则会自动弹出所有模型) D. 联网搜索配置 E. 推理过程显示 默认是没有下面的推理过程的显示的 设置步骤: 在Functions函…...
RuoYi框架介绍,以及如何基于Python使用RuoYi框架
若依框架(RuoYi)是一款基于Spring Boot和Vue.js的开源快速开发平台,广泛应用于企业级应用开发。它提供了丰富的功能模块和代码生成工具,帮助开发者快速搭建后台管理系统。 主要特点 前后端分离:前端采用Vue.js&#x…...
【算法】图论 —— Floyd算法 python
洛谷 B3647 【模板】Floyd 题目描述 给出一张由 n n n 个点 m m m 条边组成的无向图。 求出所有点对 ( i , j ) (i,j) (i,j) 之间的最短路径。 输入格式 第一行为两个整数 n , m n,m n,m,分别代表点的个数和边的条数。 接下来 m m m 行,每行三…...
2.数据结构:2.最大异或对
数据结构 2.数据结构:1.Tire 字符串统计 当前题 最大异或对 #include<algorithm> #include<cstring> #include<iostream>using namespace std;const int N100010,M31*N;// M 表示节点个数,每一个数最多有 31 位int n; int a[N]; i…...
剑指 Offer II 031. 最近最少使用缓存
comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20031.%20%E6%9C%80%E8%BF%91%E6%9C%80%E5%B0%91%E4%BD%BF%E7%94%A8%E7%BC%93%E5%AD%98/README.md 剑指 Offer II 031. 最近最少使用缓存 题目描述 运用所掌握的…...
Windows 11【1001问】查看Windows 11 版本的18种方法
随着技术的飞速发展,操作系统作为连接硬件与软件的核心桥梁,其版本管理和更新变得尤为重要。对于用户而言,了解自己设备上运行的具体Windows 11版本不仅有助于优化系统性能,还能确保安全性和兼容性。然而,不同场景和需…...
小程序性能优化-预加载
在微信小程序中,数据预加载是提升用户体验的重要优化手段。以下是处理数据预加载的完整方案: 一、预加载的适用场景 跳转页面前的数据准备 如从列表页进入详情页前,提前加载详情数据首屏加载后的空闲时间 在首页加载完成后,预加载…...
vue3中展示markdown格式文章的三种形式
一、安装 # 使用 npm npm i kangc/v-md-editor -S# 使用yarn yarn add kangc/v-md-editor二、三种实现形式 1、编辑器的只读模式 main.ts文件中配置: import VMdEditor from kangc/v-md-editor; import kangc/v-md-editor/lib/style/base-editor.css;const app …...
(视频教程)Compass代谢分析详细流程及python版-R语言版下游分析和可视化
不想做太多的前情解说了,有点累了,做了很久的内容,包括整个分析,从软件安装和报错解决到后期下游python版-R语言版下游分析和可视化!单细胞代谢分析我们写过很多了,唯独少了最“高级”的compass,…...
文件描述符与重定向
1. open系统调用 在 Linux 中, open() 系统调用用于打开一个文件或设备,并返回一个文件描述符,通过该描述符可以进行文件读写操作。open() 可以用于创建新文件或打开已存在的文件,具体行为取决于传递给它的参数。 需要包含的头文件…...
为什么深度学习选择Tensor而非NumPy数组?核心优势深度解析
简短总结: 支持 GPU 加速:Tensor 提供对 GPU 的原生支持,能够有效加速计算,而 NumPy 则通常只能在 CPU 上运行。支持自动求导:深度学习模型的训练依赖于参数的优化,而 Tensor 提供了自动求导功能ÿ…...
python把html网页转换成pdf标题没有乱码,正文都乱码
在使用Python将HTML网页转换成PDF时,遇到标题没有乱码但正文乱码的问题,通常是由于字符编码处理不当或字体支持问题导致的。以下是一些可能的原因和解决方案: 原因分析 字符编码不匹配: HTML文件的编码与PDF转换工具或库所使用的…...
基于fast-whisper模型的语音识别工具的设计与实现
目录 摘 要 第1章 绪 论 1.1 论文研究主要内容 1.1.1模型类型选择 1.1.2开发语言的选择 1.2 国内外现状 第2章 关键技术介绍 2.1 关键性开发技术的介绍 2.1.1 Faster-Whisper数据模型 2.1.2 Django 第3章 系统分析 3.1 构架概述 3.1.1 功能构架 3.1.2 模块需求描述 3.2 系统开…...
详解:事务注解 @Transactional
创作内容丰富的干货文章很费心力,感谢点过此文章的读者,点一个关注鼓励一下作者,激励他分享更多的精彩好文,谢谢大家! Transactional 是 Spring Framework 中常用的注解之一,它可以被用于管理事务。通过使用…...
场内、场外期权怎么开户?期权佣金是多少?
期权交易需要一定的知识和经验,以有效管理风险和制定策略。 场内期权开户(以50ETF为例) 场内期权开户的各种方式大差不差,咱们就先以50ETF期权为例子看下。 场内期权开户条件包括: 首先是资金的要求,50万…...
Linux:进程概念
目录 1 冯诺依曼体系 2 操作系统(Operator System) 3 如何理解管理 3.1计算机管理硬件 3.2 管理逻辑图 3.3 怎样管理 4 什么是进程? 5 查看进程 5.1 ps ajx显示所有进程信息 5.2 /proc(内存文件系统) 5.2.1 ls /proc/PID 5.2.2 ls /proc/PID -al 5…...
