当前位置: 首页 > article >正文

数据库分库分表:策略设计与实现

数据库分库分表策略设计与实现核心概念随着业务增长单库单表会成为性能瓶颈。分库分表是一种水平扩展方案通过将数据分散到多个数据库或表中提高系统的吞吐量和可用性。分库分表策略1. 垂直分库// 垂直分库按业务模块划分 // 用户库 Configuration public class UserDataSourceConfig { Bean ConfigurationProperties(spring.datasource.user) public DataSource userDataSource() { return DataSourceBuilder.create().build(); } Bean public JdbcTemplate userJdbcTemplate(Qualifier(userDataSource) DataSource dataSource) { return new JdbcTemplate(dataSource); } } // 订单库 Configuration public class OrderDataSourceConfig { Bean ConfigurationProperties(spring.datasource.order) public DataSource orderDataSource() { return DataSourceBuilder.create().build(); } Bean public JdbcTemplate orderJdbcTemplate(Qualifier(orderDataSource) DataSource dataSource) { return new JdbcTemplate(dataSource); } } // 多数据源配置 Configuration public class MultiDataSourceConfig { Bean public DataSource routingDataSource( Qualifier(userDataSource) DataSource userDataSource, Qualifier(orderDataSource) DataSource orderDataSource) { MapObject, Object dataSources new HashMap(); dataSources.put(user, userDataSource); dataSources.put(order, orderDataSource); AbstractRoutingDataSource routingDataSource new AbstractRoutingDataSource(); routingDataSource.setTargetDataSources(dataSources); routingDataSource.setDefaultTargetDataSource(userDataSource); return routingDataSource; } }2. 水平分表// 水平分表按用户 ID 哈希分表 public class UserShardingStrategy { private static final int TABLE_COUNT 16; public static String getTableName(Long userId) { int tableIndex userId.hashCode() % TABLE_COUNT; return user_ String.format(%02d, tableIndex); } public static String getTableName(String userId) { int hash userId.hashCode(); int tableIndex Math.abs(hash) % TABLE_COUNT; return user_ String.format(%02d, tableIndex); } } // 分表查询服务 Service public class ShardedUserService { private final JdbcTemplate jdbcTemplate; public ShardedUserService(JdbcTemplate jdbcTemplate) { this.jdbcTemplate jdbcTemplate; } public User findById(Long userId) { String tableName UserShardingStrategy.getTableName(userId); String sql SELECT * FROM tableName WHERE id ?; return jdbcTemplate.queryForObject(sql, new Object[]{userId}, new UserRowMapper()); } public void save(User user) { String tableName UserShardingStrategy.getTableName(user.getId()); String sql INSERT INTO tableName (id, name, email) VALUES (?, ?, ?); jdbcTemplate.update(sql, user.getId(), user.getName(), user.getEmail()); } }3. 范围分片// 范围分片按时间范围划分 public class OrderRangeSharding { public static String getTableName(LocalDateTime orderTime) { int year orderTime.getYear(); int month orderTime.getMonthValue(); return String.format(order_%d_%02d, year, month); } public static ListString getTableNames(LocalDateTime startTime, LocalDateTime endTime) { ListString tableNames new ArrayList(); LocalDateTime current startTime; while (!current.isAfter(endTime)) { tableNames.add(getTableName(current)); current current.plusMonths(1); } return tableNames; } } // 范围分片查询 Service public class OrderRangeQueryService { private final JdbcTemplate jdbcTemplate; public OrderRangeQueryService(JdbcTemplate jdbcTemplate) { this.jdbcTemplate jdbcTemplate; } public ListOrder findByTimeRange(LocalDateTime startTime, LocalDateTime endTime) { ListString tableNames OrderRangeSharding.getTableNames(startTime, endTime); ListOrder orders new ArrayList(); for (String tableName : tableNames) { String sql SELECT * FROM tableName WHERE order_time ? AND order_time ?; ListOrder result jdbcTemplate.query(sql, new Object[]{startTime, endTime}, new OrderRowMapper()); orders.addAll(result); } return orders.stream() .sorted(Comparator.comparing(Order::getOrderTime)) .collect(Collectors.toList()); } }4. 一致性哈希// 一致性哈希分片 public class ConsistentHashSharding { private final TreeMapLong, String hashRing new TreeMap(); private final int virtualNodes 100; public ConsistentHashSharding(ListString nodes) { for (String node : nodes) { for (int i 0; i virtualNodes; i) { long hash hash(node _ i); hashRing.put(hash, node); } } } private long hash(String key) { return Math.abs(key.hashCode()); } public String getNode(String key) { if (hashRing.isEmpty()) { throw new IllegalStateException(No nodes available); } long hash hash(key); Map.EntryLong, String entry hashRing.ceilingEntry(hash); if (entry null) { entry hashRing.firstEntry(); } return entry.getValue(); } public String getTableName(String key) { String node getNode(key); return table_ node; } } // 使用一致性哈希 Service public class ConsistentHashService { private final ConsistentHashSharding sharding; public ConsistentHashService() { ListString nodes Arrays.asList(node01, node02, node03, node04); this.sharding new ConsistentHashSharding(nodes); } public String getTargetTable(Long userId) { return sharding.getTableName(String.valueOf(userId)); } }ShardingSphere 集成// ShardingSphere 配置 Configuration public class ShardingSphereConfig { Bean public DataSource dataSource() throws SQLException { ShardingRuleConfiguration shardingRuleConfig new ShardingRuleConfiguration(); // 添加数据源 MapString, DataSource dataSourceMap new HashMap(); dataSourceMap.put(ds0, createDataSource(jdbc:mysql://localhost:3306/ds0)); dataSourceMap.put(ds1, createDataSource(jdbc:mysql://localhost:3306/ds1)); // 配置分库策略 shardingRuleConfig.setDefaultDatabaseShardingStrategyConfig( new StandardShardingStrategyConfiguration( user_id, new ModuloShardingAlgorithm() ) ); // 配置分表策略 ShardingTableRuleConfiguration tableRuleConfig new ShardingTableRuleConfiguration(t_order); tableRuleConfig.setActualDataNodes(ds${0..1}.t_order_${0..3}); tableRuleConfig.setTableShardingStrategyConfig( new StandardShardingStrategyConfiguration( order_id, new ModuloShardingAlgorithm() ) ); shardingRuleConfig.getTableRuleConfigs().add(tableRuleConfig); return ShardingDataSourceFactory.createDataSource(dataSourceMap, shardingRuleConfig, new Properties()); } private DataSource createDataSource(String url) { HikariDataSource dataSource new HikariDataSource(); dataSource.setJdbcUrl(url); dataSource.setUsername(root); dataSource.setPassword(password); return dataSource; } } // 自定义分片算法 public class CustomShardingAlgorithm implements StandardShardingAlgorithmLong { Override public String doSharding(CollectionString availableTargetNames, ShardingValueLong shardingValue) { Long value shardingValue.getValue(); int index (int) (value % availableTargetNames.size()); return availableTargetNames.stream() .sorted() .skip(index) .findFirst() .orElseThrow(() - new IllegalArgumentException(No available targets)); } Override public void init() { } Override public String getType() { return CUSTOM; } }分布式 ID 生成// 雪花算法 ID 生成器 Component public class SnowflakeIdGenerator { private final long epoch 1609459200000L; // 2021-01-01 00:00:00 private final long workerIdBits 5L; private final long datacenterIdBits 5L; private final long sequenceBits 12L; private final long maxWorkerId ~(-1L workerIdBits); private final long maxDatacenterId ~(-1L datacenterIdBits); private final long workerIdShift sequenceBits; private final long datacenterIdShift sequenceBits workerIdBits; private final long timestampLeftShift sequenceBits workerIdBits datacenterIdBits; private final long sequenceMask ~(-1L sequenceBits); private long workerId; private long datacenterId; private long sequence 0L; private long lastTimestamp -1L; public SnowflakeIdGenerator() { this.workerId getWorkerId(); this.datacenterId getDatacenterId(); if (workerId maxWorkerId || workerId 0) { throw new IllegalArgumentException(Worker ID out of range); } if (datacenterId maxDatacenterId || datacenterId 0) { throw new IllegalArgumentException(Datacenter ID out of range); } } public synchronized long nextId() { long timestamp timeGen(); if (timestamp lastTimestamp) { throw new RuntimeException(Clock moved backwards); } if (timestamp lastTimestamp) { sequence (sequence 1) sequenceMask; if (sequence 0) { timestamp tilNextMillis(lastTimestamp); } } else { sequence 0L; } lastTimestamp timestamp; return ((timestamp - epoch) timestampLeftShift) | (datacenterId datacenterIdShift) | (workerId workerIdShift) | sequence; } private long timeGen() { return System.currentTimeMillis(); } private long tilNextMillis(long lastTimestamp) { long timestamp timeGen(); while (timestamp lastTimestamp) { timestamp timeGen(); } return timestamp; } private long getWorkerId() { // 从环境变量或配置中心获取 worker ID String workerIdStr System.getenv(WORKER_ID); return workerIdStr ! null ? Long.parseLong(workerIdStr) : 1L; } private long getDatacenterId() { // 从环境变量或配置中心获取 datacenter ID String datacenterIdStr System.getenv(DATACENTER_ID); return datacenterIdStr ! null ? Long.parseLong(datacenterIdStr) : 1L; } } // 使用分布式 ID Service public class OrderService { private final SnowflakeIdGenerator idGenerator; private final OrderRepository orderRepository; public OrderService(SnowflakeIdGenerator idGenerator, OrderRepository orderRepository) { this.idGenerator idGenerator; this.orderRepository orderRepository; } public Order createOrder(OrderCreateRequest request) { Order order new Order(); order.setId(idGenerator.nextId()); order.setUserId(request.getUserId()); order.setProductId(request.getProductId()); order.setQuantity(request.getQuantity()); order.setStatus(PENDING); return orderRepository.save(order); } }跨分片查询// 跨分片查询服务 Service public class CrossShardQueryService { private final JdbcTemplate jdbcTemplate; public CrossShardQueryService(JdbcTemplate jdbcTemplate) { this.jdbcTemplate jdbcTemplate; } public ListUserOrderStats getUserOrderStats(Long userId) { String sql SELECT u.id as user_id, u.name as user_name, COUNT(o.id) as order_count, SUM(o.amount) as total_amount FROM user_00 u LEFT JOIN order_00 o ON u.id o.user_id WHERE u.id ? UNION ALL SELECT u.id as user_id, u.name as user_name, COUNT(o.id) as order_count, SUM(o.amount) as total_amount FROM user_01 u LEFT JOIN order_01 o ON u.id o.user_id WHERE u.id ? UNION ALL -- ... 其他分片 ; return jdbcTemplate.query(sql, new Object[]{userId, userId}, new UserOrderStatsRowMapper()); } public ListUserOrderStats aggregateResults(ListUserOrderStats results) { return results.stream() .collect(Collectors.groupingBy( UserOrderStats::getUserId, Collectors.collectingAndThen( Collectors.toList(), list - { UserOrderStats aggregated new UserOrderStats(); aggregated.setUserId(list.get(0).getUserId()); aggregated.setUserName(list.get(0).getUserName()); aggregated.setOrderCount(list.stream().mapToLong(UserOrderStats::getOrderCount).sum()); aggregated.setTotalAmount(list.stream().mapToBigDecimal(UserOrderStats::getTotalAmount).sum()); return aggregated; } ) )) .values() .stream() .collect(Collectors.toList()); } }数据迁移// 数据迁移服务 Service public class DataMigrationService { private final JdbcTemplate sourceJdbcTemplate; private final JdbcTemplate targetJdbcTemplate; public DataMigrationService( Qualifier(sourceJdbcTemplate) JdbcTemplate sourceJdbcTemplate, Qualifier(targetJdbcTemplate) JdbcTemplate targetJdbcTemplate) { this.sourceJdbcTemplate sourceJdbcTemplate; this.targetJdbcTemplate targetJdbcTemplate; } public void migrateUsers(int batchSize) { String sourceSql SELECT * FROM user ORDER BY id LIMIT ?, ?; int offset 0; while (true) { ListUser users sourceJdbcTemplate.query( sourceSql, new Object[]{offset, batchSize}, new UserRowMapper() ); if (users.isEmpty()) { break; } for (User user : users) { String targetTable UserShardingStrategy.getTableName(user.getId()); String insertSql INSERT INTO targetTable (id, name, email, created_at) VALUES (?, ?, ?, ?); targetJdbcTemplate.update( insertSql, user.getId(), user.getName(), user.getEmail(), user.getCreatedAt() ); } offset batchSize; System.out.println(Migrated offset users); } } }最佳实践选择合适的分片键选择查询频率高、分布均匀的字段作为分片键避免跨分片查询尽量在单分片内完成查询使用分布式事务使用分布式事务协调器处理跨分片事务监控分片状态实时监控各分片的负载和健康状态预留扩展空间设计时考虑未来的扩展需求数据预热在上线前进行数据迁移和预热回滚方案准备好数据回滚方案实际应用场景电商订单系统按时间或用户 ID 分片社交平台按用户 ID 分片日志系统按时间分片数据分析按数据类型分片总结分库分表是解决大数据量场景下数据库性能瓶颈的有效方案。通过合理选择分片策略可以显著提高系统的吞吐量和可用性。在实际应用中需要根据业务特点选择合适的分片方案并做好数据迁移和监控工作。别叫我大神叫我 Alex 就好。这其实可以更优雅一点合理的分片策略让数据库扩展变得更加灵活和高效。

相关文章:

数据库分库分表:策略设计与实现

数据库分库分表:策略设计与实现 核心概念 随着业务增长,单库单表会成为性能瓶颈。分库分表是一种水平扩展方案,通过将数据分散到多个数据库或表中,提高系统的吞吐量和可用性。 分库分表策略 1. 垂直分库 // 垂直分库&#xf…...

Java 响应式编程:Reactor 框架深度解析

Java 响应式编程:Reactor 框架深度解析 核心概念 响应式编程是一种编程范式,关注数据的异步流和变化传播。在 Java 中,Reactor 框架提供了强大的响应式编程支持,基于 Reactive Streams 规范实现。 Reactor 核心组件 Mono&#xff…...

ComfyUI-Manager终极指南:轻松管理您的AI绘画工作流节点

ComfyUI-Manager终极指南:轻松管理您的AI绘画工作流节点 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various cus…...

基于LLM与向量数据库构建个人知识管理智能代理:从原理到实践

1. 项目概述:一个面向个人知识管理的智能代理 最近在折腾个人知识管理(PKM)系统,发现了一个挺有意思的开源项目: lessthanno/engram-agent 。简单来说,这是一个“记忆代理”,它旨在成为你数字…...

为什么选择QtScrcpy?3大突破性特性让Android投屏焕然一新

为什么选择QtScrcpy?3大突破性特性让Android投屏焕然一新 【免费下载链接】QtScrcpy Android real-time display control software 项目地址: https://gitcode.com/GitHub_Trending/qt/QtScrcpy QtScrcpy是一款基于Qt框架开发的Android设备实时投屏控制软件&…...

基于Tauri+React+TS构建跨平台开发者效率工具:集成AI编程与Git Worktree

1. 项目概述:一个为现代开发者打造的桌面效率工具 如果你和我一样,每天的工作流都离不开终端、代码编辑器和各种AI助手,那你一定也经历过这种场景:在多个项目间频繁切换,终端里塞满了十几个标签页,想找个昨…...

一文扫盲人工智能全体系,从入门到进阶,新手也能不迷路

文章目录前言一、先搞懂:AI到底是个啥?别再把大模型当AI全部了1.1 从“假智能”到“真智能”:神经网络的革命1.2 AI的三大发展阶段:从弱人工智能到超人工智能二、AI核心技术栈拆解:从基础到进阶,一层一层讲…...

CANN/atvoss Muls算子样例

Muls算子样例 【免费下载链接】atvoss ATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 项目地址: h…...

为OpenClaw智能体工作流配置Taotoken作为可靠模型供应商

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为OpenClaw智能体工作流配置Taotoken作为可靠模型供应商 在构建基于OpenClaw的智能体工作流时,一个稳定、可管理的模型…...

大模型API聚合服务:一站式解决多模型接入难题

1. 项目概述:一站式大模型API聚合服务如果你正在开发一个需要集成多种大语言模型的应用,比如一个智能客服系统、一个内容创作工具,或者一个AI研究平台,那么你大概率会遇到一个非常现实的问题:对接不同厂商的API&#x…...

CANN/triton-ge-backend性能调优方法论

性能调优方法论 【免费下载链接】triton-inference-server-ge-backend ge-backend基于triton inference server框架实现对接NPU生态,快速实现传统CV\NLP等模型的服务化。 项目地址: https://gitcode.com/cann/triton-inference-server-ge-backend 模型优化有…...

AI算法在多市场环境下的合谋机制与市场分配策略研究

1. 项目概述:当AI成为市场中的“隐形玩家”最近几年,我身边不少做量化交易、电商定价或者供应链优化的朋友,都开始频繁地讨论一个话题:我们部署的AI优化算法,会不会在不知不觉中“串通”起来,形成一种新型的…...

开源项目赞助管理平台Sponsio:自托管部署与核心架构解析

1. 项目概述:SponsioLabs/Sponsio 是什么?如果你在开源社区里泡过一段时间,肯定对“用爱发电”这个词不陌生。开发者们投入大量时间、精力,甚至金钱,维护一个项目,却常常面临一个现实问题:如何获…...

Animal-AI环境:用AI复现动物认知实验的虚拟实验室

1. 项目概述:当AI遇见动物智能最近几年,AI领域最激动人心的进展之一,就是智能体(Agent)在复杂环境中的决策与学习能力。从AlphaGo到AlphaStar,再到各种游戏AI,我们见证了算法在特定规则下的卓越…...

数字孪生如何破解AI预测性维护的可解释性与泛化难题

1. 项目概述:当数字孪生遇见AI预测性维护在工业界摸爬滚打十几年,我亲眼见证了维护策略从“坏了再修”到“定期保养”,再到如今炙手可热的“预测性维护”的演进。预测性维护(Predictive Maintenance, PMx)的核心愿景很…...

10x-Agent-Loop:突破AI编程助手配额限制的智能缓存与调度方案

1. 项目概述与核心价值最近在开发者社区里,一个名为“10x-Agent-Loop”的工具讨论热度挺高。简单来说,它瞄准了一个非常具体的痛点:当你深度依赖像Cursor或Windsurf这类AI编程助手时,经常会遇到一个天花板——请求配额限制。无论是…...

ATB RingMLA C++示例

加速库RingMLA C Demo 【免费下载链接】ascend-transformer-boost 本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。 项目地址: https://gitcode.com/cann/ascend-transf…...

Python 爬虫高级实战:网盘资源信息批量爬虫开发

前言 在互联网资源分发场景中,网盘已成为文档、教程、软件、影视、学习资料等资源的核心存储与分发载体。海量公开网盘资源分散在各类资源站点、论坛、分享页面中,依靠人工逐条检索、整理链接效率极低,且难以实现批量汇总、分类归档与失效链接筛查。依托 Python 开发网盘资…...

艺术史视角下的生成式AI审美:从风格谱系到技术认知的深度解析

1. 项目概述:当艺术史遇见生成式AI最近和几位做艺术策展的朋友聊天,他们都在抱怨同一个问题:现在用AI生成的“艺术品”越来越多,但很多作品看起来就是一堆流行元素的拼贴,缺乏真正的“灵魂”。这让我开始思考一个更深层…...

泊松分布实战指南:从原理到异常检测的工程落地

1. 什么是泊松分布?——一个数据从业者每天都在用、却未必真正吃透的概率工具你有没有算过,过去一小时里你的邮箱收到了几封新邮件?上个月车间里产线上出现了几个次品?过去24小时网站服务器收到了多少次API请求?这些数…...

Fortran学习笔记

这是我之前学习Fortran时做到笔记,分享出来当个备份!Fortran是一门非常古老的编程语言,但是至今依然有人在使用。建议利用闲暇时间学习!1、编译命令: g95 –c a.f90:将a.f90编译为名为a.o的目标文件。 g95 h.f90&#…...

AI跨学科扩散62年文献计量分析:从计算机科学到生物医学、社会科学的融合路径与未来趋势

1. 项目概述:从海量文献中洞察AI的融合之路最近几年,AI(人工智能)这个词几乎无处不在,从写代码到画图,从自动驾驶到药物研发,它像水银泻地一样渗透进各个角落。但你是否想过,这种“渗…...

网络异质性如何影响AI竞赛中的安全与创新平衡

1. 项目概述:一场关于“网络生态”的AI竞赛 最近和几个做AI安全的朋友聊天,大家不约而同地提到了一个现象:现在很多AI竞赛,无论是安全攻防赛还是创新应用赛,参赛团队的背景越来越“杂”。你可能会遇到一支队伍&#xf…...

Poetry依赖管理:用SAT求解器终结Python版本冲突

1. 为什么我三年前就停用 pip venv,转而把 Poetry 当成 Python 项目的“呼吸系统”你有没有经历过这样的深夜:凌晨两点,服务器上一个本该稳如老狗的 Flask API 突然报ImportError: cannot import name AsyncGenerator;你翻遍代码…...

深度学习超分辨率技术加速SEM材料表征:原理、实践与16倍效率提升

1. 项目概述:当深度学习遇见扫描电镜在材料科学的研究一线,尤其是金属微观结构分析领域,扫描电子显微镜(SEM)是我们观察材料“内在世界”的得力工具。然而,一个长期困扰我们的矛盾是:高分辨率与…...

OpenClaw安全审计:AI驱动的自动化配置检查与隐私保护实践

1. 项目概述与核心价值 最近在折腾我的 OpenClaw 机器人,这玩意儿功能是越来越强大了,能接各种消息渠道,还能调用五花八门的工具。但功能一多,配置就复杂,安全问题也跟着冒头。比如,你是不是也担心过 API 密…...

基于MCP协议构建AI与Telegram的智能连接桥梁

1. 项目概述:一个连接AI与即时通讯的桥梁 最近在折腾AI应用开发,特别是想让大语言模型(LLM)能直接操作外部工具,比如发个消息、查个天气。这让我接触到了 Model Context Protocol ,也就是MCP。简单来说&…...

Claude Code用户如何配置Taotoken解决密钥不稳定与额度不足问题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Claude Code用户如何配置Taotoken解决密钥不稳定与额度不足问题 1. 理解Claude Code的API配置机制 Claude Code作为一款编程辅助工…...

基于角色的AI能力框架:重塑工程教育中的人机协作新范式

1. 项目概述:当AI遇见工程教育,我们需要怎样的“角色”?最近和几位在高校任教的朋友聊天,他们不约而同地提到了一个共同的困惑:ChatGPT、Copilot这些工具,学生们用得很溜,但老师们却有点“跟不上…...

CANN/hixl LLM集群信息文档

LLMClusterInfo 【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl 产品支持情况 产品是否支持A…...