当前位置：首页 > news >正文

5 分布式ID

news 2026/4/12 13:11:35

这里讲一个比较常用的分布式防重复的ID生成策略，雪花算法

一个用户体量比较大的分布式系统必然伴随着分表分库，分机房部署，单体的部署方式肯定是承载不了这么大的体量。

雪花算法的结构说明

如下图所示:
在这里插入图片描述

雪花算法组成

从上图我们可以看出来雪花算法是64bit位的long类型的数值型的id。其中由4部分组成。

1bit为固定为0，表明生成的id为正数。

41bit位毫秒级的时间戳(可保留69年的时间戳)

标识位为10位，由5位的机器id和5位的服务id组成。5bit位能标识32个数值，32*32=1024 共能表示1024个数值，也就是说我们部署的服务可以水平扩展至1024个实例部署。在国内的应用中基本上是够用了。

12位的序列号位，表示同一个实例在1毫秒内能生成4096个序列，基本上也是够用了。

如果按照水平扩展应用还不能够承载我们的体量，我们可以对上面的组成进行改造。比如我们一个应用实例不会在1毫秒生成4096个数值，我们可以把时间戳的值改成35位，把6个bit均分到机器id和服务id上，也就是说我们可以部署256*256=65536个实例。

雪花算法的具体实现代码如下:

/*** 雪花算法工具类* 64位long类型的= 第一位0表示为正数 + 1到41的时间戳 + 5位的数据中心id + 5位的机器id + 12位的序列号* @author yusong* @20241111*/
public class SnowflakeIdWorkerUtil {//开始时间戳 2025-01-01=1735660800000Lprivate final long startTime = 1731400000000L;//数据中心所占雪花算法数据的位数private final long datacenterIdBits = 5L;//机器号所占雪花算法的位数private final long workerIdBits = 5L;
//    //支持最大的数据中心 结果为31
//    private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
//    //支持最大的机器编号 结果为31
//    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);//同一时间戳生成的序列号所占位数private final long sequenceBits = 12L;//机器号左移位数=序列号的位数 = 12private final long workerIdShift = sequenceBits;//数据中心左移位数= 序列号的位数 + 机器号的位数 = 17private final long datacenterIdShift = sequenceBits + workerIdBits;//时间戳左移位数= 序列号的位数 + 机器号的位数 + 数据中心位数 = 22private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;//生成序列号的最大数=4095private final long sequenceMask = -1L ^ (-1L << sequenceBits);//数据中心编号private long datacenterId;//机器号private long workerId;//毫秒内序列从0开始private long sequence = 0L;//上次生成ID的时间截private long lastTimestamp = -1L;private static SnowflakeIdWorkerUtil sw = null;/**** @param datacenterId 数据中心编号id* @param workerId           机器编号id* @return*/public static synchronized SnowflakeIdWorkerUtil getSnowflakeId(long datacenterId,long workerId) {if(datacenterId>31||datacenterId<0) {throw new RuntimeException("datacenterId必须是0到31位的整数");}if(workerId>31||workerId<0) {throw new RuntimeException("workerId必须是0到31位的整数");}if(sw==null) {sw = new SnowflakeIdWorkerUtil();sw.datacenterId = datacenterId;sw.workerId = workerId;}return sw;}/*** 私有的构造函数 防止外部new*/private SnowflakeIdWorkerUtil() {}/*** 获取下一个id* @return*/public synchronized long nextId() {long timestamp = timeGen();//如果当前时间戳小于上次的时间戳 说明系统时钟回退过 应该抛出异常if(timestamp<this.lastTimestamp) {throw new RuntimeException("系统时钟回退异常,请检查系统设置");}//如果是同一时间戳生成id，则进行毫秒内序列if(this.lastTimestamp==timestamp) {sequence = (sequence + 1) & sequenceMask;//同一毫秒内序列溢出 则等待下一秒if(sequence==0) {timestamp = nextMillis(lastTimestamp);}}else {sequence = 0L;}this.lastTimestamp = timestamp;return ((timestamp - startTime)<<timestampLeftShift)|(datacenterId<<datacenterIdShift)|(workerId<<workerIdShift)|sequence;}/*** 阻塞到下一毫秒，直到获取到新的时间戳* @param lastTimestamp* @return*/private long nextMillis(long lastTimestamp) {long timestamp = timeGen();while (timestamp <= lastTimestamp) {timestamp = timeGen();}return timestamp;}/*** 获取当前的时间戳* @return*/private long timeGen() {return System.currentTimeMillis();}public static void main(String[] args) {for(int i=0;i<100;i++) {SnowflakeIdWorkerUtil swu = SnowflakeIdWorkerUtil.getSnowflakeId(0, 0);long id = swu.nextId();System.out.println(Long.toBinaryString(id));System.out.println(id);}}}

雪花算法有个问题就是不能进行时钟回拨，如果进行时钟回拨就会生成重复的id。如果我们考虑以上问题可以在我们的程序中保留最近一次的生成时间，并拿来做校验，就可解决这个问题。办法总比问题多。

5 分布式ID

相关文章：

5 分布式ID

SpringBoot | @Autowired 和 @Resource 的区别及原理分析

『SQLite』解释执行（Explain）

0基础学前端-----CSS DAY12

（概率论）无偏估计

Minio-Linux-安装

利用Java爬取1688商品详情API接口：技术与应用指南

基于MATLAB的汽车热管理模型构建

LRU（1）

VSCode 使用鼠标滚轮控制字体

数据库（3）--针对列的CRUD操作

【Linux】记录一下考RHCE的学习过程（七）

【顶刊TPAMI 2025】多头编码（MHE）之极限分类 Part 1：背景动机

使用hardhat进行合约测试

基于生成式对抗网络（GAN）的前沿研究与应用

Apache zookeeper集群搭建

cmake使用记录

nginx http反向代理

实数的奥秘：柯西序列深度解析

信息系统管理师试题-人力资源

QQ音乐解码神器qmcdump：5分钟快速解锁加密音乐文件的完整指南

FRCRN（16k单麦）效果惊艳：雨天户外采访录音中分离人声与雨滴噪声

Qwen3-Reranker效果展示：政府公文写作中政策依据与原文段落匹配

Android设备标识终极解决方案：Android_CN_OAID技术深度解析与最佳实践

婚恋平台用户画像优化：GPEN提升头像吸引力与真实性

Web Scraper完整指南：零代码网页数据抓取终极解决方案

3分钟搞定风扇噪音！FanControl让你的电脑从此安静如初

中药小分子靶点筛选实战：8种主流技术优缺点对比与选型指南

ANIMATEDIFF PRO新手必看：简单三步，用文字生成高质量动态GIF

CLAP模型在工业质检的应用：设备异常声音诊断