当前位置: 首页 > article >正文

美团Leaf分布式ID生成器:雪花算法原理与应用

📖 前言

在分布式系统中,全局唯一ID生成是保证数据一致性的核心技术之一。传统方案(如数据库自增ID、UUID)存在性能瓶颈或无序性问题,而美团开源的Leaf框架提供了高可用、高性能的分布式ID解决方案。本文重点解析Leaf中**雪花算法(Snowflake)**的使用与优化技巧。


一、为什么需要分布式ID?

1. 分库分表场景:避免全局ID冲突

传统单库问题:单库使用数据库自增ID时,分库分表后,各库独立自增会导致ID重复(例如用户表分成10个库,每个库从1开始自增,插入10个用户后所有库的ID都是1~10)。

分布式协调代价高:若依赖数据库序列或中央节点生成ID,跨库事务和网络延迟会成为瓶颈。

美团场景:
美团早期使用数据库代理(如Atlas)分库,若ID不全局唯一,订单可能重复。采用Leaf-segment方案,通过代理批量申请ID段(如1~1000),每个服务节点缓存一段ID本地生成,避免实时访问数据库,同时保证全局唯一。

2. 高并发场景:突破数据库性能瓶颈

自增ID的瓶颈:单库每秒写入上限约几万次(如MySQL的TPS通常在数千级别),而美团峰值每秒订单量可能超百万,传统自增ID无法支撑。
锁竞争与延迟:数据库自增锁(AUTO_INCREMENT)在并发插入时会导致线程阻塞,影响吞吐量

3. 业务需求:ID的智能性与可解析性

时间有序性:
订单/日志ID按时间递增,可直接通过ID比较数据新旧(如美团的订单ID高位嵌入时间戳),避免按时间字段排序的开销。

业务信息嵌入:

例1:订单ID 20231015123456789 中,前8位 20231015 表示日期,便于按天归档或排查问题。
例2:用户ID包含分库分表位(如末2位表示库编号),可直接路由到对应数据库。 安全与风控:
避免ID连续(如自增ID暴露业务量),可采用哈希或时间戳+随机数,但需权衡有序性需求。

4. 为什么不用UUID?

无序性:UUID的随机性导致数据库索引频繁分裂,插入性能下降(B+树维护代价高)。

存储空间:UUID是128位字符串(如550e8400-e29b-41d4-a716-446655440000),比64位数字占用更多空间,影响存储和查询效率。

可读性差:无法直接解析业务信息(如时间、业务类型)。


二、美团Leaf核心模式

Leaf提供两种ID生成模式:

  • 号段模式(Leaf-segment)
    -通过缓存号段提升性能,依赖数据库。
    -预分配ID段(如每次从DB获取1000个ID),减少DB访问频率。
    -双Buffer异步加载,避免ID段用尽时等待。
  • 雪花算法模式(Leaf-snowflake):(本文重点)
    -完全分布式,无需依赖数据库。
    -64位ID = 时间戳(41位) + WorkerID(10位) + 序列号(12位)。
    -通过时钟同步(NTP)解决时间回拨问题,若回拨时间短则等待,长则报警降级。

雪花模式的两种方案

1.基于Snowflake算法

完全本地生成ID(无需DB交互),利用工作进程ID(WorkerID)区分不同节点,单机每秒可生成数万ID。

2.动态调整WorkerID:

通过ZooKeeper或DB分配WorkerID,避免手动配置,解决节点扩容时的ID冲突问题。

三、雪花算法原理解析

1. 原生雪花算法结构

Snowflake ID为64位Long型数字,结构如下:

0 | 0000000000 0000000000 0000000000 0000000000 0 | 00000 | 00000 | 000000000000
  • 1位符号位(固定为0)
  • 41位时间戳(毫秒级,可使用约69年)
  • 5位数据中心ID
  • 5位工作节点ID
  • 12位序列号(单节点每毫秒可生成4096个ID)
2. Leaf的优化
  • 解决时钟回拨:通过短暂等待或报警机制避免ID重复。
  • 简化配置:无需手动配置数据中心ID,内部自动管理节点。

四、Leaf雪花算法实战
1. 环境准备

博主找了好久才找到这个可以直接引用腾讯的依赖,如果依赖下载不来可以将Maven镜像源配置为腾讯的
依赖引入(Maven):

Zookeeper依赖<dependency><groupId>org.apache.curator</groupId><artifactId>curator-framework</artifactId><version>4.0.1</version></dependency>美团分布式ID依赖<dependency><groupId>com.tencent.devops.leaf</groupId><artifactId>leaf-boot-starter</artifactId><version>1.0.2-RELEASE</version></dependency>
2. 配置Leaf服务

新建 leaf.properties

leaf.name=your-service-name
leaf.snowflake.enable=true
leaf.snowflake.zk.address=127.0.0.1:2181  # Zookeeper地址(用于节点ID分配)
leaf.snowflake.port=8080                 # 本地服务端口
3. 初始化

@Configuration
public class LeafConfiguration {@SneakyThrows@Beanpublic SnowflakeService snowflakeService(){return new SnowflakeService("127.0.0.1",2128);}
}

注入服务并生成分布式ID

 @Autowiredprivate SnowflakeService snowflakeService;@PostMapping("add")public ResponseResult add(@RequestBody User user) {Result id = snowflakeService.getId("od");user.setId(id.getId() + "");System.out.println(id.toString());loginService.add(user);return ResponseResult.success();}
4. 关键参数调优
  • Zookeeper地址:确保集群配置一致。
  • workerId分配:Leaf通过Zookeeper自动分配,避免手动配置冲突。
  • 时钟回拨处理:Leaf默认容忍少量回拨(可通过-Dleaf.snowflake.tolerant.time=2000调整)。

如果你希望简化部署或避免引入Zookeeper,也可以通过其他方式实现。以下是具体分析及替代方案:

方案一:手动指定workerId(不推荐)

在配置文件中直接指定workerId,无需Zookeeper协调,但需确保不同节点的workerId不重复。
配置示例leaf.properties):

leaf.snowflake.enable=true
leaf.snowflake.zk.address=  # 置空,不使用Zookeeper
leaf.snowflake.workerId=1   # 手动指定当前节点的workerId(范围:0~31)

注意事项

  • 需自行保证集群中各节点的workerId唯一性(例如通过环境变量或启动参数注入)。
  • 节点扩容时需手动管理workerId,易出错,仅适用于小型固定集群。
方案二:改用号段模式(无Zookeeper依赖)

如果不想依赖Zookeeper,可切换至Leaf的号段模式,直接基于数据库生成ID段。
配置示例

leaf.segment.enable=true
leaf.jdbc.url=jdbc:mysql://localhost:3306/leaf?useSSL=false
leaf.jdbc.username=root
leaf.jdbc.password=123456

优势

  • 无需Zookeeper,仅依赖数据库。
  • 适合对ID连续性无严格要求的场景(如日志流水号)。
    劣势
  • 性能略低于雪花算法(TPS约1万~10万,依赖数据库性能)。


4. 总结:如何选择?

场景推荐方案依赖组件复杂度
中小集群,可控节点Leaf手动指定workerId无(需人工管理)
大型分布式系统Leaf + ZookeeperZookeeper
无协调服务,轻量级需求自实现雪花算法
可接受数据库依赖Leaf号段模式数据库

用Docker快速搭建Zookeeper(备用参考)

若仍希望使用Zookeeper,可通过Docker快速启动单节点:

# 拉取镜像
docker pull zookeeper:3.8# 启动容器
docker run -d --name zookeeper -p 2181:2181 zookeeper:3.8

在Leaf配置中填写leaf.snowflake.zk.address=127.0.0.1:2181即可。

通过以上方案,你可以根据实际需求选择是否整合Zookeeper。如果追求高可用和自动化,Zookeeper仍是推荐选择;若资源有限,手动管理或号段模式也能满足基本需求。


总结

美团Leaf的雪花算法通过以下优势成为分布式ID首选:

  • 去中心化:无需DB依赖,通过Zookeeper自动分配节点。
  • 高性能:单节点每秒可生成400万+ ID。
  • 易用性:开箱即用,API简洁。

适用场景:电商订单、物流跟踪、实时消息等需要有序唯一ID的业务。

相关文章:

美团Leaf分布式ID生成器:雪花算法原理与应用

&#x1f4d6; 前言 在分布式系统中&#xff0c;全局唯一ID生成是保证数据一致性的核心技术之一。传统方案&#xff08;如数据库自增ID、UUID&#xff09;存在性能瓶颈或无序性问题&#xff0c;而美团开源的Leaf框架提供了高可用、高性能的分布式ID解决方案。本文重点解析Leaf…...

文件IO5(JPEG图像原理与应用)

JPEG图像原理与应用 ⦁ 基本概念 JPEG&#xff08;Joint Photographic Experts Group&#xff09;指的是联合图像专家组&#xff0c;是国际标准化组织ISO制订并于1992年发布的一种面向连续色调静止图像的压缩编码标准&#xff0c;所以也被称为JPEG标准。 同样&#xff0c;JP…...

P8682 [蓝桥杯 2019 省 B] 等差数列

题目描述 思路 让求包含这n个整数的最短等差数列&#xff0c;既让包含这几个数&#xff0c;项数最少&#xff0c;若项数最少&#xff0c;肯定不能添加小于最小的和大于最大的&#xff0c;而且让项数最小&#xff0c;公差得大 等差数列的公差aj - ai / j - i; 这又是一个等差数…...

DFS中return的作用

DFS中return的作用 在深度优先搜索(DFS)算法中&#xff0c;return语句有几个重要作用&#xff1a; 主要作用 终止当前递归分支&#xff1a;当找到解决方案或确定当前路径无效时&#xff0c;return会结束当前递归调用&#xff0c;返回到上一层。 传递结果&#xff1a;在有返回…...

Java 8 响应式编程:用函数式风格优雅地处理异步流

引言&#xff1a;响应式编程是什么&#xff1f; 响应式编程&#xff08;Reactive Programming&#xff09;是一种异步编程范式&#xff0c;它允许你以流的方式处理数据流和事件流&#xff0c;强调数据的流动与变化。通过响应式编程&#xff0c;你可以以声明式的方式构建应用&a…...

《Vue3学习手记》

下面进入Vue3的学习&#xff0c;以下代码中都有很详细的注释&#xff0c;代码也比较清晰易懂&#xff1a; Vue3 index.html是入口文件 Vue3通过createApp函数创建一个应用实例 main.ts: // Vue3中通过createApp函数创建应用实例 // 引入createApp用于创建应用 import { crea…...

批量给文件编排序号,支持数字序号及时间日期序号编排文件

当我们需要对文件进行编号的时候&#xff0c;我们可以通过这个工具来帮我们完成&#xff0c;它可以支持从 001 到 100 甚至更多的数字序号编号。也可以支持按照日期、时间等方式对文件进行编号操作。这是一种操作简单&#xff0c;处理起来也非常的高效文件编排序号的方法。 工作…...

LLM_基于OpenAI的极简RAG

一、RAG主要流程 #mermaid-svg-gXjcqQe5kyb41Yz2 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-gXjcqQe5kyb41Yz2 .error-icon{fill:#552222;}#mermaid-svg-gXjcqQe5kyb41Yz2 .error-text{fill:#552222;stroke:#55…...

Dynamics365 ExportPdfTemplateExportWordTemplate两个Action调用的body构造

这两天在用ExportPdfTemplate做pdf导出功能时&#xff0c;遇到了如下问题InnerException : Microsoft.OData.ODataException: An unexpected StartArray node was found when reading from the JSON reader. A PrimitiveValue node was expected. 我的场景是使用power automate…...

Java 程序调试与生产问题排查工具Arthas

好的&#xff0c;以下是修改后的博客内容&#xff0c;将公司信息替换为通用的占位符&#xff1a; 深入探索 Arthas&#xff1a;Java 程序调试与生产问题排查的利器 在 Java 开发中&#xff0c;调试和诊断问题往往是一个复杂且耗时的过程。Arthas&#xff08;Alibaba Java Dia…...

day26图像处理OpenCV

文章目录 一、OpenCV1.介绍2.下载3.图像的表示4.图像的基本操作4.1图片读取或创建4.1.1读取4.1.2创建 4.2创建窗口4.3显示图片4.3.1设置读取的图片4.3.2设置显示多久4.3.3释放 4.4.保存图片4.5图片切片&#xff08;剪裁&#xff09;4.6图片大小调节 5.在图像中绘值5.1绘制直线5…...

国际物流怎么找客户?选择适合自己的企业拓客平台

在国际物流行业&#xff0c;获客一直是企业发展的核心难题。无论是跨境电商、传统外贸&#xff0c;还是国际货代&#xff0c;找到精准的客户资源并高效转化&#xff0c;是决定企业能否抢占市场蓝海的关键。今天&#xff0c;我们就来聊聊如何选择一个真正适合的国际物流拓客平台…...

2025年Y1大型游乐设施修理证报考要求

Y1大型游乐设施修理证是从事大型游乐设施维修、保养的必备资质&#xff0c;由国家市场监督管理总局颁发。报考需满足以下条件&#xff1a; 1. 基本条件 年龄&#xff1a;18周岁以上&#xff0c;60周岁以下&#xff1b; 学历&#xff1a;初中及以上文化程度&#xff1b; 健康…...

第四十六篇 人力资源管理数据仓库架构设计与高阶实践

声明&#xff1a;文章内容仅供参考&#xff0c;需仔细甄别。文中技术名称属相关方商标&#xff0c;仅作技术描述&#xff1b;代码示例为交流学习用途&#xff1b;案例数据已脱敏&#xff0c;技术推荐保持中立&#xff1b;法规解读仅供参考&#xff0c;请以《网络安全法》《数据…...

分布式ID生成算法:雪花算法和UUID

在分布式系统中&#xff0c;生成全局唯一ID是核心需求之一。雪花算法和UUID是两种广泛使用的解决方案。 1. 雪花算法 工作原理 分布式ID生成器&#xff1a;由Twitter开源&#xff0c;专为分布式系统设计。组成结构&#xff08;64位二进制&#xff09;&#xff1a; 符号位&…...

高效查询Redis中大数据的实践与优化指南

个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务) &#x1f48c;个人邮箱&#xff1a;[2435024119qq.com] &#x1f4f1;个人微信&a…...

操作系统 4.2-键盘

键盘中断初始化和处理 提取的代码如下&#xff1a; // con_init 函数&#xff0c;初始化控制台&#xff08;包括键盘&#xff09;的中断 void con_init(void) {set_trap_gate(0x21, &keyboard_interrupt); } ​ // 键盘中断处理函数 .globl _keyboard_interrupt _keyboard…...

STM32+EC600E 4G模块 与华为云平台通信

前言 由于在STM32巡回研讨会上淘了一块EC600E4G模块以及刚办完电信卡多了两张副卡&#xff0c;副卡有流量刚好可以用一下&#xff0c;试想着以后画一块ESP32板子搭配这个4G模块做个随身WIFI&#xff0c;目前先用这个模块搭配STM32玩一下云平顺便记录一下。 实验目的 实现STM…...

进行性核上性麻痹患者,饮食 “稳” 健康

进行性核上性麻痹作为一种复杂且罕见的神经系统退行性疾病&#xff0c;给患者的身体机能和日常生活带来严重挑战。在积极接受专业治疗的同时&#xff0c;合理的饮食安排对于维持患者营养状况、缓解症状及提升生活质量起着关键作用。以下为患者提供一些健康饮食建议。 首先&…...

【数据结构 · 初阶】- 顺序表

目录 一、线性表 二、顺序表 1.实现动态顺序表 SeqList.h SeqList.c Test.c 问题 经验&#xff1a;free 出问题&#xff0c;2种可能性 解决问题 &#xff08;2&#xff09;尾删 &#xff08;3&#xff09;头插&#xff0c;头删 &#xff08;4&#xff09;在 pos 位…...

NHANES指标推荐:aMED

文章题目&#xff1a;The moderating effect of alternate Mediterranean diet on the association between sedentary behavior and insomnia in postmenopausal women DOI&#xff1a;10.3389/fnut.2024.1516334 中文标题&#xff1a;替代性地中海饮食对绝经后女性久坐行为与…...

ngx_cycle_modules

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_cycle_modules-CSDN博客 定义在 src/core/ngx_module.c ngx_int_t ngx_cycle_modules(ngx_cycle_t *cycle) {/** create a list of modules to be used for this cycle,* copy static modules to it*/cycle->modules ngx_pcalloc(…...

Spring Cloud 远程调用

4.OpenFeign的实现原理是什么&#xff1f; 在使用OpenFeign的时候&#xff0c;主要关心两个注解&#xff0c;EnableFeignClients和FeignClient。整体的流程分为以下几个部分&#xff1a; 启用Feign代理&#xff0c;通过在启动类上添加EnableFeignClients注解&#xff0c;开启F…...

YOLO学习笔记 | YOLOv8环境搭建全流程指南(2025.4)

===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 ===================================================== YOLOv8环境搭建 一、环境准备与工具配置1. Conda虚拟环境搭建2. CUDA与…...

使用Apache POI(Java)创建docx文档和表格

1、引入poi 依赖组件 <dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>4.0.0</version> </dependency> <dependency><groupId>org.apache.poi</groupId>&…...

力扣 — — 最长公共子序列

力扣 — — 最长公共子序列 最长公共子序列 题源&#xff1a;1143. 最长公共子序列 - 力扣&#xff08;LeetCode&#xff09; 题目&#xff1a; 分析&#xff1a; 一道经典的题目&#xff1a;最长公共子序列(LCS) 题目大意&#xff1a;求两个字符串的最长公共序列。 算法&…...

当一个 HTTP 请求发往 Kubernetes(K8s)部署的微服务时,整个过程流转时怎样的?

以下是一个简单的示意图来展示这个过程&#xff1a; 1. 请求发起 客户端&#xff08;可以是浏览器、移动应用或者其他服务&#xff09;发起一个 HTTP 请求到目标微服务的地址。这个地址可以是服务的域名、IP 地址或者 Kubernetes 服务的 ClusterIP、NodePort 等。 2. 外部流量…...

C#核心学习(十五)面向对象--关联知识点(1)命名空间

目录 一、命名空间基本概念&#xff1a;代码的"虚拟文件夹" 二 、命名空间的普通使用 三 、不同命名空间中相互使用 需要引用命名空间或指明出处 四、命名空间可以包裹命名空间&#xff08;嵌套命名空间使用&#xff09; 五、 关于修饰类的访问修饰符 一、命名空…...

淘宝商品数据实时抓取 API 开发指南:从接口申请到数据解析实战

一、引言​ 在当今电商蓬勃发展的时代&#xff0c;淘宝作为国内电商巨头&#xff0c;其平台上汇聚了海量商品信息。对于电商从业者、数据分析爱好者以及众多依赖淘宝商品数据开展业务的企业而言&#xff0c;能够实时获取淘宝商品数据具有极高价值。例如&#xff0c;电商运营者…...

【嵌入式硬件】LAN9253说明书(中文版)

目录 1.介绍 1.1总体介绍 1.2模式介绍 1.2.1微控制器模式: 1.2.2 扩展模式 1.2.3 数字IO模式 1.2.4 各模式图 2.引脚说明 2.1 引脚总览 2.2 引脚描述 2.2.1 LAN端口A引脚 2.2.2 LAN端口B引脚 2.2.3 LAN端口A和、B电源和公共引脚 2.2.4 SPI/SQI PINS 2.2.5 分布式时…...