大数据学习(88)-zookeeper实现的高可用(HA)
🍋🍋大数据学习🍋🍋
🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
ZooKeeper 实现高可用的能力详解
ZooKeeper 不仅是实现分布式系统高可用(HA)的关键工具,其自身也通过特定架构设计实现了高可用特性。
一、ZooKeeper 自身的高可用实现
1. 集群架构设计
典型部署:由3/5/7个节点组成的 ZooKeeper Ensemble
[Client] → [Leader]↑
[Follower] ←→ [Follower]
高可用保障:
-
自动Leader选举:基于ZAB协议(ZooKeeper Atomic Broadcast)
-
数据一致性:所有写操作通过Leader协调,保证顺序一致性
-
读操作扩展:Follower可直接处理读请求
2. 容错能力
| 集群规模 | 可容忍故障节点数 | 最少存活节点要求 |
|---|---|---|
| 3节点 | 1 | 2 |
| 5节点 | 2 | 3 |
| 7节点 | 3 | 4 |
选举过程示例:
-
节点启动后进入LOOKING状态
-
交换投票信息(包含zxid和serverid)
-
获得多数派投票的节点成为Leader
-
其余节点成为Follower并同步数据
3. 数据持久化
-
事务日志:所有写操作先写磁盘日志(顺序IO)
-
内存快照:定期生成snapshot加速恢复
-
WAL机制:Write-Ahead Logging保证数据不丢失
二、ZooKeeper 如何为其他系统提供高可用
1. 核心功能支持
| 功能 | 高可用实现案例 |
|---|---|
| 分布式锁 | 防止多节点同时操作关键资源 |
| 服务注册与发现 | 实时感知服务节点存活状态 |
| 配置管理 | 集群所有节点配置即时同步 |
| Leader选举 | 确定唯一活跃节点(如HDFS NameNode) |
2. 典型集成方案
(1) HDFS NameNode HA
graph LRActiveNN[Active NameNode] -->|写入| JN[JournalNodes]StandbyNN[Standby NameNode] -->|读取| JNZKFC[ZKFC] -->|监控| ZK[ZooKeeper]ZKFC --> ActiveNNZKFC --> StandbyNN
故障转移流程:
-
ZKFC检测到Active NN心跳超时
-
在ZK创建临时节点尝试接管
-
获得锁的Standby NN切换为Active
-
通过JournalNodes同步最新状态
(2) Kafka Controller选举
-
每个Broker在ZK注册临时节点
-
第一个成功创建/controller节点的Broker成为Controller
-
Controller故障时自动重新选举
三、ZooKeeper高可用配置实践
1. 关键配置参数
zoo.cfg:
# 集群节点配置
server.1=zk1:2888:3888 # 2888用于Leader通信,3888用于选举
server.2=zk2:2888:3888
server.3=zk3:2888:3888# 会话超时控制
tickTime=2000 # 基础时间单元(ms)
initLimit=10 # 初始化连接最长等待tick数
syncLimit=5 # 心跳请求最长等待tick数# 数据目录
dataDir=/var/lib/zookeeper
dataLogDir=/var/log/zookeeper # 事务日志单独目录
2. 监控指标
关键监控项:
-
zk_avg_latency:平均请求处理时间(应<50ms)
-
zk_outstanding_requests:排队请求数(应<10)
-
zk_followers:正常Follower数量
-
zk_znode_count:znode总数监控
四字命令检查:
echo stat | nc localhost 2181 # 查看状态
echo mntr | nc localhost 2181 # 监控指标
四、ZooKeeper高可用的局限性
-
写性能瓶颈:
-
所有写操作必须通过Leader
-
集群规模扩大时写吞吐量不会增加
-
-
脑裂风险:
-
网络分区可能导致双Leader
-
需要通过
quorum配置预防(N/2+1)
-
-
会话风暴:
-
大量客户端重连可能导致集群过载
-
解决方案:客户端采用指数退避重试
-
ZooKeeper通过其分布式共识算法和集群架构,既能保障自身服务的高可用,又能作为基础设施为其他分布式系统提供可靠的协调服务。正确配置和使用时,ZooKeeper集群可以实现99.99%以上的可用性。
这里值得说明的是:初始 LOOKING 状态的定义
在 ZooKeeper 集群中,LOOKING 是服务器节点启动或发现无 Leader 时进入的特殊状态,表示该节点正在主动寻找或参与 Leader 选举。这是 ZooKeeper 实现高可用的核心机制之一。
当当前的Leader崩溃
-
Follower检测到Leader心跳超时(默认2*tickTime)
-
所有Follower转入LOOKING状态
-
启动新一轮选举,选择zxid最大的节点
-
新Leader产生后同步数据
相关文章:
大数据学习(88)-zookeeper实现的高可用(HA)
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…...
Spring Data审计利器:@LastModifiedDate详解(依赖关系补充篇)!!!
🕒 Spring Data审计利器:LastModifiedDate详解🔥(依赖关系补充篇) 🔌 核心依赖解析 使用LastModifiedDate必须知道的依赖关系 #mermaid-svg-qm1OUa9Era9ktbeK {font-family:"trebuchet ms",verd…...
Tweak Power:全方位电脑系统优化的高效工具
Tweak Power(系统) Tweak Power是一款功能强大的系统优化工具,专为提升Windows电脑的性能和稳定性而设计。它提供了全面的清理、优化和调整选项,帮助用户轻松管理系统资源、提高运行速度、延长设备寿命。 快速扫描并清理系统垃圾…...
CLion下载安装(Windows11)
目录 CLion工具下载安装其他 CLion CLion-2024.1.4.exe 工具 系统:Windows 11 下载 1.通过百度网盘分享的文件:CLion-2024.1.4.exe 链接:https://pan.baidu.com/s/1-zH0rZPCZtQ60IqdHA7Cew?pwdux5a 提取码:ux5a 安装 打开…...
如何用 Postman 进行高效的 Mock 测试?
Postman 是一个强大的 API 开发和测试工具,它可以让你轻松地创建和发送各种 HTTP 请求,查看响应结果,并进行调试和优化。但是有时候,你可能还没有开发好后端服务,或者想要模拟不同的响应场景,这时候就可以使…...
DeepSeek API集成开发指南——Flask示例实践
DeepSeek API集成开发指南——Flask示例实践 序言:智能化开发新范式 DeepSeek API提供了覆盖自然语言处理、代码生成等多领域的先进AI能力。本文将以一个功能完备的Flask示例系统为载体,详解API的集成方法与最佳实践。通过本案例,开发者可快…...
【天梯赛】L2-004 这是二叉搜索树吗(经典问题C++)
解题反思 //镜像树满足:左子树>根节点>右子树 //特殊:独腿二叉树,如pre {2,3,4},递归函数用if(root tail) return;无法识别这种二叉树 // 用ismirror来将一般二叉树和镜像二叉搜索树的…...
Postman 全局 Header 如何设置?全局设置了解一下
在使用 Postman 设置全局请求头信息的关键步骤包括:在集合设置页面中添加所需的头部信息,并确保选择适当的类型和值;如果需要,可通过 JavaScript 脚本添加其他请求头;最后,验证设置是否成功生效。 Postman…...
科技赋能建筑业变革:中建海龙创新引领高质量发展新路径
在建筑工业化浪潮中,中建海龙科技有限公司(以下简称“中建海龙”)凭借深厚的技术积累与持续创新,成为推动行业转型升级的标杆企业。作为中国建筑国际集团旗下核心科技力量,中建海龙深耕模块化集成建筑(MiC&…...
QT计算器开发
1.项目架构 1.图形化界面 2.widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QString> #include <QStack>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTp…...
R语言对偏态换数据进行转换(对数、平方根、立方根)
我们进行研究的时候经常会遇见偏态数据,数据转换是统计分析和数据预处理中的一项基本技术。使用 R 时,了解如何正确转换数据有助于满足统计假设、标准化分布并提高分析的准确性。在 R 中实现和可视化最常见的数据转换:对数、平方根和立方根转…...
《Python实战进阶》No37: 强化学习入门:Q-Learning 与 DQN-加餐版1 Q-Learning算法可视化
在《Python实战进阶》No37: 强化学习入门:Q-Learning 与 DQN 这篇文章中,我们介绍了Q-Learning算法走出迷宫的代码实践,本文加餐,把Q-Learning算法通过代码可视化呈现。我尝试了使用Matplotlib实现,但局限于Matplotli…...
【漏洞修复】Android 10 系统源码中的 glibc、curl、openssl、cups、zlib 更新到最新版本
要将 Android 10 系统源码中的 glibc、curl、openssl、cups、zlib 更新到最新版本,需结合交叉编译、源码替换和系统兼容性适配。以下是具体步骤和相关库的版本信息及维护状态分析: 一、Android 10 默认版本及维护状态 库Android 10 默认版本维护状态最新…...
【云服务器】在 Linux(Ubuntu / CentOS 7)上快速搭建我的世界 Minecraft 服务器,并实现远程联机,详细教程
【云服务器】在 Linux(Ubuntu / CentOS 7)上快速搭建我的世界 Minecraft 服务器,并实现远程联机,详细教程 一、 服务器介绍二、下载 Minecraft 服务端二、安装 JRE 21三、安装 MCS manager 面板四、搭建服务器五、本地测试连接六、…...
docker torcherve打包mar包并部署模型
使用Docker打包深度网络模型mar包到服务端 参考链接:Docker torchserve 部署模型流程——以WSL部署YOLO-FaceV2为例_class myhandler(basehandler): def initialize(self,-CSDN博客 1、docker拉取环境镜像命令 docker images出现此提示为没有权限取执行命令&…...
【安当产品应用案例100集】042-基于安当KADP实现机密文件安全流转
一、客户需求 某集团公司客户,在系统业务流中,存在大量的内部文件流转的需求。内部业务文件有不同的安全密级,最初在文件流转时,公司内部规定点对点的文件传输,要使用加密工具加密后再发给需要的一方。这种方式虽然能…...
[Qt5] QMetaObject::invokeMethod使用
📢博客主页:https://loewen.blog.csdn.net📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢本文由 丶布布原创,首发于 CSDN,转载注明出处🙉📢现…...
软件设计原则之迪米特法则
迪米特法则(Law of Demeter,LoD) 核心思想: 一个对象应当尽可能少地了解其他对象,只与直接朋友交互(如自身的成员变量、方法参数、方法内部创建的对象),避免通过复杂的调用链访问间…...
JSON5 格式标准 Data Exchange Format 官方文档 中英双语
Standard JSON5 标准 JSON5 1.0.0 / March 2018 1.0.0 / 三月 2018 The JSON5 Data Interchange FormatThe JSON5 数据交换格式 Abstract 摘要 The JSON5 Data Interchange Format is a proposed extension to JSON that aims to make it easier for humans to write an…...
附录C SLAC匹配过程命令定义与实际抓包
附录C SLAC匹配过程命令定义与实际抓包 ISO15118-3 附录A中规定了SLAC匹配过程中的请求命令及应答, 本文将会对比协议中的定义和实际抓包内容,以便读者获得直观的认识。 1 CM_SET_KEY.REQ 定义内容: 实际数据: 注意报文中的 08…...
【QT】新建QT工程(详细步骤)
新建QT工程 1.方法(1)点击new project按钮,弹出对话框,新建即可,步骤如下:(2) 点击文件菜单,选择新建文件或者工程,后续步骤如上 2.QT工程文件介绍(1).pro文件 --》QT工程配置文件(2)main.cpp --》QT工程主…...
安装Webpack并创建vue项目
1、新建一个工程目录 在E盘中进行新建项目 2、从命令行进入该目录,并执行NPM 的初始化命令 3、会看到目录中生成了一个“package.json”文件,它相当于NPM项目的说明书,里面记录了项目名称、版本、仓库地址等信息。 4、执行安装 Webpack 的命令 npm install webpac…...
如何快速解决django存储session变量时出现的django.db.utils.DatabaseError错误
我们在学习django进行web编程的时候,有时需要将一些全局变量信息存储在session中,但使用过程中,却发现会引起数据库的报错。通过查看django源码信息,发现其对session信息进行了ORM映射,如果数据库中不存在对应的表信息…...
04 单目标定实战示例
看文本文,您将获得以下技能: 1:使用opencv进行相机单目标定实战 2:标定结果参数含义和数值分析 3:Python绘制各标定板姿态,查看图像采集多样性 4:如果相机画幅旋转90,标定输入参数该如何设置? 5:图像尺寸缩放,标定结果输出有何影响? 6:单目标定结果应用类别…...
极速全场景 MPP数据库starrocks介绍
目录 一、引子 二、起源 (一)前身 (二)定位 三、特点 (一)高性能架构 (二)实时分析 (三)高并发与扩展性 (四)兼容性与生态 …...
RS232转Profinet网关技术,检漏仪新篇章!
RS232转Profinet网关技术,检漏仪新篇章! 在现代医疗监控系统中,RS232转PROFINET网关扮演着至关重要的角色。这种转换设备能够将传统的RS232串行通讯接口无缝转换为PROFINET以太网通信接口,确保老旧设备与现代自动化系统之间的顺畅…...
Linux操作系统7- 线程同步与互斥7(RingQueue环形队列生产者消费者模型改进)
上篇文章:Linux操作系统7- 线程同步与互斥6(POSIX信号量与环形队列生产者消费者模型)-CSDN博客 本篇代码仓库:myLerningCode/l36 橘子真甜/Linux操作系统与网络编程学习 - 码云 - 开源中国 (gitee.com) 目录 一. 单生产单消费单保…...
景区导游--LCA+树上前缀和
关键就是删点少删边,只删有关的边 LCA找最近祖先,树上前缀和记,画图找公式,特殊情况为删第一和最后 sum和前缀和开ll #include<bits/stdc.h> using namespace std; #define N 100011 typedef long long ll; typedef pair…...
将 Markdown 表格结构转换为Excel 文件
在数据管理和文档编写过程中,我们经常使用 Markdown 来记录表格数据。然而,Markdown 格式的表格在实际应用中不如 Excel 方便,特别是需要进一步处理数据时。因此,我们开发了一个使用 wxPython 的 GUI 工具,将 Markdown…...
OpenAI流式解析
OpenAI 流式的代码: 首选一般请使用os.getenv 去读环境变量的内容 注意使用pip install python-dotenv 的安装方法 load_dotenv 是这个库提供的一个函数,用于读取 .env 文件并将其中定义的键值对设置为系统的环境变量。 默认情况下,load_…...
