当前位置: 首页 > news >正文

自定义HBase负载均衡器MyCustomBalancer实现步骤与代码解析

目录

1.HBase默认负载均衡策略

1.1 负载均衡总体流程

1.2 不能触发负载均衡的情况

1.3 负载均衡算法

2.自定义的 HBase 负载均衡器的步骤

3.MyCustomBalancer的代码细节 

3.1 balanceCluster 方法的作用

3.2balanceCluster 对数据的影响

3.3监控HBase的性能指标

3.3.1 指标介绍

3.3.2 新建 run_canary.sh 的脚本

3.3.3 cron 作业定期执行脚本 

3.3.4 解析 Canary 输出

4.注意事项

5.相关资料 


1.HBase默认负载均衡策略

HBase通过Region的数量实现负载均衡,即通过hbase.master.loadbalancer.class实现自定义负载均衡算法。下面将为大家剖析HBase负载均衡的相关内容以及性能指标。

1.1 负载均衡总体流程

1.2 不能触发负载均衡的情况

HBase系统负载均衡是一个周期性的操作,通过负载均衡来均匀分配Region到各个RegionServer上,通过hbase.balancer.period属性来控制负载均衡的时间间隔,默认是5分钟。触发负载均衡操作是有条件的,但是如果发生以下情况则不会触发负载均衡操作:

  • 负载均衡自动操作balance_switch关闭,即:balance_switch false;
  • HBase Master节点正在初始化操作;
  • HBase集群中正在执行RIT,即Region正在迁移中;
  • HBase集群正在处理离线的RegionServer;

1.3 负载均衡算法

HBase执行负载均衡操作的时候,如何判断各个RegionServer节点上的Region个数是否均衡,这里通过以下步骤来判断

  1. 计算均衡值的区间范围,通过总Region个数以及RegionServer节点个数,算出平均Region个数,然后在此基础上计算最小值和最大值;
  2. 遍历超过Region最大值的RegionServer节点,将该节点上的Region值迁移出去,直到该节点的Region个数小于等于最大值的Region;
  3. 遍历低于Region最小值的RegionServer节点,分配集群中的Region到这些RegionServer上,直到大于等于最小值的Region;
  4. 负责上述操作,直到集群中所有的RegionServer上的Region个数在最小值与最大值之间,集群才算到达负载均衡,之后,即使再次手动执行均衡命令,HBase底层逻辑判断会执行忽略操作 

2.自定义的 HBase 负载均衡器的步骤

集群规模大了以后需要更多细粒度的监控和负载均衡,这个时候需要考虑自定义的 HBase 负载均衡器。要使自定义的 HBase 负载均衡器 MyCustomBalancer 生效,需要进行几个步骤:

  1. 编译和打包:首先,您需要将 MyCustomBalancer 类编译并打包成一个 JAR 文件。这个 JAR 文件应该包含您自定义的负载均衡器类以及可能的任何依赖。

  2. 部署 JAR 文件:将编译好的 JAR 文件放置在 HBase 集群中的所有节点上。通常,这意味着需要将 JAR 文件放置在每个节点的 HBase lib 目录下(例如 /path/to/hbase/lib/)。

  3. 更新 HBase 配置:在 HBase 的配置文件 hbase-site.xml 中指定您的自定义负载均衡器类。这告诉 HBase 使用您的负载均衡器而不是默认的。在每个 HBase 节点的配置文件中添加以下配置:

    <property><name>hbase.master.loadbalancer.class</name><value>your.package.MyCustomBalancer</value>
    </property>
    

    请确保 <value> 中的值匹配您的自定义负载均衡器类的完全限定名。

  4. 重启 HBase 集群:更改配置文件后,您需要重启 HBase 集群,以便更改生效。这通常涉及重启 HBase Master 和所有的 RegionServer。

  5. 验证:重启 HBase 服务后,验证自定义负载均衡器是否正在使用。您可以通过查看 HBase Master 的日志来确认是否已成功加载自定义负载均衡器。

3.MyCustomBalancer的代码细节 

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.ServerName;
import org.apache.hadoop.hbase.client.RegionInfo;
import org.apache.hadoop.hbase.master.LoadBalancer;
import org.apache.hadoop.hbase.master.balancer.BaseLoadBalancer;import java.util.ArrayList;
import java.util.List;
import java.util.Map;public class MyCustomBalancer extends BaseLoadBalancer {private CanaryDataCollector dataCollector = new CanaryDataCollector();@Overridepublic void setConf(Configuration conf) {super.setConf(conf != null ? conf : HBaseConfiguration.create());}@Overridepublic void initialize() throws HBaseIOException {// 初始化,可以在这里实现一些监控逻辑}@Overridepublic List<RegionPlan> balanceCluster(Map<ServerName, List<RegionInfo>> clusterState) {// 1. 从 Canary 数据收集器获取延时数据Map<RegionInfo, Long> regionDelays = dataCollector.getRegionDelays();// 2. 分析和决策List<RegionPlan> plans = new ArrayList<>();if (需要负载均衡) {// 3. 计算出最优的Region迁移方案for (Map.Entry<ServerName, List<RegionInfo>> entry : clusterState.entrySet()) {ServerName server = entry.getKey();List<RegionInfo> regions = entry.getValue();for (RegionInfo region : regions) {// 假设逻辑:如果一个 RegionServer 上的 Region 数量超过某个阈值,则迁移一部分 RegionsLong delay = regionDelays.get(region);// 如果延时超过阈值,生成迁移计划if (delay != null && delay > THRESHOLD) {// 选择一个目标 ServerName 并创建 RegionPlanServerName targetServer = ...; // 选择一个目标服务器RegionPlan plan = new RegionPlan(region, server, targetServer);plans.add(plan);}}}}}return plans;}private boolean 需要负载均衡() {// 实现监控和分析逻辑// 比如基于 Regions 的大小、读写负载等因素进行判断return true; // 示例代码}
}

3.1 balanceCluster 方法的作用

  1. 分析集群状态balanceCluster 方法分析当前集群的状态,包括每个 RegionServer 上托管的 Region 数量、Region 的大小、读写负载等。

  2. 决定 Region 迁移:基于分析的结果,balanceCluster 决定是否有必要进行 Region 迁移,以及如何迁移。例如,如果一个 RegionServer 承载的负载过重,方法可能决定将一些 Region 迁移到负载较轻的 RegionServer 上。

  3. 生成迁移计划balanceCluster 生成一个 Region 迁移计划,该计划由一系列的 RegionPlan 对象组成。每个 RegionPlan 指定了一个 Region 从一个 RegionServer 迁移到另一个 RegionServer。

3.2balanceCluster 对数据的影响

  • 不影响数据完整性:负载均衡过程中,Region 中存储的数据不会受到影响。HBase 保证了在迁移过程中数据的完整性和一致性。

  • 可能暂时影响可用性:在 Region 迁移过程中,被迁移的 Region 可能会暂时不可用。这意味着对这些 Region 的读写操作可能会在迁移期间受到影响。

  • 不直接修改数据balanceCluster 方法本身不会修改 Region 中的数据。它只是决定 Region 应该在哪些 RegionServer 之间移动。

3.3 监控HBase的性能指标

3.3.1 指标介绍

HBase系统为了反应集群内部处理请求所耗费的时间提供一个工具类即

org.apache.hadoop.hbase.tool.Canary

如果不知道使用方法,通过help命令来查看具体的用法,操作命令: 

hbase org.apache.hadoop.hbase.tool.Canary -help

3.3.2 新建 run_canary.sh 的脚本

#!/bin/bash
# run_canary.sh# 运行 Canary 工具并将输出重定向到日志文件
hbase org.apache.hadoop.hbase.tool.Canary > /path/to/canary_output.log 2>&1

3.3.3 cron 作业定期执行脚本 

# 编辑 crontab
crontab -e# 添加一行来每小时运行一次脚本
0 * * * * /path/to/run_canary.sh

3.3.4 解析 Canary 输出

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Map;public class CanaryDataCollector {public Map<RegionInfo, Long> getRegionDelays() {Map<RegionInfo, Long> regionDelays = new HashMap<>();String line;try (BufferedReader br = new BufferedReader(new FileReader("/path/to/canary_output.log"))) {while ((line = br.readLine()) != null) {// 解析每一行来提取 Region 信息和延时// 假设你有一种方法来从一行文本中解析出 RegionInfo 和延时RegionInfo regionInfo = ...; // 解析 Region 信息Long delay = ...; // 解析延时regionDelays.put(regionInfo, delay);}} catch (Exception e) {e.printStackTrace();}return regionDelays;}
}

4.注意事项

请注意,自定义负载均衡器的开发和部署是一个高级操作,需要对 HBase 有深入的理解。在进行这些更改之前,请确保在一个测试环境中进行充分的测试,以避免在生产环境中意外影响集群的稳定性和性能。自定义负载均衡器的行为可能会根据负载、数据分布和集群配置的不同而大不相同。

5.相关资料 

Apache HBase 负载均衡机制-云社区-华为云

深度剖析HBase负载均衡和性能指标 - 墨天轮

相关文章:

自定义HBase负载均衡器MyCustomBalancer实现步骤与代码解析

目录 1.HBase默认负载均衡策略 1.1 负载均衡总体流程 1.2 不能触发负载均衡的情况 1.3 负载均衡算法 2.自定义的 HBase 负载均衡器的步骤 3.MyCustomBalancer的代码细节 3.1 balanceCluster 方法的作用 3.2balanceCluster 对数据的影响 3.3监控HBase的性能指标 3.3.…...

企业网站建设中常用的英文翻译

下面好代码网在长期的网站建设业务中总结的&#xff0c;一些在企业网站建设中词语的常用翻译&#xff0c;可以让你的企业网站更具有专业性。如果你做中英文双语版本网站或者外贸网站的请收藏备用。 网站导航 site map 公司简介 PROFILE or COMPANY Profile or Company 综述 Gen…...

vscode运行Python的两种方法,及无法运行的原因

vscode运行Python代码 下面介绍的vscode运行Python代码的方法基于的一个前提条件是&#xff1a;当前的计算机已经安装好了Python&#xff0c;且已经配置好了相关的环境变量。如果要查看是否已经都安装好了&#xff0c;可以打开Windows系统的命令行工具Windows PowerShell&…...

【猫头虎分享】全面揭秘鸿蒙4.0:华为的技术革新与市场影响

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通Golang》…...

Java内存模型之可见性

文章目录 1.什么是可见性问题2.为什么会有可见性问题3.JMM的抽象&#xff1a;主内存和本地内存3.1 什么是主内存和本地内存3.2 主内存和本地内存的关系 4.Happens-Before原则4.1 什么是Happens-Before4.2 什么不是Happens-Before4.3 Happens-Before规则有哪些4.4 演示&#xff…...

【docker】Docker Compose 使用介绍

一、什么是Docker Compose Docker Compose是一个用于定义和运行多个Docker容器的工具。它允许您使用YAML文件来配置应用程序的服务、网络和卷等方面&#xff0c;并通过单个命令即可快速启动和停止整个应用程序的多个容器。 Docker Compose的主要作用如下&#xff1a; 管理多个…...

uniapp怎么开发插件并发布

今天耳机坏了,暂时内卷不了,所以想开发几个插件玩玩,也好久没写博客了,就拿这个来写了 首先,发布插件时需要你有项目 这里先拿uniapp创建一个项目, 如下,创建好的项目长这样 然后根据uniapp官网上说的,我们发布插件时,需要在uni_modules里面编写和发布 ps:还需要使用uniapp…...

为什么不直接public,多此一举用get、set,一文给你说明白

文章目录 1. 封装性&#xff08;Encapsulation&#xff09;2. 验证与逻辑处理3. 计算属性&#xff08;Computed Properties&#xff09;4. **跟踪变化&#xff08;Change Tracking&#xff09;5. 懒加载与延迟初始化&#xff08;Lazy Initialization&#xff09;6. 兼容性与未来…...

golang 记录一次协程和协程池的使用,利用ants协程池来处理定时器导致服务全部阻塞

前言 在实习的项目中有一个地方遇到了需要协程池的地方&#xff0c;在mt推荐下使用了ants库。因此在此篇记录一下自己学习使用此库的情况。 场景描述 此服务大致是一个kafka消息接收、发送相关。接收消息&#xff0c;根据参数设置定时器进行重发。 通过这里新建kafka服务&a…...

【Postman-windows-9.12.2版本安装与汉化】

Postman-windows-9.12.2版本安装与汉化 想用英文版本的可以直接点击如下链接下载最新版本 官网最新版本(无法汉化)&#xff1a;https://www.postman.com/downloads/ 如果想要汉化的就不能使用最新版本&#xff0c;因为最新版本没有汉化包可以用 汉化包和postman的版本必须是…...

11Spring IoC注解式开发(下)(负责注入的注解/全注解开发)

1负责注入的注解 负责注入的注解&#xff0c;常见的包括四个&#xff1a; ValueAutowiredQualifierResource 1.1 Value 当属性的类型是简单类型时&#xff0c;可以使用Value注解进行注入。Value注解可以出现在属性上、setter方法上、以及构造方法的形参上, 方便起见,一般直…...

Grafana Promtail 配置解析

由于目前项目一般都是部署在k8s上&#xff0c;因此这篇文章中的配置只摘录k8s相关的配置&#xff0c;仅供参考&#xff0c;其他的配置建议上官网查询。 运行时打印配置 -print-config-stderr 通过 ./promtail 直接运行Promtail时能够快速输出配置 -log-config-reverse-order 配…...

电脑DIY-主板参数

电脑主板参数 主板系列芯片组主板支持的CPU系列主板支持CPU的第几代主板的尺寸主板支持的内存主板是否支持专用WIFI模块插槽主板规格主板供电规格M.2插槽&#xff08;固态硬盘插槽&#xff09;规格USB接口规格质保方式 华硕TUF GAMING B650M-PLUS WIFI DDR5重炮手主板 华硕&…...

JVM知识总结(持续更新)

这里写目录标题 java内存区域程序计数器虚拟机栈本地方法栈堆方法区 java内存区域 Java 虚拟机在执行 Java 程序的过程中会把它管理的内存划分成若干个不同的数据区域&#xff1a; 程序计数器虚拟机栈本地方法栈堆方法区 程序计数器 记录下一条需要执行的虚拟机字节码指令…...

信息系统安全——基于 KALI 和 Metasploit 的渗透测试

实验 2 基于 KALI 和 Metasploit 的渗透测试 2.1 实验名称 《基于 KALI 和 Metasploit 的渗透测试》 2.2 实验目的 1 、熟悉渗透测试方法 2 、熟悉渗透测试工具 Kali 及 Metasploit 的使用 2.3 实验步骤及内容 1 、安装 Kali 系统 2 、选择 Kali 中 1-2 种攻击工具&#xff0c…...

05. 深入理解 GPT 架构

在本章的前面,我们提到了类 GPT 模型、GPT-3 和 ChatGPT 等术语。现在让我们仔细看看一般的 GPT 架构。首先,GPT 代表生成式预训练转换器,最初是在以下论文中引入的: 通过生成式预训练提高语言理解 (2018) 作者:Radford 等人,来自 OpenAI,http://cdn.openai.com/rese…...

PHP开发日志 ━━ php8.3安装与使用组件Xdebug

今天开头写点历史&#xff1a; 二十年前流行asp&#xff0c;当时用vb整合常用函数库写了一个dll给asp调用&#xff0c;并在此基础上开发一套仿windows界面的后台管理系统&#xff1b;后来asp逐渐没落&#xff0c;于是在十多年前转投php&#xff0c;不久后用php写了一套mvc框架&…...

Python - 深夜数据结构与算法之 Two-Ended BFS

目录 一.引言 二.双向 BFS 简介 1.双向遍历示例 2.搜索模版回顾 三.经典算法实战 1.Word-Ladder [127] 2.Min-Gen-Mutation [433] 四.总结 一.引言 DFS、BFS 是常见的初级搜索方式&#xff0c;为了提高搜索效率&#xff0c;衍生了剪枝、双向 BFS 以及 A* 即启发式搜索…...

langchain-Agent-工具检索

有时会定义很多工具&#xff0c;而定义Agent的时候只想使用与问题相关的工具&#xff0c;这是可以通过向量数据库来检索相关的工具&#xff0c;传递给Agent # Define which tools the agent can use to answer user queries search SerpAPIWrapper() search_tool Tool(name …...

猫头虎分享:探索TypeScript的世界 — TS基础入门 ‍

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通Golang》…...

Unity-生命周期函数

目录 生命周期函数是什么&#xff1f; 生命周期函数有哪些&#xff1f; Awake() OnEnable() Start() FixedUpdate() Update() Late Update() OnDisable() OnDestroy() Unity中生命周期函数支持继承多态吗&#xff1f; 生命周期函数是什么&#xff1f; 在Unity中&…...

SQL概述及SQL分类

SQL由IBM上世纪70年代开发出来&#xff0c;是使用关系模型的数据库应用型语言&#xff0c;与数据直接打交道。 SQL标准 SQL92,SQL99&#xff0c;他们分别代表了92年和99年颁布的SQL标准&#xff0c;我们今天使用的SQL语言依旧遵循这些标准。 SQL的分类 DDL&#xff1a;数据定…...

[VSCode] VSCode 常用快捷键

文章目录 VSCode 源代码编辑器VSCode 常用快捷键分类汇总01 编辑02 导航03 调试04 其他05 重构06 测试07 扩展08 选择09 搜索10 书签11 多光标12 代码片段13 其他 VSCode 源代码编辑器 官网&#xff1a;https://code.visualstudio.com/ 下载地址&#xff1a;https://code.visua…...

函数指针和回调函数 以及指针函数

函数指针&#xff08;Function Pointer&#xff09;&#xff1a; 定义&#xff1a; 函数指针是指向函数的指针&#xff0c;它存储了函数的地址。函数的二制制代码存放在内存四区中的代码段&#xff0c;函数的地址它在内存中的开始地址。如果把函数的地址作为参数&#xff0c;就…...

京东年度数据报告-2023全年度游戏本十大热门品牌销量(销额)榜单

同笔记本市场类似&#xff0c;2023年度游戏本市场的整体销售也呈下滑态势。根据鲸参谋电商数据分析平台的相关数据显示&#xff0c;京东平台上游戏本的年度销量累计超过350万&#xff0c;同比下滑约6%&#xff1b;销售额将近270亿&#xff0c;同比下滑约11%。 鲸参谋综合了京东…...

秒懂百科,C++如此简单丨第十二天:ASCLL码

目录 必看信息 Everyday English &#x1f4dd;ASCLL码是什么&#xff1f; &#x1f4dd;ASCLL码表 &#x1f4dd;利用ASCLL码实现大写转小写 &#x1f4dd;小试牛刀 总结 必看信息 ▶本篇文章由爱编程的小芒果原创&#xff0c;未经许可&#xff0c;严禁转载。 ▶本篇文…...

Qt6入门教程 4:Qt Creator常用技巧

在上一篇Qt6入门教程 3&#xff1a;创建Hello World项目中&#xff0c;通过创建一个Qt项目&#xff0c;对Qt Creator已经有了比较直观的认识&#xff0c;本文将介绍它的一些常用技巧。 Qt Creator启动后默认显示欢迎页面 创建项目已经用过了&#xff0c;打开项目也很简单&#…...

阴盘奇门八字排盘马星位置计算方法php代码

如下位置&#xff0c;马星的四个位置。 计算方法&#xff1a; 1。先根据出生年月日&#xff0c;计算得八字四柱。比如 2024年01月09日&#xff0c;四柱为 其中时柱地支为“申” 2。然后根据以下对应的数组&#xff0c;来找到id号&#xff0c;即马星位置。 根据下表来找到&am…...

vue3 使用 jsoneditor

vue3 使用 jsoneditor 在main.js中引入 样式文件 import jsoneditor/dist/jsoneditor.css复制代码放到文件中就能用了 jsoneditor.vue <template><div ref"jsonDom" style"width: 100%; height: 460px"></div> </template> <…...

若依前后端分离版使用mybatis-plus实践教程

1、根目录得pom加入依赖 <properties><mybatis-plus.version>3.5.1</mybatis-plus.version> </properties> <dependencies><!-- mp配置--><dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus…...