HBase 源码阅读(二)
衔接
在上一篇文章中,HMasterCommandLine类中在startMaster();方法中
// 这里除了启动HMaster之外,还启动一个HRegionServerLocalHBaseCluster cluster = new LocalHBaseCluster(conf, mastersCount, regionServersCount,LocalHMaster.class, HRegionServer.class);// 这里getMaster 会获取到HMaster吧((LocalHMaster)cluster.getMaster(0)).setZKCluster(zooKeeperCluster);cluster.startup();waitOnMasterThreads(cluster);
使用了 cluster.startup(); 对HBase的主要进程进行启动
public void startup() throws IOException {JVMClusterUtil.startup(this.masterThreads, this.regionThreads);}
1. JVMClusterUtil.java
public static String startup(final List<JVMClusterUtil.MasterThread> masters,final List<JVMClusterUtil.RegionServerThread> regionservers) throws IOException
这个函数上面,显示完成了HMaster的线程初始化,然后等到HMaster的线程初始化后,又调用了HRegionServer的线程初始化,但我发现HMaster线程在执行完run方法后,在run方法最后还执行了一遍super.run(),HMaster多执行了一次HRegionServer.run方法的目的是为了?
ChatGPT回答的可能原因
- 继承自公共的父类:
- 在HBase的实现中,
HMaster和HRegionServer都可能继承自一个共同的父类或实现了相同的接口(例如Thread或Runnable接口),该父类可能定义了一个run()方法,用于执行一些通用的逻辑。 - 当
HMaster在执行自己的run()方法后调用super.run()时,它可能是在执行父类中的通用逻辑。这种逻辑可能与线程的基础设施或资源管理有关,而不仅仅是特定于HRegionServer的逻辑。
HMaster和HRegionServer共享某些功能:
HMaster和HRegionServer虽然在职责上不同,但它们可能共享某些基础功能,比如网络通信、线程管理、资源分配等。父类中的run()方法可能封装了这些通用功能,因此HMaster在完成自己的工作后,调用super.run()来确保这些共享功能得以执行。- 这可能解释了为什么在
HMaster的run()方法之后还要调用super.run():这是为了确保即使是HMaster,也能够执行一些HRegionServer和HMaster共享的初始化或管理任务。
- 确保线程生命周期的完整性:
super.run()的调用可能是为了确保线程的生命周期管理符合预期。例如,在某些实现中,父类的run()方法可能会处理线程的启动、暂停、恢复、终止等状态。如果不调用super.run(),可能会导致线程的状态管理不完整或不正确。
经过在HRegionServer.run 方法print 测试发现,HRegionServer.run在HMaster启动时调用了一次,在HR egionServer 线程启动时又调用了一次
带着这三个内容,我们去看HMaster run方法之后的HRegionServer run方法
2. HMaster.run() 方法
public void run() {try {//用于控制是否在本地测试时启动一个完整的HBase集群if (!conf.getBoolean("hbase.testing.nocluster", false)) {Threads.setDaemonThreadRunning(new Thread(() -> {try {// 定义端口int infoPort = putUpJettyServer();// 启动MasterManagerstartActiveMasterManager(infoPort);} catch (Throwable t) {// Make sure we log the exception.String error = "Failed to become Active Master";LOG.error(error, t);// Abort should have been called already.if (!isAborted()) {abort(error, t);}}}), getName() + ":becomeActiveMaster");}// Fall in here even if we have been aborted. Need to run the shutdown services and// the super run call will do this for us.super.run();
HMaster的接口只是调用了startActiveMasterManager(infoPort); 对Master的一些基础内容进行初始化(具体内容请看HBase源码阅读(一)),然后又调用了一次HRegionServer的run方法
3. HRegionServer run方法
- HMaster.java.,HMaster run()线程启动临近结束后,再调用HRegionServer进程
仔细看HRegionServer.run方法,主要涉及HRegionServer的运行和启动
所以上一章节中的问题应该是第二个选型
HMaster和HRegionServer共享某些功能:
HMaster 比HRegionServer在HMaster.run中多了一些内容
HMaster和HRegionServer虽然在职责上不同,但它们可能共享某些基础功能,比如网络通信、线程管理、资源分配等。父类中的run()方法可能封装了这些通用功能,因此HMaster在完成自己的工作后,调用super.run()来确保这些共享功能得以执行。- 这可能解释了为什么在
HMaster的run()方法之后还要调用super.run():这是为了确保即使是HMaster,也能够执行一些HRegionServer和HMaster共享的初始化或管理任务。
4. HRegionServer.handleReportForDutyResponse()
简单过一下,用来启动所有的服务器线程
- 设置hostname
- 在zookeeper中设置Znode
- 初始化文件系统
- 设置已经初始化的副本和WAL
- 设置线程名称
- 启动暂停监视器
- 启动复制服务(启动复制源和接收器处理程序。)
- log zk的信息,唤醒其他所有等待该RegionServer 启动的其他节点
3.1 暂停监视器
JvmPauseMonitor的作用和功能
- 监控JVM暂停事件:
JvmPauseMonitor通过定期检查系统时间的变化来判断是否发生了JVM暂停。它会设置一个定时器,每隔一段固定的时间去检测系统的时间戳。如果时间戳的变化超过预期值,这通常意味着JVM暂停事件发生了。
- 检测长时间的GC停顿:
- JVM暂停最常见的原因之一是垃圾收集(GC),尤其是Full GC或长时间的Stop-the-World(STW)事件。
JvmPauseMonitor可以帮助检测这些事件,因为它们可能会导致HBase的RegionServer或者HMaster的服务性能下降,甚至导致客户端请求超时。
- JVM暂停最常见的原因之一是垃圾收集(GC),尤其是Full GC或长时间的Stop-the-World(STW)事件。
- 日志记录和报警:
- 当
JvmPauseMonitor检测到异常的暂停(通常超过一定阈值,例如几百毫秒或更长),它会记录警告日志。日志中会包括暂停的时长、可能的原因等信息。这有助于运维人员监控和分析系统的性能问题,尤其是在垃圾回收引起的问题上。
- 当
- 提高系统可靠性:
- 通过监控和记录JVM暂停,
JvmPauseMonitor帮助识别出可能影响HBase性能的问题,允许系统管理员采取预防或修复措施。尽管JvmPauseMonitor本身不会直接解决这些问题,但它提供了有价值的诊断信息,帮助识别和缓解性能瓶颈。
- 通过监控和记录JVM暂停,
相关文章:
HBase 源码阅读(二)
衔接 在上一篇文章中,HMasterCommandLine类中在startMaster();方法中 // 这里除了启动HMaster之外,还启动一个HRegionServerLocalHBaseCluster cluster new LocalHBaseCluster(conf, mastersCount, regionServersCount,LocalHMaster.class, HRegionSer…...
深度学习每周学习总结N9:transformer复现
🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 | 接辅导、项目定制 目录 多头注意力机制前馈传播位置编码编码层解码层Transformer模型构建使用示例 本文为TR3学习打卡,为了保证记录顺序我这里写…...
数据结构与算法(3)栈和队列
1.前言 哈喽大家好啊,今天博主继续为大家带来数据结构与算法的学习笔记,今天是关于栈和队列,未来博主会将上一章《顺序表与链表》以及本章《栈与队列》做专门的习题应用专题讲解,都会很有内容含量 ,欢迎大家多多支持&…...
11、Django Admin启用对计算字段的过滤
重新定义admin.py中的Hero管理模型如下: admin.register(Hero) class HeroAdmin(admin.ModelAdmin):list_display ("name", "is_immortal", "category", "origin", "is_very_benevolent")list_filter ("…...
xxl-job升级到springboot3.0 导致页面打不开报错)问题
原因:springboot3.0 因为移除了jsp 导致xxl-job不能访问,解决方法如下 1、修改PermissionInterceptor拦截器 package com.xxl.job.admin.controller.interceptor;import com.xxl.job.admin.controller.annotation.PermissionLimit; import com.xxl.job.…...
栈和队列.
目录 1. 栈(Stack) 2. 栈的模拟实现 3. 栈的应用场景 4. 队列(Queue) 5. 队列的模拟实现 6. 循环队列 7. 双端队列(Deque) 8. 面试题 1. 栈(Stack) 栈:一种特殊…...
Parallel.ForEach - 并行处理
Parallel.ForEach 是 C# 中 System.Threading.Tasks.Parallel 类提供的一个方法,用于并行地迭代集合中的每一个元素。Parallel.ForEach 方法允许多个线程同时处理集合中的元素,从而提高程序的执行效率,特别是在处理大量数据或执行耗时任务时。…...
【MySQL】初识MySQL—MySQL是啥,以及如何简单操作???
前言: 🌟🌟本期讲解关于MySQL的简单使用和注意事项,希望能帮到屏幕前的你。 🌈上期博客在这里:http://t.csdnimg.cn/wwaqe 🌈感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 目…...
LLM应用实战: 产业治理多标签分类
数据介绍 标签体系 产业治理方面的标签体系共计200个,每个标签共有4个层级,且第3、4层级有标签含义的概括信息。 原始数据 企业官网介绍数据,包括基本介绍、主要产品等 企业专利数据,包括专利名称和专利摘要信息,且专…...
下载Mongodb 4.2.25 版本教程
1、MongoDB 安装包的下载链接 Download MongoDB Community Server | MongoDB 进入如下截图: 2、查找历史版本 往下拉,点击“...”,找到”Archived releases”,点击进入 、 3、下载Mongodb 4.2.25 版本 找到如下图4.2.25版本下载链接,点击就可…...
docker拉取redis5.0.5并建立redis集群
1.配置文件 mkdir -p redis-cluster/7001/ mkdir -p redis-cluster/7002/ mkdir -p redis-cluster/7003/ mkdir -p redis-cluster/7004/ mkdir -p redis-cluster/7005/ mkdir -p redis-cluster/7006/cd redis-clustervim 7001/redis.confbind 0.0.0.0port 7001cluster-enabled…...
React16新手教程记录
文章目录 前言一些前端面试题1. 搭建项目1. 1 cdn1. 2 脚手架 2. 基础用法2.1 表达式和js语句区别:2.2 jsx2.3 循环map2.4 函数式组件2.5 类式组件2.6 类组件点击事件2.6.1 事件回调函数this指向2.6.2 this解决方案2.6.2.1 通过bind2.6.2.2 箭头函数(推荐…...
怎么摆脱非自然链接?
什么是非自然链接? 非自然链接是人为创建的链接,用于操纵网站在搜索引擎中的排名。非自然链接违反了Google 的准则,网站可能会因此受到惩罚。 它们不是由网站所有者编辑放置或担保的。示例包括带有过度优化锚文本的链接、通过 PR 的广告、嵌…...
【2024数模国赛赛题思路公开】国赛B题第二套思路丨附可运行代码丨无偿自提
2024年数模国赛B题解题思路 B 题 生产过程中的决策问题 一、问题1解析 问题1的任务是为企业设计一个合理的抽样检测方案,基于少量样本推断整批零配件的次品率,帮助企业决定是否接收供应商提供的这批零配件。具体来说,企业需要依据两个不同…...
P1166 打保龄球
共可以投 1 局 一局10轮 在一局中,一共有十个柱,会出现很多种情况。 第1次把10个 打倒全部 >> 分数10后2次得分 --若是第10轮则还需另加两次滚球; 没全部打倒 >> 第2次把剩下的 打倒 >&g…...
[数据集][目标检测]西红柿成熟度检测数据集VOC+YOLO格式3241张5类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):3241 标注数量(xml文件个数):3241 标注数量(txt文件个数):3241 标注…...
数仓工具—Hive语法之URL 函数
hive—语法—URL 函数 业务需求中,我们经常需要对用户的访问、用户的来源进行分析,用于支持运营和决策。例如我们经常对用户访问的页面进行统计分析,分析热门受访页面的Top10,观察大部分用户最喜欢的访问最多的页面等: 又或者我们需要分析不同搜索平台的用户来源分析,统…...
c#如何实现触发另外一个文本框的回车事件
一.需求 我需要实现listview中的一行双击后,将其中的一个值传给一个文本框,传完后,给文本框一个回车指令。 我的方法:后面加上 \rthis.txt_ID.Text this.listView1.SelectedItems[0].Text"\r" 结果无效。 二.问通义…...
Vue 中 nextTick 的最主要作用是什么,为什么要有这个 API
在 Vue.js 中,nextTick 是一个用于在 DOM 更新后执行代码的 API。它的主要作用是确保在某个操作完成后,DOM 已经更新且可以被访问或操作。这个 API 在处理需要等待 DOM 更新完成的逻辑时非常有用。 nextTick 的最主要作用 确保 DOM 更新完成: Vue 的响应…...
python科学计算:NumPy 数组的运算
1 数组的数学运算 NumPy 提供了一系列用于数组运算的函数和操作符,这些运算可以作用于数组的每个元素上。常见的数学运算包括加、减、乘、除等。 1.1 元素级运算 NumPy 支持对数组的每个元素进行逐元素运算。这些操作可以通过标准的数学符号或 NumPy 函数来完成。…...
浅谈 React Hooks
React Hooks 是 React 16.8 引入的一组 API,用于在函数组件中使用 state 和其他 React 特性(例如生命周期方法、context 等)。Hooks 通过简洁的函数接口,解决了状态与 UI 的高度解耦,通过函数式编程范式实现更灵活 Rea…...
Chapter03-Authentication vulnerabilities
文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...
云启出海,智联未来|阿里云网络「企业出海」系列客户沙龙上海站圆满落地
借阿里云中企出海大会的东风,以**「云启出海,智联未来|打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办,现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...
【第二十一章 SDIO接口(SDIO)】
第二十一章 SDIO接口 目录 第二十一章 SDIO接口(SDIO) 1 SDIO 主要功能 2 SDIO 总线拓扑 3 SDIO 功能描述 3.1 SDIO 适配器 3.2 SDIOAHB 接口 4 卡功能描述 4.1 卡识别模式 4.2 卡复位 4.3 操作电压范围确认 4.4 卡识别过程 4.5 写数据块 4.6 读数据块 4.7 数据流…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
高防服务器能够抵御哪些网络攻击呢?
高防服务器作为一种有着高度防御能力的服务器,可以帮助网站应对分布式拒绝服务攻击,有效识别和清理一些恶意的网络流量,为用户提供安全且稳定的网络环境,那么,高防服务器一般都可以抵御哪些网络攻击呢?下面…...
根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:
根据万维钢精英日课6的内容,使用AI(2025)可以参考以下方法: 四个洞见 模型已经比人聪明:以ChatGPT o3为代表的AI非常强大,能运用高级理论解释道理、引用最新学术论文,生成对顶尖科学家都有用的…...
Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理
引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...
Python 包管理器 uv 介绍
Python 包管理器 uv 全面介绍 uv 是由 Astral(热门工具 Ruff 的开发者)推出的下一代高性能 Python 包管理器和构建工具,用 Rust 编写。它旨在解决传统工具(如 pip、virtualenv、pip-tools)的性能瓶颈,同时…...
