HDFS Erasure coding-纠删码介绍和原理
HDFS Erasure coding-纠删码介绍和原理
- 三副本策略弊端
- Erasure Coding(EC)简介
- Reed- Solomon(RS)码
- EC架构
三副本策略弊端
- 为了提供容错能力,hdfs回根据replication factor(复制因子)在不同的datanode上复制文本块
- 默认复制因子为3,(注意这里的3指的是1+2=3,不是额外3个),则原始块除外,还将有额外两个副本。每个副本使用100%的存储开销,因此导致200%的存储开销。这些副本也消耗其他资源,例如网络带宽
- 在复制因子为N时,存在N-1个容错能力,但存储效率仅为1/N

Erasure Coding(EC)简介
- 纠删码技术简称EC,是一种编码容错技术。最早用于通信行业,数据传输中的数据恢复。它通过对数据进行分块,然后计算出校验数据,是的各个部分的数据产生关联性。当一部分数据块丢失时,可以通过剩余的数据块和校验块计算出丢失的数据块
- Hadoop3.0之后引入了纠删码技术,它可以提高50%以上的存储利用率,并且保证数据的可靠性

Reed- Solomon(RS)码
- reed-solomon(rs)码是常用的一种纠删码,它有两个参数k和m,记为RS(k,m)
- k个数据块组成一个向量被乘上一个生成矩阵(Generator Matrix)GT从而得到一个码字(codeword)向量,该向量由k个数据块(d0,d1…d3)和m个校验块(c0,c1)组成
- 如果数据块丢失,可以用GT逆矩阵乘以码字向量来恢复出丢失的数据块。


EC架构
为了支持纠删码,HDFS体系结构进行了一些更改调整
- namenode扩展
- 条带化的HDFS文件在逻辑上由block group(块组)组成,每个块组包含一定数量的内部块。这允许在块组级别而不是块级别进行文件管理
- 客户端扩展
- 客户端的读写路径的到来增强,可以并行处理块组中的多个内部块
- datanode扩展
- datanode运行一个附加的ECWorker任务,以对失败纠删编码块进行后台恢复。namenode检测到是吧的EC块,然后namenode选择一个datanode进行恢复工作
- 纠删码策略
为了适应异构的工作负载,允许HDFS集群中的文件和目录具有不同的复制和纠删码策略。纠删码策略封装了如何对文件进行编码/解码。默认情况下启用RS-6-31024k策略,RS便是编码算法Reed-Solomon,6,3中表示数据块和奇偶校验块的数量,1024k表示条带化单元的大小
目录上还支持默认的REPLICSTION方案。它只能在目录上设置,以强制目录采用3倍复制方案,而不是继承器族乡的纠缠吗策略。此策略可以是3x复制方案目录与纠错码目录交错。REPLICSTION始终处于穷状态
此外也支持用户通过XML文件定义自己的EC策略,Hadoop conf目录中有一个名为uers_ec_policies.xml.template的示例EC策略XML文件,用户可以参考该文件 - Inter ISA-L
英特尔ISA-L代表英特尔智能存储加速库。isa-l是针对存储应用程序而优化的低级功能开源集合。它包括针对Intel AVX和AVX2指令优化的快速块Reed- Solomon类型擦除代码。HDFS纠删码可以利用ISA-L加速编码和加码计算
相关文章:
HDFS Erasure coding-纠删码介绍和原理
HDFS Erasure coding-纠删码介绍和原理 三副本策略弊端Erasure Coding(EC)简介Reed- Solomon(RS)码 EC架构 三副本策略弊端 为了提供容错能力,hdfs回根据replication factor(复制因子)在不同的…...
STM32 DHT11
DHT11 DHT11数字温湿度传感器是一款含有已校准数字信号输出的温湿度复合传感器。 使用单总线通信 该传感器包括一个电容式感湿元件和一个NTC测温元件,并于一个高性能8位单片机相连(模数转换)。 DHT11引脚说明 开漏模式下没有输出高电平的能…...
词法分析器
词法分析器 在早期编译1.0时代,我们的目标是完成程序语言到机器语言的翻译,所以重点在编译器前端,于是我们花费大量时间研究词法分析、语法分析、语义分析等内容。如今的本科编译原理课程,基本上也就到这一层面吧。 在编译2.0时…...
【Spring】Spring之启动过程源码解析
概述 我们说的Spring启动,就是构造ApplicationContext对象以及调用refresh()方法的过程。 Spring启动过程主要做了这么几件事情: 构造一个BeanFactory对象解析配置类,得到BeanDefinition,并注册到BeanFactory中 解析ComponentS…...
状态模式(State)
状态模式是一种行为设计模式,允许一个对象在其内部状态改变时改变它的行为,使其看起来修改了自身所属的类。其别名为状态对象(Objects for States)。 State is a behavior design pattern that allows an object to change its behavior when its inter…...
【uniapp】样式合集
1、修改uni-data-checkbox多选框的样式为单选框的样式 我原先是用的单选,但是单选并不支持选中后,再次点击取消选中;所以我改成了多选,然后改变多选样式,让他看起来像单选 在所在使用的页面上修改样式即可 <uni-d…...
【Spring框架】SpringBoot统一功能处理
目录 用户登录权限校验用户登录拦截器排除所有静态资源练习:登录拦截器拦截器实现原理 统一异常处理统一数据返回格式为什么需要统⼀数据返回格式?统⼀数据返回格式的实现 用户登录权限校验 用户登录拦截器 1.自定义拦截器 package com.example.demo.…...
51单片机学习--按键控制流水灯模式定时器时钟
TMOD负责确定T0和T1的工作模式,TCON控制T0和T1的启动或停止计数,同时包含定时器状态 TF1:定时器1溢出标志 TF0:定时器0溢出标志 0~65535 每隔1微秒计数器1,总时间65535微秒,赋上初值64535,则只…...
Django教程_编程入门自学教程_菜鸟教程-免费教程分享
教程简介 Django是一个开放源代码的Web应用框架,由Python写成。采用了MTV的框架模式,即模型M,视图V和模版T。它最初是被开发来用于管理劳伦斯出版集团旗下的一些以新闻内容为主的网站的,即是CMS(内容管理系统…...
VGG卷积神经网络-笔记
VGG卷积神经网络-笔记 VGG是当前最流行的CNN模型之一, 2014年由Simonyan和Zisserman提出, 其命名来源于论文作者所在的实验室Visual Geometry Group。 测试结果为: 通过运行结果可以发现,在眼疾筛查数据集iChallenge-PM上使用VGG…...
Python爬虫如何实现IP代理池搭建
大家好,作为一名IP代理产品供应商,我知道很多人在使用Python爬虫时遇到了一些麻烦。有时候,我们的爬虫在爬取过程中会被目标网站识别并封禁IP,导致我们的爬取任务受阻。今天我要分享的就是如何搭建一个高效稳定的IP代理池…...
单例模式:保证一个类只有一个实例
单例模式:保证一个类只有一个实例 什么是单例模式? 在软件开发中,有些类只需要一个实例,比如数据库连接池、线程池等。单例模式就是一种设计模式,用于确保一个类只有一个实例,并提供一个全局访问点。 实…...
【新版系统架构补充】-七层模型
网络功能和分类 计算网络的功能 :数据通信、资源共享、管理集中化、实现分布式处理、负载均衡 网络性能指标:速率、带宽(频带宽度或传送线路速率)、吞吐量、时延、往返时间、利用率 网络非性能指标:费用、质量、标准化…...
第2章 C语言概述
本章介绍以下内容: 运算符: 函数:main()、printf() 编写一个简单的C程序 创建整型变量,为其赋值并在屏幕上显示其值 换行字符 如何在程序中写注释,创建包含多个函数的程序,发现程序的错误 什么是关键字 C程…...
vscode vue3开发常用插件(附Prettier格式化配置)
必不可少插件(名称可能不全): 1、Chinese (Simplified) (简体中文) Language 2、Prettier - Code formatter 3、Vue 3 Snippets 4、Vue Language Features (Volar) 可选插件: 5、Auto Close Tag 6、Vue Theme Prettier格式化配置: 按ctr…...
【微信小程序】van-uploader实现文件上传
使用van-uploader和wx.uploadFile实现文件上传,后端使用ThinkPHP。 1、前端代码 json:引入van-uploader {"usingComponents": {"van-uploader": "vant/weapp/uploader/index"} }wxml:deletedFile是删除文件函…...
人工智能在计算机视觉中的应用与挑战
引言 计算机视觉是人工智能领域的一个重要分支,旨在让计算机能够像人一样理解和解释视觉信息,实现图像和视频的自动识别、理解和分析。计算机视觉技术已经在许多领域产生了深远的影响,如人脸识别、自动驾驶、医学影像分析等。本篇博客将深入…...
以太网接口指示灯状态分析和电路设计
一、RJ45以太网连接器介绍 以带网络隔离变压器的RJ45接头为例,如HR911105A,其技术参数如下 原理框图 指示灯部分 二、PHY芯片 phy芯片以DP83848CVV/NOPB为例,查看数据手册。引脚26,引脚27和引脚28和LED灯相关,如下截…...
Redis的基础
一、进入redis 内部 / 关闭 # 方式一: // 进入redis redis-cli // 有密码输入密码 :auth [username] password auth 123456 # 方式二: // 进入redis 并且输入密码 redis-cli -a 123456// 如果在docker 里面的则可以 docker exec -it redis…...
LeetCode 626. 换座位
题目链接:LeetCode 626. 换座位 题目描述 表名:Seat 编写SQL查询来交换每两个连续的学生的座位号。如果学生的数量是奇数,则最后一个学生的id不交换。 按 id 升序 返回结果表。 查询结果格式如下所示。 示例1: 题目分析 如…...
5分钟快速解密网易云音乐NCM格式:免费工具实现音乐自由播放
5分钟快速解密网易云音乐NCM格式:免费工具实现音乐自由播放 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM格式文件无法在其他播放器使用而烦恼吗?ncmdump是一款高效便捷的NCM格式…...
终极RDP Wrapper完整指南:3步解决Windows远程桌面限制 [特殊字符]
终极RDP Wrapper完整指南:3步解决Windows远程桌面限制 🚀 【免费下载链接】rdpwrap RDP Wrapper Library 项目地址: https://gitcode.com/gh_mirrors/rd/rdpwrap RDP Wrapper Library 是一款革命性的开源工具,它让Windows家庭版也能拥…...
YOLO12多尺度检测效果展示:同一图像不同分辨率输入结果对比图集
YOLO12多尺度检测效果展示:同一图像不同分辨率输入结果对比图集 1. 引言:为什么分辨率对目标检测如此重要? 想象一下,你用手机拍了一张远处的风景照,照片里有个很小的人影。当你把照片放大看时,这个人影可…...
【AIAgent架构混沌工程实战白皮书】:20年SRE专家亲授5大高危故障注入模式与3类生产级熔断验证框架
第一章:AIAgent架构混沌工程实战白皮书导论 2026奇点智能技术大会(https://ml-summit.org) AIAgent系统正从单体推理服务演进为多智能体协同、动态编排、跨模态感知的复杂运行时生态。其架构天然具备高耦合性、强状态依赖与非确定性决策特征,传统测试手…...
BAAI/bge-m3应用案例:多语言内容去重,一键检测文章相似性
BAAI/bge-m3应用案例:多语言内容去重,一键检测文章相似性 1. 引言 1.1 从信息过载到精准过滤 你有没有遇到过这样的困扰?每天需要处理海量的文档、新闻稿、用户反馈或者产品描述,其中充斥着大量内容相似甚至重复的信息。手动筛…...
Nginx+ModSecurity 3.0.x WAF实战:从安装到规则配置的完整防护方案
NginxModSecurity 3.0.x WAF实战:从安装到规则配置的完整防护方案 在当今数字化时代,网站安全防护已成为每个技术团队必须面对的核心挑战。Web应用防火墙(WAF)作为抵御SQL注入、XSS攻击等常见威胁的第一道防线,其重要性不言而喻。本文将带您深…...
2026年OpenClaw怎么集成?阿里云1分钟保姆级教程+大模型APIKey配置、Skill集成教程
2026年OpenClaw怎么集成?阿里云1分钟保姆级教程大模型APIKey配置、Skill集成教程。本文面向零基础用户,完整说明在轻量服务器与本地Windows11、macOS、Linux系统中部署OpenClaw(Clawdbot)的流程,包含环境配置、服务启动…...
100G SFP光模块全解读:核心定义、关键特性与主流应用场景
在高速光通信网络飞速发展的当下,100G速率已成为数据中心、城域网、5G承载网等场景的核心传输需求,而100G SFP光模块作为实现光电信号转换的关键器件,凭借小巧的体积、灵活的适配性,成为连接网络设备、支撑高速数据传输的核心载体…...
汽车紧固件最新技术趋势解析:2026上海紧固件专业展有哪些看点
汽车工业正经历一场深刻变革,电动化与智能化的浪潮席卷而来,对作为车辆“骨骼关节”的紧固连接技术提出了前所未有的高要求。汽车紧固件的技术演进路径正清晰地围绕四大核心趋势展开:轻量化、高强度、智能化与绿色化。这不仅是单一技术的突破…...
【愚公系列】《剪映+DeepSeek+即梦:短视频制作》057-剪映智能剪辑+多款AI工具联动(剪映的AI剪视频)
💎【行业认证权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋&am…...
