VMware vSAN OSA存储策略 - 基于虚拟机的分布式对象存储
简介
博客:https://songxwn.com/
存储策略 (Storage Policy) 是管理员定义的一组规则,这组规则定义了数据对象在 vSAN 存储上是如何保存的,存储策略定义了数据存储的可靠性、访问性能等特性。vSAN 提供了基于存储策略的存储管理 SPBM (Storage Policy-Based Management),管理员创建多个存储策略,利用 SPBM 来对 vSAN 存储进行灵活地管理,SPBM 是 vSAN 的一个重要特色。
本文简单介绍了vSAN 的OSA架构,从vSphere 5.5版本开始到7.0,只支持OSA,8.0以后除了支持OSA外,还支持ESA(Express Storage Architecture)。
OSA为传统架构,支持SSD+HDD的混合组,或者容量SSD+高速SSD的全闪存组。有容量和性能存储分层。
ESA为全新闪存架构,要求使用4块以上的NVME SSD,512G内存、25G网络。无存储分层。
起源
据说啊OSA架构是借鉴了路坦力(Nutanix)的设计,大概是2013年,SSD的价格还很贵,这个设计就是利用SSD的高性能,作为读写缓存,提升超融合存储的性能,算是个划时代的产品。VMware的vSAN借鉴了这个思路,当年路坦力的产品依附在VMware平台上,而VMware几乎是抄袭了路坦力,把路坦力气的嘚嘚的,最后导致路坦力和VMware翻脸。
vSAN 基于虚拟机为对象的超融合分布式存储
Distributed RAID:
vSAN将数据按一定的规则(Storage Policy)分布到集群各个物理主机上,确保数据可以在发生主机或存储设备故障的时候可以恢复,类似于磁盘整理上的RAID技术,可以理解成分布式的RAID
Objects:
vSAN是一个对象存储,虚拟机是由多个对象组成,如虚拟机磁盘(VMDK),存储虚拟机配置的VM home namespace,namespace这种对象,可以理解成目录,vSAN的性能数据,ISO文件,内容库这些都是以namesapce的类型存储的;当虚拟开机的时候,VM swap object会被创建;当故障发生的时候,vSAN会创建叫“durablility componet”的对象,以存储新写入的数据。
每个虚拟机都可以应用一个存储策略,这代表每台虚拟机冗余方法都可以不一样。而数据分布也是每台都是不同,分布在不同容量硬盘上。
Component
为了Object可以在故障的时候恢复,所以vSAN将Object切成更小的块(chunk),一个object由多个componet构成,可以理解为下图
重要的存储策略概念
对象磁盘条带数 (Number of disk stripes per object)
把虚机对象分成多个条带 (stripe) 分布存储在多个硬盘上,这样有助于提高数据读取的性能。在下图的例子中,所示的虚机被分为两个条带 a 和 b 进行存储;因为同时又采用了 Raid-1,所以虚机对象又被保存了两个副本,一个副本在服务器 ESX01 的磁盘组中,另一个副本存放在位于服务器 ESX02 和 ESX03 上的磁盘组中。(其实就相当于 RAID 10)
对象条带数实际上就是 Raid-0 的概念,只不过我们在定义 Raid-0 的配置时,更多使用的是条带宽度 (stripe width) 的概念,条带宽度是指每一块条带块的大小,条带数量取决于组成 Raid-0 阵列的磁盘数量。vSAN 中对象条带数缺省为1 (建议不要改动这个值),最大值为12。把这个值设置成大于1能够提高系统性能,但是会引起更多的资源消耗。
读缓存预留 (Flash read cache reservation %)
无论是机械硬盘和 SSD 组成的混合架构,还是由高速NVME SSD 和普通SAS/SATA SSD 组成的全闪存架构,vSAN 都会把两种设备中性能更高的那种设备用作读写缓存(全闪只会用于写缓存),从而来提高整个系统的性能。这个参数指定了为虚机对象保留的缓存 SSD 空间占比 (相对于虚机大小),缺省为0% ;建议一般情况下不要改动这个值,仅当特定情况下需要提高性能时才改动。
vSAN OSA 混合硬盘组里面的缓存盘划分写缓冲区(30%)和读缓存区(70%)。
vSAN OSA 全闪存硬盘里面的缓存盘只用于写缓存,最高利用容量为 600G / 1.6TB。(vSAN8 可扩展到1.6TB)
vSAN OSA 缓存和容量硬盘比应该是 1/10。
对象空间预留 (Object space reservation %)
vSphere 在创建虚机时虚拟硬盘有三种格式可以选择:
-
Thick Provision Lazy Zeroed(厚置延迟置零):一开始就分配足额空间给虚拟硬盘,但是等真正写入数据时才初始化(写 0);
-
Thick Provision Eager Zeroed(厚置快速置零):一开始就分配足额空间给虚拟硬盘,并且完全初始化(写 0),性能最优;
-
Thin Provision(精简置备):根据虚拟硬盘的实际使用来分配空间,但在性能上要比上面两种差一些。
一般为了节省存储空间的话,会使用精简置备。
对象空间预留参数定义了创建虚机对象时,如果虚机采用的是 Thin Provision 方式的话,必须为虚机保留的存储空间比例 (相对于虚机的大小)。
可以忍受的故障数 FTT (Failure to Tolerate)
FTT (Failure to Tolerate) 是定义数据保护等级的一个重要参数,FTT = 1 意味着可以忍受一个节点的故障。跟 FTT 紧密相关的另一个参数是数据保护方法 FTM (Failure Tolerance Method),FTM 也定义了数据布局的方式,vSAN 中的 FTM 主要有 Raid-1、Raid-5 和 Raid-6 这几种。
Raid-1 就是镜像 (Mirroring),在另一台服务器的磁盘组上保存数据的副本,当其中一台服务器发生故障时,也可以保证数据不丢失。下图展示了 Raid-1 的工作原理,同一个数据对象存在两个副本分别存放在两台服务器上,这种情况下对应 FTT = 1。
Raid-5 跟传统的 Raid 5 磁盘阵列类的概念类似,只不过阵列不是由同一台服务器上磁盘组成,而是由多台服务器上的磁盘组成,通过增加奇偶校验块来提高数据的容错能力。Raid-5 最少要求4个服务器节点,可以实现 FTT = 1 的容错要求。跟 Raid-1 相比,Raid-5 可以至少节省 30% 的存储空间。(在OSA架构下,性能会有一定下降。)
Raid-6 的工作原理跟 Raid-5 类似,只不过采用了双份的奇偶校验块,从而使数据的容错能力进一步提高。Raid-6 最少要求6个服务器节点,可以实现 FTT = 2 的容错要求。跟 Raid-1 相比,Raid-6 可以至少节省 50% 的存储空间。(在OSA架构下,性能会有一定下降。)
vSAN 中的 Raid-5/6 也称之为纠删码 (Erasure Coding),我们可以把它理解成一种跨服务器的 Raid 阵列实现。
在ESA架构中 Raid-5/6 的性能被优化到和RAID1 接近。
IOPS (Input / Output Per Second) 限制
IOPS 是衡量存储性能的一个重要指标,vSAN 通过为虚机指定 IOPS 限制值,来控制虚机可以获得的存储访问 QoS (Quality of Service) 服务质量等级。通过这个值的设定可以限制某些非关键应用虚机对于 vSAN 性能的占用,从而保证关键应用虚机的存储访问性能。
校验和 (checksum) 验证
校验和 (checksum) 是在数据处理和数据通信领域中,用于校验数据正确性的一种方法:把数据的各个位数累加起来,在处理数据结束之后根据这个数值判断是否接收到的数据是否正确,如果数值匹配那么说明数据被正确地处理了。校验和通常是以十六进制为数制表示的形式来进行计算,如十六进制串: 0102030405060708 的校验和是 24 (十六进制,十进制累加结果为36)。
vSAN 在写入数据时同时也写入该数据的校验和,作为日后比对的依据。打开该功能时,vSAN 在后台执行磁盘扫描 (Disk Scrubbing),如果通过校验和验证发现了错误,则重建数据,能够自动检测和解决静态磁盘错误 (silent disk errors)。
强制调配 (Force Provisioning)
当存储策略中设定的规则不能满足时,vSAN 也可以强制为虚机分配存储空间,保证在一些极端条件下 (如存储空间不够) 也能够为虚机分配空间,让系统能够正常地运行下去。
存储策略的定义和使用
定义存储策略
存储策略必须在虚机创建之前建立,这样才可以在虚机创建时选择使用;当然 vSAN 有缺省的存储策略,如果没什么特殊需求的话,就可以使用缺省的策略。下图示意了虚机存储策略是如何被创建的,创建之后就可以在 web client 管理控制台中看到 vSAN 集群中现有的存储策略。
使用存储策略
接下来就可以在创建虚机的时候指定它所使用的存储策略了,或是修改现有虚机的存储策略。下图示意了修改一个虚机存储策略的过程,管理员修改了虚机的存储策略后,vSAN 会根据新的策略来调整虚机数据的存储布局,以符合新的存储策略的要求。
检查存储策略的合规性 (Compliant)
管理员也可以去检查虚机对象的存储是否符合存储策略的规定,合规 (Compliant) 的意思就是 vSAN 存储满足了存储策略定义的要求。在存储空间资源短缺的情况下,也会产生不合规的情况,例如要求采用镜像来保存虚机对象,如果其他服务器上没有足够空间的话,结果只保存了一份虚机对象副本。如果出现不合规情况的话,就意味着数据对象没有得到应有的安全保护,也有可能是存储策略设置得不合理,管理员就要立即采取行动,找出造成违规的原因。
vSAN规划注意
-
至少单台物理服务器256G 内存以上。
-
每台服务器CPU是同型号,最少是同代。建议近三年发布的。
-
要求有单独的接入交换机(方便网络接入)。
-
要求集群数量最少三台,推荐为四台以上。
-
vSAN 集群网络之间延迟要求小于1毫秒,最好独立VLAN。
-
要求有单独两块硬盘做RAID1 作为系统盘,独立于vSAN。
-
vSAN 至少要求一个SSD+一个HDD,推荐为两块SDD 作为缓存层,两块HDD作为容量层,作为两个硬盘组。
-
缓存硬盘和容量硬盘的总容量比应该为1:10
-
vSAN网络要求10G起步,推荐使用25G*2
-
缓存盘和容量盘要求直通或RAID0,推荐用SAS卡接入,有一定队列深度要求。
-
集群中所有vSAN主机相互访问延迟不应该大于1MS.
-
网卡要求四个10G网卡,其中两个作为管理、虚拟机迁移、vSAN网络。其他两个为业务网卡。
-
单个阵列卡,RAID和直通模式不能混用,否则vSAN会有问题。vSAN告警
-
vSAN 规定每个磁盘组最少需要一块SSD作为缓存+一块HDD/SSD作为容量层,最多一块+7块HDD/SSD作为容量层。每台主机不能多于 5 个磁盘组。(vSAN会占用内存、 HA也会预留内存)
-
vSAN缓存盘,30%作为写缓存 70%作为读缓存。每个磁盘组仅可以有一个缓存盘。
-
vSAN OSA 混合硬盘组,缓存层和容量层的大小比应该最小为 1:10
-
vSAN OSA 全闪存硬盘组,缓存盘最大利用率为600G。可增加使用到1.6TB
-
vSAN ESA 架构,需要每台至少有512G内存,四个NVME SSD,两个25G网卡。
-
vSAN可以部署RDMA 增加性能,但需要网卡+交换机支持。
硬件兼容性查询:https://www.vmware.com/resources/compatibility/search.php
延伸阅读
将 VMware vSphere / vSAN 软件与 Intel 的最新硬件平台技术相结合,可以为用户交付最佳的超融合架构平台,帮助用户简化数据中心管理,降低采购和运维成本,轻松应对企业在数字化转型中面对的各种挑战。(AMD目前的服务器CPU性价比更高。)
-
VMware vSAN 是最佳的存储方案平台,具有管理简便、高性能、低成本、易扩展的特点,在 vSAN 平台上可以支持任何类型的应用。
-
Intel 至强处理器提供最强计算能力,基于傲腾 (Optane) 和 3D NAND 技术的固态盘是理想的高速缓存,以太网融合网卡提供稳定的网络带宽和低网络延迟。(傲腾 产品线已经被放弃了。)
参考文档
https://blogs.vmware.com/china/2018/12/29/vsan-%E5%AD%98%E5%82%A8%E7%AD%96%E7%95%A5%E6%BC%94%E7%A4%BA/
https://communities.vmware.com/t5/VMware-vSAN-Discussions/cache-size-in-vSAN-6-2/td-p/2225513
https://zhuanlan.zhihu.com/p/686508940
相关文章:

VMware vSAN OSA存储策略 - 基于虚拟机的分布式对象存储
简介 博客:https://songxwn.com/ 存储策略 (Storage Policy) 是管理员定义的一组规则,这组规则定义了数据对象在 vSAN 存储上是如何保存的,存储策略定义了数据存储的可靠性、访问性能等特性。vSAN 提供了基于存储策略的存储管理 SPBM (Stor…...

JUC内容概述
复习概念 Sleep和Wait的区别 Sleep是Thread的静态方法,wait是Object的方法,任何对象实例都可以使用sleep不会释放锁,他也不需要占用锁,暂停。wait会释放锁,但是调用他的前提是线程占有锁他们都可以被Interrupted方法…...
postcss安装和使用
要安装和使用 PostCSS,你可以按照以下步骤操作: 步骤一:安装 PostCSS 在项目目录下,通过 npm 初始化一个新的 package.json 文件(如果还没有): npm init -y 安装 PostCSS 和必要的插件&#x…...

macOS 13 Ventura (苹果最新系统) v13.6.6正式版
macOS 13 Ventura是苹果电脑的全新操作系统,它为用户带来了众多引人注目的新功能和改进。该系统加强了FaceTime和视频通话的体验,同时优化了邮件、Safari浏览器和日历等内置应用程序,使其更加流畅、快速和安全。特别值得一提的是,…...

WordPress Git主题 响应式CMS主题模板
分享的是新版本,旧版本少了很多功能,尤其在新版支持自动更新后,该主题可以用来搭建个人博客,素材下载网站,图片站等 主题特点 兼容 IE9、谷歌 Chrome 、火狐 Firefox 等主流浏览器 扁平化的设计加响应式布局&#x…...

安卓国内ip代理app,畅游网络
随着移动互联网的普及和快速发展,安卓手机已经成为我们日常生活和工作中不可或缺的一部分。然而,由于地理位置、网络限制或其他因素,我们有时需要改变或隐藏自己的IP地址。这时,安卓国内IP代理App便成为了一个重要的工具。虎观代理…...

Day53:WEB攻防-XSS跨站SVGPDFFlashMXSSUXSS配合上传文件添加脚本
目录 MXSS UXSS:Universal Cross-Site Scripting HTML&SVG&PDF&SWF-XSS&上传&反编译(有几率碰到) SVG-XSS PDF-XSS Python生成XSS Flash-XSS 知识点: 1、XSS跨站-MXSS&UXSS 2、XSS跨站-SVG制作&配合上传 3、XSS跨站-…...

k8s安装traefik作为ingress
一、先来介绍下Ingress Ingress 这个东西是 1.2 后才出现的,通过 Ingress 用户可以实现使用 nginx 等开源的反向代理负载均衡器实现对外暴露服务,以下详细说一下 Ingress,毕竟 traefik 用的就是 Ingress 使用 Ingress 时一般会有三个组件: …...

如何在Windows 10中打开屏幕键盘?这里有详细步骤
本文解释了在Windows 10中打开或关闭屏幕键盘的不同方法,还解释了如何将屏幕键盘固定到开始菜单。 使用屏幕键盘的快捷键 如果你喜欢快捷方式,你会喜欢这个:按物理键盘上的WinCTRLO。这将立即显示屏幕键盘,而无需通过轻松使用。…...

【Pt】马灯贴图绘制过程 03-制作油渍、积尘效果
目录 效果 一、制作油渍效果 1.1 基本油渍 1.2 流淌的油渍痕迹 二、制作浮尘效果 三、制作积尘效果 效果 一、制作油渍效果 1.1 基本油渍 将上篇制作的“锈迹_深色”和“锈迹_浅色”两个文件夹再次合并为一个文件夹 这里就命名为“锈迹” 添加一个填充图层 设置Base …...
python-numpy-常用函数详解
文章目录 一、函数详解np.empty(num_points)np.zeros(shape, dtypefloat, orderC)np.tile(A, reps)np.newaxisnumpy.stack(arrays, axis0)np.roll(a, shift, axisNone) 二、实例矩阵进行扩展三行,使得每一行都与第一行相同二维数组每行减去不同的数 一、函数详解 n…...

UE小:基于UE5的两种Billboard material(始终朝向相机材质)
本文档展示了两种不同的效果,分别是物体完全朝向相机和物体仅Z轴朝向相机。通过下面的演示和相关代码,您可以更加直观地理解这两种效果的差异和应用场景。 1. 完全朝向相机效果 此效果下,物体将完全面向相机,不论相机在哪个角度…...
spring boot actuator 安全配置 springboot的安全性
关于springboot Actuator框架的安全配置方案: 加入security安全验证框架 方案一: 配置信息: spring:security:user:password: adminname: adminmanagement:endpoints:web:base-path: /monitorexposure:include: "*"# 排除端点e…...

macOS Sonoma如何查看隐藏文件
在使用Git进行项目版本控制时,我们可能会遇到一些隐藏文件,比如.gitkeep文件。它通常出现在Git项目的子目录中,主要作用是确保空目录也可以被跟踪。 终端命令 在尝试查看.gitkeep文件时,使用Terminal命令来显示隐藏文件 default…...
深入浅出:语言模型的原理、实战与评估
深入浅出:语言模型的原理、实战与评估 1. 引言1.1. 关于语言模型1.2. 语言模型的重要性 2. 语言模型简介2.1. 语言模型的类型2.2. 技术演进 3. 语言模型的原理3.1. 概率基础3.2. 深度学习模型 4. 语言模型的实战应用4.1. 数据准备4.2. 模型训练4.3. 应用场景 5. 语言…...

基于ssm的线上旅行信息管理系统论文
摘 要 随着旅游业的迅速发展,传统的旅行信息查询管理方式,已经无法满足用户需求,因此,结合计算机技术的优势和普及,特开发了本线上旅行信息管理系统。 本论文首先对线上旅行信息管理系统进行需求分析,从系…...

Jupyter开启远程服务器(最新版)
Jupyter Notebook 在本地进行访问时比较简单,直接在cmd命令行下输入 jupyter notebook 即可,然而notebook的作用不止于此,还可以用于远程连接服务器,这样如果你有一台服务器内存很大,但是呢你又不喜欢在linux上进行操作…...
【SpringCloud微服务实战10】DevOps自动化部署微服务项目(Jenkins+Docker+K8s)
一、什么是 DevOps DevOps 是一种重视软件开发人员(Developer)和运维人员(Operations)之间沟通与协作的文化、运动或实践,目标在于快速交付高质量的软件产品和服务。DevOps 强调自动化流程、持续集成与交付(CI/CD)、以及通过工具链、敏捷方法论和跨职能团队协作来增强软…...

DSVPN实验报告
一、分析要求 1. 配置R5为ISP,只能进行IP地址配置,所有地址均配为公有IP地址。 - 在R5上,将接口配置为公有IP地址,并确保只进行了IP地址配置。 2. R1和R5之间使用PPP的PAP认证,R5为主认证方;R2于R5之间…...

Linux:Jenkins:参数化版本回滚(6)
上几章我讲到了自动集成和部署 Linux:Jenkins全自动持续集成持续部署(4)-CSDN博客https://blog.csdn.net/w14768855/article/details/136977106 当我们觉得这个页面不行的时候,需要进行版本回滚,回滚方法我这里准备了…...

龙虎榜——20250610
上证指数放量收阴线,个股多数下跌,盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型,指数短线有调整的需求,大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的:御银股份、雄帝科技 驱动…...
【杂谈】-递归进化:人工智能的自我改进与监管挑战
递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...
前端倒计时误差!
提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...

PPT|230页| 制造集团企业供应链端到端的数字化解决方案:从需求到结算的全链路业务闭环构建
制造业采购供应链管理是企业运营的核心环节,供应链协同管理在供应链上下游企业之间建立紧密的合作关系,通过信息共享、资源整合、业务协同等方式,实现供应链的全面管理和优化,提高供应链的效率和透明度,降低供应链的成…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...

vue3+vite项目中使用.env文件环境变量方法
vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...
Java 二维码
Java 二维码 **技术:**谷歌 ZXing 实现 首先添加依赖 <!-- 二维码依赖 --><dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...
使用Matplotlib创建炫酷的3D散点图:数据可视化的新维度
文章目录 基础实现代码代码解析进阶技巧1. 自定义点的大小和颜色2. 添加图例和样式美化3. 真实数据应用示例实用技巧与注意事项完整示例(带样式)应用场景在数据科学和可视化领域,三维图形能为我们提供更丰富的数据洞察。本文将手把手教你如何使用Python的Matplotlib库创建引…...
JS设计模式(4):观察者模式
JS设计模式(4):观察者模式 一、引入 在开发中,我们经常会遇到这样的场景:一个对象的状态变化需要自动通知其他对象,比如: 电商平台中,商品库存变化时需要通知所有订阅该商品的用户;新闻网站中࿰…...

算法:模拟
1.替换所有的问号 1576. 替换所有的问号 - 力扣(LeetCode) 遍历字符串:通过外层循环逐一检查每个字符。遇到 ? 时处理: 内层循环遍历小写字母(a 到 z)。对每个字母检查是否满足: 与…...