当前位置：首页 > news >正文

ceph文件系统

news 2026/4/19 5:03:32

ceph文件系统：高度可扩展，分布式的存储文件系统，旨在提高性能，高可靠性和高可用的对

象存储，块存储，文件系统的存储。使用分布式的算法保证数据的高可用和一致性。

ceph的组件

1、MON：ceph monitor，负责存储和维护整个ceph集群的状态信息，主要是集群的成员信息，存

储状态和配置数据等等。

确保集群的一致性
处理选举和状态的更新
处理集群内部成员的通信，包括故障转移
ceph当中mon至少要有3个节点确保高可用

2、osd：ceph object storage daemon，ceph存储系统的核心组件，负责存储数据，处理

读写请求，数据复制，数据恢复。每个osd节点管理一个或多个硬盘驱动。

存储实际的数据和副本
处理对象级别的数据操作，读、写、删
在节点付账时，进行数据恢复

3、mds：ceph metadata server，对ceph的文件系统的元数据进行管理，文件和目录的结构，文

件的权限，mds提供元数据服务。

管理集群的元数据信息
处理客户端对文件系统的请求
ceph集群中，至少要有一个mds节点

4、存储池和pg

存储池：pool，ceph存储数据对象的容器，每个存储池可以定义不同的数据冗余的策略（副本数，

默认都是3）crush映射规则等等。存储池是一个逻辑上的概念。

管理和组织数据的对象
定义数据的冗余方式，主要是开副本，3个
配置crush映射，数据如何在osd之间分布

pg：placement group，pg也是ceph当中的一个逻辑概念，用于数据分布的基本单位，创建存储

池，定义好pg的数量。pg是由一组对象（object）组成的逻辑集合，每个对象都会映射到一个或者

多个pg。作用是数据分布：数据写入集群，映射到存储池中的一个pg。crush算法决定将pg分布到

哪些osd。在ceph当中，pg和osd的数量是相关的，设置一个合理的pg数，有助于提高集群的性

能。pg数量=osd数量*100/存储池的副本数，且pg数量应该是2的幂值。以3个osd为例，pg的数量

为128为宜。pg的数量一般是osd数量的一百倍左右。

存储池和、pg和osd之间的关系

1、存储池是管理数据的基本单位，组成和配置数据存储和冗余的方式。

2、存储池中的数据被划分成多个pg，每个pg是数据分布的最小单位，pg负责对象存储的位置，通过crush算法把数据分布到osd。

3、osd是负责存储数据的基于物理设备的虚拟概念。

数据流向

crush算法，ceph自带的一种算法：

数据分布的算法，把对象分配到集群的osd节点当中。

crush算法使用hash算法来决定数据的存储位置，确保数据是均匀的分布在集群的osd上。

存储类型：

对象存储：ceph object storge，云计算的后台的存储方式一般都是用对象存储，基于apt接口，通过http(s)来对目标发起请求的方式获取数据。

块存储 RDB

文件系统 cephfs

ceph的创建

这里我们使用三台服务器完成ceph架构，另一台服务器作为客户端，具体如下

zw4：192.168.254.14，mon osd admin

zw5：192.168.254.15，mon osd

zw6：192.168.254.16，mon osd

zw7：192.168.254.17，客户端

我们这里使用的是ceph17版本：2024 17.2.4依赖于docker、python3和lvm2，所有准备好阿里

源，不要使用ubuntu官方源。

1、使用免交户方式对四台主机名都进行主机映射

2、三台集群主机安装docker

apt -y install docker.io

apt -y install lvm2

安装cephadm并初始化单节点集群（主节点zw4上执行）并编译安装

wget https://mirrors.aliyun.com/ceph/debian-17.2.4/pool/main/c/ceph/cephadm_17.2.4-1focal_amd64.deb

dkpg -i cephadm_17.2.4-1focal_amd64.deb

3、主节点上开启集群初始化

--mon-ip：指定mon进程的节点地址，先指定admin节点。
--cluster-network：集群网络的地址范围，ceph节点内部通信。
--allow-fqdn-hostname：允许ceph集群使用hostname来对节点进行标识，节点之间可以通过主机名进行通信

初始化后得到账户密码以及登录地址，可以登录ceph可视化界面

4、集群和客户端之间免密登录

主节点zw4和其他三台服务器进行ssh免密登录

主节点与另外两台集群主机进行内部ssh免密登录

5、四台主机安装ceph客户端

apt -y install ceph-common

6、添加osd

ceph添加主机名

查看当前Ceph Orchestrator 管理的所有主机信息，包括它们的状态、角色以及其他相关信息

修改mon节点的数量

把zw4、zw5和zw6添加进mon节点

7、三台集群服务器添加硬盘并刷新接口

这里使用命令行刷新，你可以选择重启

for host in /sys/class/scsi_host/host*/scan; do
echo "- - -" | sudo tee $host
done

作为ceph集群的底层的硬盘必须满足两个条件

容量必须要大于5G
不能对硬盘做任何分区和文件系统

8、添加osd硬盘

首先让ceph获取可用的节点并查看

添加osd硬盘

这时候ceph可视化界面显示我们集群搭建成功

ceph的使用

RDB存储方式

ceph RDB：rados block device，主要用于虚拟化环境和数据库。

虚拟化环境：openstack、KVM

数据库：性能高，延迟低的块存储方式

优点：

支持动态扩展
支持快照和克隆

缺点：

RBD的方式必须要创建文件系统
使用方式：在云计算的平台经常被使用，尤其是大规模存储和高性能场景。

1、在主节点上创建存储池并给存储池创建类型

rdb1：存储池的名称，不能重复
128：pg的数量
128：pgp的数量

查看存储池是否成功，ceph osd pool ls

2、在客户端zw7创建RDB镜像前，先传送主节点的配置文件和秘钥文件给客户端

在客户端上检查是否成功

3、在客户端zw7创建RDB镜像并做映射

镜像是RDB存储的基本单位，是一个虚拟的磁盘。
镜像提供了一个虚拟的块设备的接口，可以挂载的方式进行使用。
创建RDB镜像，实际上就是类似磁盘的一个分区

做映射之后，会虚拟出一个逻辑上的硬盘rbd0，接下来要创建文件系统，然后挂载才可以使用。

4、在客户端创建文件系统、挂载使用

mkfs.ext4 /dev/rbd0 #创建文件系统

mount /dev/rbd0 /data/ #挂载

创建一个100M的文件

这时候我们发现这个文件已经开始占用存储池的空间了

cephfs的存储方式

cephfs是分件系统分布存储方式，基于内核是实现共享文件的存储方式

大数据存储，文件服务器（文件共享，企业的镜像服务器）

优点：内核兼容，NFS方式也可以实现，部署速度较快。跨节点实现

缺点：配置比RBD的比较复杂，在集群群当中比较复杂。

ceph需要两个存储池：

数据池：cephfs.data，用来存储数据，这是根据osd的数量和总空间的大小，创建cephfs的时候，系统自动分配给cephfs文件系统的大小，按照一般情况是总大小的三分之一。

元数据池：cephfs.meta，保存数据的元信息。

1、在主节点上创建cephfs的存储池

可以看出有两个cephfs存储池

查看cephfs存储池的名称和状态

2、在客户端挂载使用

首先在客户端上获取密钥对，ceph auth get-key client.admin

挂载

创建一个100M的文件

这时候我们发现这个文件已经开始占用存储池的空间了

ceph的nfs方式

1、在主节点创建一个nfs服务和一个池

ceph orch apply nfs nfs-share

ceph osd pool create nfs-pools

查看集群当中所有的存储池，ceph osd lspools

2、创建一个nfs的高可用名字是my-nfs，分别运行在zw4，再加入zw5和zw6
ceph orch apply nfs my-nfs nfs-pools --placement="zw5,zw6"

回到ceph的可视化界面，创建NFS

3、客户端挂载使用

mount -t ceph 192.168.254.14:6789,192.168.254.15:6789,192.168.254.16:6789:/ /data2 -o name=admin,secret=AQBTVXdnKEBBKRAA4pFJAA5oG4FwuEIkONCaNg==

可以发现使用nfs的挂载目录和cephfs数据池挂载的大小和可用空间都一样，是因为通过nfs的挂载

方式，依然使用的cephfs.data的数据空间，文件实际上还是存储在cephfs.data的数据池当中。

ceph object storge 对象存储

云计算的后台的存储方式一般都是用对象存储。

对象存储：高扩展，处理文件的级别可以达到PB级别。

缺点：如果数据量不是特别的巨大，一般不需要该场景。

总结

ceph需要使用分布式文件系统的企业一般都是需要存储海量数据，以及保证数据的高可用非常严谨的场景。ceph的存储方式的数据流向：主要包括存储池、pg和osd

创建存储池，分配pg

数据按照对象分配给pg

pg再数据包分配到osd

ceph文件系统

ceph文件系统：高度可扩展，分布式的存储文件系统，旨在提高性能，高可靠性和高可用的对象存储，块存储，文件系统的存储。使用分布式的算法保证数据的高可用和一致性。 ceph的组件 1、MON：ceph m…...

编程日记 2025/1/6 9:04:24

【数据结构-堆】力扣2530. 执行 K 次操作后的最大分数

给你一个下标从 0 开始的整数数组 nums 和一个整数 k 。你的起始分数为 0 。在一步操作中： 选出一个满足 0 < i < nums.length 的下标 i ， 将你的分数增加 nums[i] ，并且将 nums[i] 替换为 ceil(nums[i] / 3) 。返回在恰好…...

编程日记 2025/1/6 9:02:16

Java jdk8新特性：Stream 流

一. Stream 1. Stream也叫Stream流，是jdk8开始新增的一套API(java.util.stream.*)，可以用于操作集合或者数组的数据。 2. 优势：Stream流大量的结合了lambda的语言风格来编程，提供了一种更加强大，更加简洁的方式操作集合…...

编程日记 2025/1/6 8:57:10

房产销售系统(源码+数据库+文档)

亲测完美运行带论文：文末获取源码文章目录项目简介（论文摘要）运行视频包含的文件列表（含论文）前端运行截图后端运行截图项目简介（论文摘要） 随着科学技术的飞速发展，各行各业都在…...

编程日记 2025/1/6 8:53:07

Vue 项目自动化部署：Coding + Jenkins + Nginx 实践分享

前言本文详细记录如何使用 Coding (以 Jenkinsfile 为核心) 和 Nginx 部署 Vue 项目，包含完整流程、配置细节及注意事项，为开发者提供一个高效的实践参考。准备工作这里借用一个优秀的开源项目做演示：芋道源码/yudao-ui-admin-vue2。以…...

编程日记 2025/1/6 8:51:03

从零开始开发纯血鸿蒙应用之实现起始页

从零开始开发纯血鸿蒙应用一、前言二、主要页面三、应用起始页四、MainPageContent 实现1、一级结构2、二级结构2.1、EmptyContent2.2、FileListContent2.2.1、ViewAction：2.2.2、EditAction2.2.3、DeleteAction2.2.4、ShareAction 五、载入起始页的时机五、总结一…...

编程日记 2025/1/6 8:45:54

CG顶会论文阅读｜《科技论文写作》硕士课程报告

文章目录一、基本信息1.1 论文基本信息1.2 课程基本信息1.3 博文基本信息二、论文评述（中英双语）2.1 研究问题（Research Problem）2.2 创新点（Innovation/Contribution）2.3 优点（Why this pape…...

编程日记 2025/1/6 8:40:42

【Python运维】使用Python与Docker进行高效的容器化应用管理

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界随着容器化技术的广泛应用，Docker已成为现代软件开发与运维中不可或缺的工具。Docker容器提供了一种轻量级、可移植的方式来部署和管理应用…...

编程日记 2025/1/6 8:36:37

【人工智能】基于Python与OpenCV构建简单车道检测算法：自动驾驶技术的入门与实践

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界随着自动驾驶技术的快速发展，车道检测作为自动驾驶系统中的一个重要组成部分，起着至关重要的作用。本文将介绍如何利用Python与OpenCV库构…...

编程日记 2025/1/6 8:34:35

实时数仓： Hudi 表管理、Flink 性能调优或治理工具脚本

1. Hudi 表管理 1.1 Hudi 表基础管理创建 Hudi 表在 HDFS 上创建一个 Hudi 表（以 Merge-on-Read 为例）： CREATE TABLE real_time_dw.dwd_order_fact (order_id STRING,user_id STRING,product_id STRING,amount DOUBLE,order_date STRIN…...

编程日记 2025/1/6 8:33:34

Kotlin 数据类与密封类

Kotlin 数据类与密封类引言在 Kotlin 中，数据类和密封类是两种非常重要的类类型，它们各自具有独特的用途和优势。数据类主要用于存储数据，而密封类则用于表示受限的类层次结构。在本篇文章中，我们将深入探讨 Kotlin 中的数据类…...

编程日记 2025/1/6 8:28:29

大模型推理加速调研（框架、方法）

大模型推理加速调研（框架、方法） 大模型推理框架调研总结推理框架TensorRT-LLMllama.cppmnn-llmfastllmmlc-llm 环境搭建&部署推理环境llama.cppfastllmmnn-llmvllm vllm_openai_completions.pylmdeployTensorRT-LLM 大模型加速技术总结模型压缩量化…...

编程日记 2025/1/6 8:23:23

C语言进阶(3)--字符函数和字符串函数

本章重点重点介绍处理字符和字符串的库函数的使用和注意事项目录 0.前言 1.函数介绍 1.1 strlen - 计算字符串长度 1.2 strcpy - 复制字符串 1.3 strcat - 追加字符串 1.4 strcmp - 字符串比较 1.5 strncpy - 受限制复制 1.6 strncat - 受限制追加 1.7 strncmp - 受限制比…...

编程日记 2025/1/6 8:22:22

微服务拆分的艺术：构建高效、灵活的系统架构

目录一、微服务拆分的重要性二、微服务拆分的策略 1. 按照业务领域拆分 2. 按照团队结构拆分 3. 按照业务边界拆分 4. 按照数据和数据库拆分 5. 按照用户界面或外部接口拆分 6. 按照功能模块或领域驱动设计拆分 7. 按照性能和可伸缩性需求拆分三、微服务拆分的实践…...

编程日记 2025/1/6 8:18:18

记录一次电脑被入侵用来挖矿的过程（Trojan、Miner、Hack、turminoob）

文章目录 0、总结1、背景2、端倪3、有个微软的系统更新，就想着更新看看（能否冲掉问题）4、更新没成功，自动重启电脑5、风险文件（好家伙命名还挺规范，一看名字就知道出问题了）6、开机有一些注册表…...

编程日记 2025/1/6 8:14:14

计算机xinput1_4.dll丢失怎么修复？

电脑运行时常见问题及修复指南作为软件开发从业者，深知电脑在日常使用中难免会遇到各种问题，如文件丢失、文件损坏和系统报错等。这些问题不仅影响工作效率，还可能带来数据丢失的风险。本文将详细介绍一些常见问题及其解决办法，…...

编程日记 2025/1/6 8:11:12

高等数学学习笔记 ☞ 连续函数的运算与性质

1. 连续函数的运算 1. 连续函数的四则运算： （1）若函数在点处连续，则函数在点处也连续。 （2）若函数在区间上连续，则函数在区间上也连续。 2. 反函数的连续性： 若函数在定义域上是单…...

编程日记 2025/1/6 8:05:02

k8s基础(4)—Kubernetes-Service

Service概述抽象层 ‌k8s的Service是一种抽象层，用于为一组具有相同功能的Pod提供一个统一的入口地址，并通过负载均衡将网络流量分发到这些Pod上。‌ Service解决了Pod动态变化的问题，例如Pod的IP地址和端口可能会发生变化，通过…...

编程日记 2025/1/6 8:03:59

CAN或者CANFD的Busoff的恢复时间会受到报文周期的影响么？

目录分析恢复机制角度快恢复和慢恢复策略角度特殊情况分析分析 Busoff的恢复时间通常不会直接受到报文周期的影响，以下是具体分析：恢复机制角度 CAN总线的节点在Busoff状态下，恢复过程主要是等待总线上出现128个连续的11bit隐性位，与报文周期并无直接关联。无论报文周…...

编程日记 2025/1/6 8:01:56

【DevOps】Jenkins部署

Jenkins部署文章目录 Jenkins部署资源列表基础环境一、部署Gilab1.1、安装Gitlab1.2、修改配置文件1.3、加载配置文件1.4、访问Gitlab1.5、修改root登录密码1.6、创建demo测试项目1.7、上传代码1.8、验证上传的代码二、部署Jenkins所需软件2.1、部署JDK2.2、部署Tomcat2.3、部…...

编程日记 2025/1/6 8:00:50

发散创新：基于Go语言的纳米服务架构实践与代码实战在微服务架构日益复杂的今天，**

发散创新：基于Go语言的纳米服务架构实践与代码实战在微服务架构日益复杂的今天，“纳米服务”（Nano-Service） 正成为云原生领域的新趋势——它强调极致轻量、快速启动、独立部署，并通过边缘计算和容器化技术实现资源最…...

编程新知 2026/4/19 4:21:56

Windows右键菜单终极清理指南：ContextMenuManager五分钟快速上手

Windows右键菜单终极清理指南：ContextMenuManager五分钟快速上手【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾经因为右键菜单过于臃肿而感…...

编程新知 2026/4/19 3:50:56

从Cortex-M3到M0的IAP移植踩坑记：中断向量表处理有何不同？

Cortex-M0 IAP开发实战：中断向量表重映射的底层逻辑与工程实践第一次在Cortex-M0上部署IAP功能时，我习惯性地复制了M3/M4项目中的VTOR配置代码，结果所有中断都神秘消失了。这个看似简单的"寄存器配置"问题，背后隐藏着M…...

编程新知 2026/4/19 3:09:10

spaCy v3.5新增模糊匹配与CLI命令

Introducing spaCy v3.5 Explosion 发布时间：2023年1月30日（3分钟阅读） 分类：博客 / spaCy / 基于规则的匹配 / 实体链接 spaCy自然语言处理库发布v3.5版本。该版本引入了三个新的CLI命令、增加了模糊匹配功能、改进了实体链接功…...

编程新知 2026/4/19 2:56:16

vue2+element-UI表格封装

针对表格进行封装，在列表页面直接传入字段数组就可以展示数据表： <template><div class"table-container" :class"{ show-vertical-lines: showVerticalLines }"><el-table ref"tableRe…...

编程新知 2026/4/19 1:42:56

ClearerVoice-Studio：解密AI语音处理的终极完整指南

ClearerVoice-Studio：解密AI语音处理的终极完整指南【免费下载链接】ClearerVoice-Studio An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc. …...

编程新知 2026/4/19 0:53:37

DCDC电源轻载时‘滋滋’叫？一文讲透PSM、Burst、FCM三种模式的选择与避坑

DCDC电源轻载啸叫难题：三种工作模式的深度解析与工程实践引言在电源设计领域，DCDC转换器的轻载啸叫问题堪称"幽灵故障"——它时隐时现，难以捉摸，却又实实在在地影响着产品品质。当你在深夜实验室调试电路板时&#xf…...

编程新知 2026/4/19 0:39:24

终极指南：如何快速部署本地AI大语言模型服务

终极指南：如何快速部署本地AI大语言模型服务【免费下载链接】llama-cpp-python Python bindings for llama.cpp 项目地址: https://gitcode.com/gh_mirrors/ll/llama-cpp-python llama-cpp-python 是一个为 llama.cpp 提供Python绑定的开源库，让…...

编程新知 2026/4/19 0:35:10