当前位置: 首页 > article >正文

DDD难落地?就让AI干吧! - cleanddd-skills介绍绽

AI训练存储选型的演进路线第一阶段单机直连时代早期的深度学习数据集较小模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。其优势在于IO延迟最低吞吐量极高也就是“数据离计算最近”。缺点也很明显数据孤岛多台机器无法共享数据数据拷贝scp/rsync)及其耗时。容量受限本地磁盘容量有限。数据安全数据没有冗余机器或盘挂了数据可能就丢了。第二阶段传统共享存储时代NFS/NAS到后来开始团队协作训练规模也变大则需要多机多卡分布式训练同时出于使用方便大家希望像操作本地文件一样操作共享数据。此时开始以NFSNetwork File System)挂载传统的NAS存储阵列来使用。其优势在于POSIX兼容不需要修改PyTorch/TensorFlow代码直接读写文件路径共享也十分便利所有节点看到的目录结构一致。缺点则在于元数据性能瓶颈NFS在处理海量小文件的open,lookup操作时元数据服务器可能被瞬间打死。另外所有计算节点抢占同一个NAS的出口带宽也可能导致GPU等待IO造成GPU无法维持高使用率。第三阶段大数据融合时代HDFSGoogle等大厂入局Hadoop诞生。数据存储在HDFS上通过一些软件层面的优化将大量小图片打包成大文件变成“顺序读”训练代码通过API读取。这样就能够极大地利用HDFS的设计初衷吞吐量极高、大规模顺序读同时还能利用现成的大数据基础设施。但同样有缺点生态割裂PyTorch对HDFS支持不如TensorFlow友好。随机访问差对于需要频繁Shuffle(随机打乱)的数据集HDFS性能不佳。Java开销HDFS客户端通常较重占用CPU资源第四阶段高性能并行文件系统HPC/Parallel FS)此时的AI领域进入超算时代模型越来越大对低延迟和超高带宽的要求极高。此时的方案是借用超算HPC领域的Lustre或GPFSIMB Spectrum Scale)。优点在于专为高并发设计可以轻松喂饱数千张GPU支持POSIX且元数据性能极强。缺点则在于贵运维难Lustre等系统内合级调优十分困难一旦集群崩溃恢复十分困难扩容困难很难像云存储那样弹性伸缩。第五阶段存算分离与分层架构Object Storage Cache)当前这个时代即云原生时代数据集达到PB级别成本成为了核心考量。对象存储最便宜且容量无限但性能尤其是元数据不够好。 此时针对元数据有了若干解决方案方案一 原生对象存储格式优化这种方案将数据存储在S3客户端使用S3 SDK进行对接以对象存储的接口访问文件。同时降低小文件数量对小文件进行打包。此处的缺点则在于丧失了POSIX标准。方案二对象存储高性能文件网关这是目前的最终形态也是本文将要讲的形态。其底层数据存储在对象存储中S3、COS、OSS、ceph在用户和对象存储层中加一个中间层作为文件系统层负责将文件系统与对象存储的操作进行翻译转换从而实现POSIX兼容。而最重要的是在GPU训练节点的本地NVMe SSD上建立热数据缓存以提升IO能力。此时第一次读取时从对象存储拉取数据过程稍慢而后续的读取则可以直接走本地缓存极快。而一些实现如JuiceFS)将元数据独立放在Redis/TiKV中可以完美地解决对象存储list对象的性能问题。据最新的企业版JuiceFS文档说明当前单机文件系统已经可以支持5000亿级别文件本文将以“对象存储高性能文件网关”的技术路线的现状进行分析描述业界若干实现的设计思想抛砖引玉。Object Storage Cache的一般性设计原则本小节介绍Object Storage Cache的一般性设计原则。在介绍之前首先需要理清楚文件系统与对象存储的区别是什么文件系统对接对象存储需要做哪些工作之后才考虑性能的优化与可靠性的优化。文件系统与对象存储的异同点分析文件系统的核心特征如下所示层级结构数据以目录树的形式组织文件包含在目录中目录又包含在父目录中。寻址方式通过路径名来访问。数据可变性支持原地修改。应用程序可以打开一个文件seek到特定偏移量然后只修改文件中间的几个字节而无需重写整个文件。操作接口基于系统调用如open(), read(), write(), seek(), close(), flock()等。元数据如权限、创建时间、大小与文件数据紧密绑定通常存储在inode中。强一致性在单机文件系统中写入数据后随后的读取操作立即能看到新数据。原子性许多元数据操作如rename通常是原子的。对象存储的核心特征如下所示扁平结构数据存储在“桶“中没有真正的文件夹或目录层级。虽然看起来像目录但这只是对象键名key)中的前缀字符串。寻址方式通过key访问需要结合对象存储访问域名/IP来访问。数据不可变性对象通常被视为原子单元。无法修改对象的中间部分。如果要修改部分数据必须新上传一个对象来覆盖旧对象Read-Modify-Write。操作接口基于RESTful API(HTTP)主要操作是PUT上传/覆盖GET下载DELETE删除HEAD获取元数据不支持seek或部分写入。一致性模型不同的对象存储实现下有不同的一致性模型。可能是强一致性如ceph也可能是最终一致性。整理如下表所示image将对象存储S3 协议等挂载为本地文件系统FUSE是业界的常见需求目的是为了让不支持 S3 API 的传统应用也能利用对象存储的低成本和无限容量。由于我们在上一部分分析了“文件系统”与“对象存储”存在巨大的语义鸿沟因此这些 FUSE 工具的核心设计难点都在于如何用笨重的 HTTP 对象接口去模拟灵活的 POSIX 文件接口。业界主流有两个设计流派直接映射型1:1 Mapping文件对应对象元数据存放在对象头中。元数据分离型Metadata Separation数据存在对象存储元数据存放在独立的数据库中。对象存储的 FUSE 并不是完美的。直接映射型保留了数据的通用性但牺牲了性能和语义元数据分离型重建了文件系统语义和性能但把对象存储降级为了纯粹的“硬盘”牺牲了数据的通用访问性。设计优劣势分析1. 直接映射型 (S3FS, Goofys, Rclone)设计优点通用性强 写入的数据就是标准的 S3 对象。你用 S3FS 传上去的图片可以直接用浏览器通过 S3 URL 打开也可以被其他不使用 FUSE 的程序处理。部署简单 无需额外部署数据库只要有 S3 账号就能用。无状态 客户端挂了重启即可不依赖外部元数据服务。设计劣势元数据性能灾难 S3 处理元数据非常慢。执行 ls -l 可能会很慢还可能造成集群slow op。重命名原子性缺失 在 S3 中没有“重命名目录”的操作。重命名一个包含 1000 个文件的目录S3FS 需要执行 1000 次 Copy 1000 次 Delete。这不仅慢而且如果在中间崩溃目录会断裂一半在旧名一半在新名。无法支持随机写/追加写 修改 1GB 文件的最后 1 个字节S3FS 必须下载 1GB - 修改 - 上传 1GB。效率极低。2. 元数据分离型 (JuiceFS)设计优点极致性能 元数据操作ls, getattr, rename都在 Redis/SQL 中完成延迟是微秒级与本地文件系统无异。完全 POSIX 兼容 通过将文件切块Chunking实现了对象存储本身不支持的“随机写”和“追加写”只用重传修改过的那个 Block。原子性保障 重命名目录只是数据库里的一个事务瞬间完成且原子。缓存能力 通常带有强大的本地缓存机制利用本地磁盘缓存 S3 的数据块。设计劣势数据不透明黑盒 你在 S3 Bucket 里看到的不再是 photo.jpg而是 chunks/1/123_456 这样的分块数据。脱离了 JuiceFS 客户端你无法直接识别和使用 S3 里的数据。运维复杂度 需要额外部署和维护一个高可用的元数据引擎如 Redis 集群或 RDS。岳背谖滦

相关文章:

DDD难落地?就让AI干吧! - cleanddd-skills介绍绽

AI训练存储选型的演进路线 第一阶段:单机直连时代 早期的深度学习数据集较小,模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。 其优势在于IO延迟最低,吞吐量极高,也就是“数据…...

OpenClaw+优云智算Coding Plan:从灵感到成文,再到发布的全流程AI自动化肆

1.安装环境准备 1.1.查看物理内存 [rootaiserver ~]# free -m 1.2.操作系统版本 [rootaiserver ~]# cat /etc/redhat-release 1.3.操作系统内存 [rootaiserver ~]# df -h /dev/shm/ 1.4.磁盘空间 [rootaiserver ~]# df -TH [rootaiserver ~]# df -h /tmp/ [rootaiserver ~]# d…...

德州农机大学联合多所高校:AI从几张无序照片“脑补“出完整3D模型

这项由德州农机大学(Texas A&M University)联合澳门科技大学、西安电子科技大学、上海科技大学、香港科技大学、加州大学欧文分校等多所知名学府共同完成的研究发表于2026年4月的《ACM计算机图形学汇刊》(ACM Transactions on Graphics)第1卷第1期。这个名为UniRecGen的突破…...

LaserGRBL:5分钟掌握专业激光雕刻软件的核心技巧

LaserGRBL:5分钟掌握专业激光雕刻软件的核心技巧 【免费下载链接】LaserGRBL Laser optimized GUI for GRBL 项目地址: https://gitcode.com/gh_mirrors/la/LaserGRBL LaserGRBL是一款专为激光雕刻机设计的Windows图形界面软件,它基于开源的GRBL控…...

USB-Disk-Ejector:重新定义Windows设备安全移除体验

USB-Disk-Ejector:重新定义Windows设备安全移除体验 【免费下载链接】USB-Disk-Ejector A program that allows you to quickly remove drives in Windows. It can eject USB disks, Firewire disks and memory cards. It is a quick, flexible, portable alternati…...

如何突破访问限制?三大开源工具让你轻松畅享付费内容

如何突破访问限制?三大开源工具让你轻松畅享付费内容 你是否曾遇到这样的情况:找到了一篇急需的专业文章,却被付费墙挡在门外?内容解锁工具就像一把万能钥匙,能够帮助你突破这些访问限制。本文将介绍三款主流的内容解锁…...

WSL2 Ubuntu迁移,导出Ubuntu,导入Ubuntu(存储位置)

一、Ubuntu虚拟硬盘文件路径 网上说的 C:\Users\admin\AppData\Local\Packages\CanonicalGroupLimited.Ubuntu22.04LTS_79rhkp1fndgsc\LocalState\ext4.vhdx 我没有CanonicalGroupLimited.Ubuntu22.04LTS_79rhkp1fndgsc这个目录 搜索ext4.vhdx C:\Users\admin\AppData\Local\…...

ADS1232IPWR如何把24位Σ-Δ ADC和PGA装进紧凑封装

1. 核心定位:24位Σ-Δ ADC,专为桥式传感器优化ADS1232IPWR是TI ADS123x系列的一员,是一颗精密24位Σ-Δ型模数转换器。它的“本职工作”非常明确:为桥式传感器应用提供完整的前端解决方案,包括电子秤、应变计和压力传…...

正温度系数+低温度依赖性:IKW40N65WR5为什么容易并联且高温不掉链

IKW40N65WR5来自英飞凌的TRENCHSTOP™ 5系列,是一颗带反并联二极管的650V/40A逆导型IGBT。它的参数在IGBT家族里不是电流最大的——40A、TO-247封装——但它在一件事上做得很扎实:把1.4V的极低饱和压降、集成式单体内置二极管、高达60kHz的开关能力&…...

Ostrakon-VL-8B实战:基于YOLOv11的目标检测与视觉问答联动系统

Ostrakon-VL-8B实战:基于YOLOv11的目标检测与视觉问答联动系统 最近在折腾一个挺有意思的项目,把最新的目标检测模型YOLOv11和视觉语言大模型Ostrakon-VL-8B给“撮合”到了一起。简单来说,就是让YOLOv11先当“眼睛”,在图片里快速…...

踩坑无数!YOLOv8工业质检全流程:标注→训练→C#部署落地

摘要:本文基于汽车零部件冲压车间真实项目经验,完整还原YOLOv8工业缺陷检测从0到1的落地流程。从产线数据采集、标准化标注、模型训练调优,到C#上位机部署、产线验证迭代,每一步都标注工业场景专属避坑点。解决了小缺陷漏检、光照…...

开源内容访问工具:突破网页内容限制的技术实践指南

开源内容访问工具:突破网页内容限制的技术实践指南 在信息爆炸的数字时代,专业内容与学术资源的获取常常受到付费墙的限制。本文介绍的开源内容访问工具作为一款浏览器扩展,通过技术手段帮助用户合规地访问受限制内容,重新定义信息…...

【实战指南】从CondaVerificationError到PyTorch环境重建:彻底解决安装包损坏

1. CondaVerificationError深度解析:为什么PyTorch安装包会损坏? 遇到CondaVerificationError时,错误信息通常会显示类似这样的内容:"The package for pytorch located at [路径] appears to be corrupted. The path Lib/sit…...

Gradle国内镜像配置避坑指南:2024年最新阿里云源设置详解

Gradle国内镜像配置实战:2024年阿里云源深度优化方案 每次打开IDE看着进度条龟速前进,作为开发者的你是否也经历过这种绝望?特别是在紧急修复线上bug时,Gradle依赖下载的转圈动画简直能让人血压飙升。别担心,这份指南将…...

2025届最火的十大AI科研网站实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 日益广泛应用于学术写作领域的人工智能技术,,特别适用于开题报告的辅…...

告别手动搬运:利用Gitee镜像功能实现GitHub仓库的自动同步

1. 为什么需要自动化同步GitHub和Gitee仓库 作为一个经常在GitHub和Gitee双平台托管代码的开发者,我深刻理解手动同步的痛苦。每次在GitHub上提交代码后,都要记得去Gitee手动更新,稍不留神就会忘记,导致两个平台的代码版本不一致。…...

Python项目部署之Gunicorn知识详解

1. 引言 在 Python Web 开发的世界里,将开发好的应用部署到生产环境是一个至关重要的环节。我们常用的开发框架如 Flask、Django 都内置了简单的 WSGI 服务器,但这些服务器仅适用于开发阶段,因为它们性能低下、安全性不足且无法处理并发请求。…...

技术路径模拟器:人机协同分岔罗盘(修订版)

技术路径模拟器:人机协同分岔罗盘设计代号:FORK-COMPASS-Ω 核心版本:v1.0 设计者:世毫九实验室(Shardy Lab) 一、模拟器概述1.1 核心定位本模拟器是自指递归动力学与多路径决策理论的工程化实现&#xff0…...

G-Helper终极指南:彻底释放华硕笔记本潜能的轻量级控制工具

G-Helper终极指南:彻底释放华硕笔记本潜能的轻量级控制工具 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Stri…...

从传统WinForm到现代化桌面应用:SunnyUI如何重塑C开发体验

从传统WinForm到现代化桌面应用:SunnyUI如何重塑C#开发体验 【免费下载链接】SunnyUI SunnyUI.NET 是基于.NET Framework 4.0、.NET6、.NET8、.NET9 框架的 C# WinForm UI、开源控件库、工具类库、扩展类库、多页面开发框架。 项目地址: https://gitcode.com/gh_m…...

常见音视频编码二进制分析笔记(H264,H265,AAC,OPUS,G711A,G711U)

常见音视频编码二进制分析笔记 文章目录常见音视频编码二进制分析笔记视频H.264 (AVC)说明nal_unit_type:nal_ref_idcH.265 (HEVC)音频AAC (Advanced Audio Coding)G.711A (PCMA)G.711U (PCMU)OPUS视频 H.264 (AVC) 标准来源:ITU-T H.264 | ISO/IEC 14496-10 起始…...

2024 CKA备考环境搭建实战 | 从零构建VMware Ubuntu虚拟化平台

1. 为什么选择VMware搭建CKA备考环境 备考CKA认证时,一个稳定、可复现的实验环境至关重要。我在过去三年帮助过上百名学员搭建环境,发现VMware Workstation有三大不可替代的优势: 首先是硬件兼容性。我的旧笔记本只有8GB内存,通过…...

计算机组成原理视角:深度估计模型推理的硬件加速优化

计算机组成原理视角:深度估计模型推理的硬件加速优化 最近在项目里用到了Lingbot-Depth-Pretrain-ViTL-14这个深度估计模型,效果确实不错,但跑起来总觉得有点“慢”。不是模型本身的问题,而是感觉硬件资源没被“喂饱”。这让我想…...

2026奇点智能技术大会深度复盘:为什么92%的AI初创公司已在Q2切换至AI-Native开源栈?(附迁移成本测算表)

第一章:2026奇点智能技术大会:AI原生开源生态 2026奇点智能技术大会(https://ml-summit.org) AI原生范式的演进本质 AI原生(AI-Native)不再仅指“用AI增强已有系统”,而是从底层基础设施、开发范式到应用交付全栈重构…...

HTML是Web开发的基石,掌握HTML是构建网页的第一步

HTML是Web开发的基石,掌握HTML是构建网页的第一步。 HTML简介 HTML(HyperText Markup Language)超文本标记语言: 不是编程语言,是标记语言 使用标签描述网页结构 浏览器解析HTML显示网页 基本结构 <!DOCTYPE html> <html> <head><...

Steam DLC解锁工具终极指南:5分钟快速上手SmokeAPI游戏DLC模拟器

Steam DLC解锁工具终极指南&#xff1a;5分钟快速上手SmokeAPI游戏DLC模拟器 【免费下载链接】SmokeAPI Legit DLC Unlocker for Steamworks 项目地址: https://gitcode.com/gh_mirrors/smo/SmokeAPI 想要体验心仪游戏的所有DLC内容却受限于预算&#xff1f;作为开发者需…...

Qwen3.5-9B-AWQ-4bit企业应用案例:电商商品图智能标签生成实操

Qwen3.5-9B-AWQ-4bit企业应用案例&#xff1a;电商商品图智能标签生成实操 1. 电商商品标签的痛点与解决方案 在电商运营中&#xff0c;商品图片标签是影响搜索排名和转化率的关键因素。传统的人工打标方式面临三大挑战&#xff1a; 效率瓶颈&#xff1a;一个运营人员每天最…...

从大模型 API 生态到 Spring AI:接口、平台与框架三层怎么串起来

一、开始之前&#xff1a;五个真实困惑在正式展开之前&#xff0c;先问你五个问题——这是开发者在接触大模型应用时最常卡住的地方。读完这篇文章&#xff0c;希望每一个你都能自己回答出来。困惑一&#xff1a;「ChatGPT」「GPT-4o」「OpenAI」是同一个东西吗&#xff1f;不是…...

深入浅出:IgH EtherCAT主站的实时性优化技巧(从内核配置到线程调度)

深入浅出&#xff1a;IgH EtherCAT主站的实时性优化技巧&#xff08;从内核配置到线程调度&#xff09; 在工业自动化领域&#xff0c;毫秒级的延迟可能导致生产线停摆&#xff0c;微秒级的抖动可能引发机器人轨迹偏差。作为开源EtherCAT主站的标杆&#xff0c;IgH的性能直接决…...

AI入门必看|零基础搞懂人工智能核心定义,避开入门误区

摘要&#xff1a;本文专为AI零基础小白打造&#xff0c;用大白话拆解人工智能的核心定义、发展脉络&#xff0c;厘清新手最易混淆的概念&#xff0c;帮你快速建立对AI的正确认知&#xff0c;迈出入门第一步&#xff0c;拒绝被专业术语劝退。关键词&#xff1a;人工智能入门&…...