磁带存储:“不老的传说”依然在继续
现在是一个数据指数增长的时代,根据IDC数据预测,2025年全世界将产生175ZB的数据。

这里面大部分数据是不需要存储的,在2025预计每年需要存储11ZB的数据。换算个容易理解的说法,1ZB是10^18Bytes, 相当于要写5556万块容量18TB的硬盘。

这些存储的数据中,仅10%认为是Hot频繁访问的数据,90%的数据都将是Warm/Cold温冷数据, 也就是不经常访问的数据。举个简单的例子,我们目前每人至少1部智能手机,里面存储大量的照片、视频、聊天记录等个人隐私数据,这些数据自产生后,我们开始可能会经常访问,在3个月以后,你还会对着数据有访问的诉求吗?这个概率基本会下降到1%以下。

从概率统计学来讲,超过3个月(90天)不再访问的数据,我们都可以称为冷数据,归档数据。每年全世界有25-35%的新增归档冷数据需要存储。这个市场的需求是非常的庞大。

目前归档冷数据的最终归属大多数是基于HDD,SMR,磁带Tape等介质的冷存储系统。冷存储系统的最大的优点就是成本低和数据保留时间长,但是也带来相应的缺点就是冷归档数据读取过程需要“解冻”,数据访问响应时间拉长。

从上图存储介质的出货量和类型数据,我们也可以看到,在2025年,机械硬盘包括SMR新型机械盘存储介质的占比仍然有50%。从20世纪30年代开始算的话,磁带技术也算是一位接近期颐百岁老人了,磁带技术虽然古老,但凭借独特的魅力依然挑起了世界数据存储的重担。

根据最新的年度LTO(Linear Tape-Open,线性磁带开放标准)项目介质出货量报告,2023年磁带存储的出货容量达到了惊人的152.9EB(压缩后),相比2022年增长了3.14%,这一增长部分归因于“数据生成的快速增长以及超大规模运算和企业对基础设施需求的提升”,特别是人工智能领域的存储需求激增。

LTO技术背后的三大合作伙伴——HPE、IBM和Quantum联合发布的这份报告揭示了磁带存储生命力顽强的一面。在过去的十二年里,尽管固态硬盘(SSD)和传统硬盘驱动器(HDD)等新存储技术不断涌现并逐渐成为主流,磁带存储非但没有消亡,反而在特定领域持续发挥其独特优势。
磁带存储之所以能保持一席之地,原因有三:
-
巨大容量与离线便捷:磁带提供了庞大的存储空间,并且易于脱机保存,这对于长期存档和不频繁访问的数据而言非常合适。
-
耐用性和长期安全性:磁带介质被证实可以安全地保存数据长达30年,对于长期数据保护和避免如勒索软件攻击的风险尤为重要。
-
成本效益与环境友好:在成本方面,尤其是对于备份和档案存储,磁带经常比硬盘更经济,同时其环境影响也小于HDD和SSD,符合绿色存储的趋势。
然而,磁带存储的主要局限在于数据访问速度慢,恢复过程可能较为耗时,这使得它更适合用于冷数据存储,即那些不经常访问的信息。
扩展阅读:
-
告别emo|HDD&磁带:我的春天来了
-
LTO助推磁带大容量存储技术超越磁盘HDD
-
为LTO磁带而生的文件系统LTFS|主线任务—夺回"秋雅"
-
LTO磁带 PK 磁盘HDD:谁会让数据中心变"绿"?
-
大容量疯了!居然想把磁带放到硬盘,100TB+是否可以实现?
对比硬盘的出货容量,磁带虽然在总量上显示出增长,但两者在市场定位和应用场景上存在显著差异。例如,仅希捷一家硬盘制造商在2024年第三季度就出货了99EB的硬盘,显示出硬盘在活跃数据存储市场的主导地位。因此,磁带和硬盘各有千秋,分别服务于不同的存储需求和场景,共同支撑起现代数据存储的广阔天地。磁带的“不死传说”证明了,在技术快速迭代的今天,每一种存储解决方案都有其不可替代的价值和存在的理由。
扩展阅读:
-
深度剖析:大容量QLC SSD为何遭疯抢?
-
SSD与HDD仍然共存,并将长期共存!
此前,Spectra Logic 和 Geyser Data 联手推出了一项名为 TAPAS(Tape Archive Platform As-a-Service)的创新服务,标志着业界首次将磁带存储以服务的形式提供给用户。这项基于订阅的服务允许即时配置、按需扩展,并且使用过程中无需专业的知识或技能,为用户提供了简便、经济的磁带存储解决方案。

TAPAS 服务的核心特点:
-
即时且可扩展:TAPAS 提供的磁带存储基于订阅模式,用户可以根据需求即时获取服务并进行扩展,无需前期大量投入或专业知识。
-
成本效益:与典型的云冷存储服务相比,TAPAS 承诺提供更经济的解决方案,通过结合 Spectra Logic 的成熟磁带技术与 Geyser Data 的现代化服务交付模型,降低了长期存储成本。相比 AWS S3 归档,TAPAS 数据检索更快且无访问或提取费用,甚至可选服务将磁带快递至用户。
-
高性能与安全性:结合 Spectra Logic 的 Cube 图书馆系统、LTO-9 磁带媒体以及 BlackPearl S3 对象存储,TAPAS 提供了一个与 AWS S3 和 Glacier 兼容的系统,确保数据安全且易于访问。
-
灵活的数据管理:Geyser Data 的 TaaS 软件负责服务的配置、管理、监控、计费和实例化,简化了用户端的操作流程。
-
数据控制与隔离:Geyser Data 保证每个磁带只存储一个客户的资料,并允许客户掌控加密密钥,增强数据安全性和隔离性,减少网络威胁风险。
-
环保与合规:利用磁带存储的环保特性,TAPAS 同时解决了数据驻留、本地化或主权问题,让用户能够指定数据的实际地理位置。
还有富士Fujifilm,作为磁带存储介质的生产商和倡导者,最近推出了面向档案存储的Kangaroo融合系统,并即将发布一款针对中小企业的“Lite”版本。

Kangaroo系统简介:
-
原始版本:包含120盘LTO磁带,采用带有轮子的箱体设计,配备集成鼠标和屏幕、不间断电源(UPS)及公司的对象存档软件。该单元可存储高达1PB的数据,标价最高达€350,000(约$375,000)。
-
Lite版本:为中小企业提供存储容量上限为100TB的解决方案,价格低于€100,000(约$107,000),旨在降低准入门槛,使更多企业能够利用磁带存储技术。
富士欧洲执行副总裁Peter Struik在罗马举办的IT Press Tour上透露,轻量级的Kangaroo Lite预计将于当年7月或8月面市。他提到,欧洲的一些大型机构已经测试并采用了标准版Kangaroo系统,包括卢森堡银行、一家健康机构和荷兰的一所大学。此外,还有两台设备正在运往英国,用于商业市场的试用推广。
相比硬盘存储,磁带存储能减少95%的碳排放。考虑到硬盘通常需要持续供电以保持数据随时可访问,而Kangaroo系统设计主要为离线使用,这一环保优势更为显著。公司还指出,企业数据中有70%属于“冷数据”,并不立即用于业务运营,但仅有5%的冷数据被存储在如磁带这类成本效益更高的系统上,表明磁带存储在节能减碳方面具有巨大潜力。
参考文献:
1.https://www.tomshardware.com/pc-components/storage/tape-shipments-increased-to-1529-exabytes-in-2023-pretty-lively-for-a-dead-storage-medium
2.https://blocksandfiles.com/2024/05/15/spectra-logic-geyser-tape-as-a-service/
3.https://blocksandfiles.com/2024/04/12/fujifilm-kangaroo-lite/
如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!
精彩推荐:
-
浅析3D NAND多层架构的可靠性问题
-
SSD模拟器MQSim简介与资料分享
-
孙凝晖院士万字长文|人工智能与智能计算的发展
-
探究NVMe SSD HMB应用场景与影响
-
深度剖析:大容量QLC SSD为何遭疯抢?
-
SSD突然掉电,是谁保护了用户数据?
-
漫谈HAMR硬盘的可靠性
-
万物皆可计算|下一个风口:近内存计算
-
SSD数据错误如何修复?
-
CXL与PCIe世界的尽头|你相信光吗?
-
全景剖析SSD SLC Cache缓存设计原理
-
存储革新:下一代低功耗PCM相变存储器
-
3D DRAM虽困难重重,最快明年到来
-
字节跳动入局存储内存SCM
-
PCIe 7.0|不要太卷,劝你先躺平
-
SSD LDPC软错误探测方案解读
-
关于SSD LDPC纠错能力的基础探究
-
存储系统如何规避数据静默错误?
-
PCIe P2P DMA全景解读
-
深度解读NVMe计算存储协议
-
对于超低延迟SSD,IO调度器已经过时了吗?
-
浅析CXL P2P DMA加速数据传输的原理
-
HDD回暖于2024,与SSD决战于2028
-
FIO测试参数与linux内核IO栈的关联分析
-
NVMe over CXL技术如何加速Host与SSD数据传输?
-
浅析LDPC软解码对SSD延迟的影响
-
为什么QLC NAND才是ZNS SSD最大的赢家?
-
SSD在AI发展中的关键作用:从高速缓存到数据湖
-
浅析不同NAND架构的差异与影响
-
SSD基础架构与NAND IO并发问题探讨
-
字节跳动ZNS SSD应用案例解析
-
CXL崛起:2024启航,2025年开启新时代
-
NVMe SSD:ZNS与FDP对决,你选谁?
-
浅析PCI配置空间
-
浅析PCIe系统性能
-
存储随笔《NVMe专题》大合集及PDF版正式发布!
如果您也想针对存储行业分享自己的想法和经验,诚挚欢迎您的大作。
投稿邮箱:Memory_logger@163.com (投稿就有惊喜哦~)
《存储随笔》自媒体矩阵

相关文章:
磁带存储:“不老的传说”依然在继续
现在是一个数据指数增长的时代,根据IDC数据预测,2025年全世界将产生175ZB的数据。 这里面大部分数据是不需要存储的,在2025预计每年需要存储11ZB的数据。换算个容易理解的说法,1ZB是10^18Bytes, 相当于要写5556万块容量18TB的硬盘…...
CentOS8环境下FTP服务器安装与配置
在本指南中,我们将一步步介绍如何在CentOS 8环境下安装和配置一个FTP服务器。FTP(文件传输协议)是一种网络传输协议,用于在网络中的计算机之间传输文件。虽然现在有更安全的传输方式,如SFTP或FTP over SSL,…...
C# 元组 Tuple
C# 元组 Tuple 元组创建元组访问元组元素命名元组元素元组的类型使用元组作为方法返回值 解构解构元组的基本用法解构部分元组解构方法 元组 在C#中,元组(Tuple)是一种数据结构,它允许你将多个值组合成一个单一的对象。 元组在处…...
100个投资者99个选择使用这款EA,WeTrade发现1个事实
为什么100个投资者会有99个选择使用这款EA,是因为这款EA能提供两个版本吗?是因为能控制风险吗?都不是,WeTrade发现1个事实才是这么多投资者选择的原因,那就是能实现100%的盈利率。 我们都知道外汇狙击手EA提供两种版本,分别是标…...
爬虫面试手册
爬虫面试手册 薪资13~20k 岗位职责: 负责公司数据平台的数据采集、运维优化;负责自动化脚本,爬虫脚本;研究数据采集策略和防屏蔽规则,提升数据采集系统的稳定性、可扩展性,提高抓取的效率和质量; 岗位要求 本科及…...
k8s cephfs(动态pvc)
官方参考文档:GitHub - ceph/ceph-csi at v3.9.0 测试版本 Ceph Version Ceph CSI Version Container Orchestrator Name Version Tested v17.2.7 v3.9.0 Kubernetes v1.25.6 安装Ceph-csi Step 1 Download GitHub - ceph/ceph-csi at v3.9.0 rootsd-k8s…...
dubbo复习:(9)配置中心的大坑,并不能像spring cloud那样直接从配置中心读取自定义的配置
配置中心只是为 Dubbo 配置提供管理使用的(比如配置服务超时时间等)。不要尝试通过Value类似的方式从dubbo 配置中心(比如nacos、zookeeper、Apollo)来获取数据 https://github.com/apache/dubbo/issues/11200可以在application.yml中主要写注册中心的配置…...
建设现代智能工业-智能化、数字化、自动化节能减排
建设现代智能工业-智能化节能减排 遵循“一体化”能源管理(Integrated Energy Management)的设计宗旨,集成城市各领域(如工业.交通、建筑等)的能源生产和消费信息,面向城市政府、企业、公众三类实体,提供“一体化”的综合能源管理…...
据报导,SK海力士的HBM团队源自三星,暗示三星不幸失去HBM优势
最新科技动态显示,三星的高带宽记忆体(High Bandwidth Memory, HBM)技术尚未获得GPU巨头英伟达(NVIDIA)的认证,导致其落后于竞争对手SK海力士。这一挫折直接导致三星半导体部门负责人更迭。尽管三星官方否认…...
Verilog HDL基础知识(一)
引言:本文我们介绍Verilog HDL的基础知识,重点对Verilog HDL的基本语法及其应用要点进行介绍。 1. Verilog HDL概述 什么是Verilog?Verilog是IEEE标准的硬件描述语言,一种基于文本的语言,用于描述最终将在硬件中实现…...
Django之文件上传(一)
一、环境搭建 建立项目 django-admin startproject project_demo配置数据库(以MySQL为例) # settings.py DATABASES = {default: {ENGINE: django.db.backends.mysql,NAME: django_file4,USER: root,PASSWORD: 123,HOST: 192.168.31.151,PORT: 3306,} }建立模型 class UploadF…...
光纤现网与接入网概念对应
OLT 一般在机房 一级分光可能在机房也可能在光交交接箱 路边的光交交接箱功能有分光或者光纤汇聚转换一下 二级分光在分光光纤箱里,楼道里面挂着的那种 ONU是家里的光猫...
通过扩展指令增强基于覆盖引导的模糊测试
本文由Bruno Oliveira于2024年4月25日发表于IncludeSec的官方网站上。作为IncludeSec的安全研究人员,在他们日常的安全审计和渗透测试工作中,有时需要为客户开发一些模糊测试工具。在安全评估方法中使用模糊测试技术,可以有效地在复杂的现代化…...
第一节:Redis的数据类型和基本操作
最近整理了关于Redis的一些文档,分享给大家,后续会持续更新...... Redis的数据类型 字符串String String:字符串,可以存储String、Integer、Float型的数据,甚至是二进制数据,一个字符串最大容量是512M 列表…...
组件的传参等
一:组件的生命周期函数 组件的生命周期函数: created只是创建了组件内的实例对象 attached,给组件实例绑定了属性,绑定到页面节点树之后 ready准备好渲染之后,还未渲染之前 moved组件实例被移动到另一个位置后执行 detached在整个组件被被移除执行 error执行的时候,组件内…...
构建php环境、安装、依赖、nginx配置、ab压力测试命令、添加php-fpm为系统服务
目录 php简介 官网php安装包 选择下载稳定版本 (建议使用此版本,文章以此版本为例) 安装php解析环境 准备工作 安装依赖 zlib-devel 和 libxml2-devel包。 安装扩展工具库 安装 libmcrypt 安装 mhash 安装mcrypt 安装php 选项含…...
服装服饰商城小程序的作用是什么
要说服装商家,那数量是非常多,厂家/经销门店/小摊/无货源等,线上线下同行竞争激烈,虽然用户群体广涵盖每个人,但每个商家肯定都希望更多客户被自己转化,渠道运营方案营销环境等不可少。 以年轻人为主的消费…...
HNU-计算机体系结构-实验2-Tomasulo算法
计算机体系结构 实验2 计科210X 甘晴void 202108010XXX 1 实验目的 熟悉Tomasulo模拟器同时加深对Tomasulo算法的理解,从而理解指令级并行的一种方式-动态指令调度。 掌握Tomasulo算法在指令流出、执行、写结果各阶段对浮点操作指令以及load和store指令进行什么…...
深入分析 Android Activity (一)
文章目录 深入分析 Android Activity (一)1. Activity 的窗口管理2. Activity 的生命周期管理onCreateonStartonResumeonPauseonStoponDestroyonRestart 3. Activity 与 Fragment 的交互添加 FragmentFragment 的生命周期 4. Activity 的任务和返回栈5. 配置变化处理 总结 深入…...
Python 调整PDF文件的页面大小
在处理PDF文件时,我们可能会遇到这样的情况:原始PDF文档不符合我们的阅读习惯,或者需要适配不同显示设备等。这时,我们就需要及时调整PDF文档中的页面尺寸,以满足不同应用场景的需求。 利用Python语言的高效性和灵活性…...
Linux应用开发之网络套接字编程(实例篇)
服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...
ES6从入门到精通:前言
ES6简介 ES6(ECMAScript 2015)是JavaScript语言的重大更新,引入了许多新特性,包括语法糖、新数据类型、模块化支持等,显著提升了开发效率和代码可维护性。 核心知识点概览 变量声明 let 和 const 取代 var…...
RocketMQ延迟消息机制
两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数,对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后…...
AI Agent与Agentic AI:原理、应用、挑战与未来展望
文章目录 一、引言二、AI Agent与Agentic AI的兴起2.1 技术契机与生态成熟2.2 Agent的定义与特征2.3 Agent的发展历程 三、AI Agent的核心技术栈解密3.1 感知模块代码示例:使用Python和OpenCV进行图像识别 3.2 认知与决策模块代码示例:使用OpenAI GPT-3进…...
Qt Widget类解析与代码注释
#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码,写上注释 当然可以!这段代码是 Qt …...
postgresql|数据库|只读用户的创建和删除(备忘)
CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...
(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...
c#开发AI模型对话
AI模型 前面已经介绍了一般AI模型本地部署,直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型,但是目前国内可能使用不多,至少实践例子很少看见。开发训练模型就不介绍了&am…...
rnn判断string中第一次出现a的下标
# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...
技术栈RabbitMq的介绍和使用
目录 1. 什么是消息队列?2. 消息队列的优点3. RabbitMQ 消息队列概述4. RabbitMQ 安装5. Exchange 四种类型5.1 direct 精准匹配5.2 fanout 广播5.3 topic 正则匹配 6. RabbitMQ 队列模式6.1 简单队列模式6.2 工作队列模式6.3 发布/订阅模式6.4 路由模式6.5 主题模式…...
