当前位置: 首页 > news >正文

闪存系统性能优化方向集锦?AC timing? Cache? 多路并发?

1. 从Flash系统的性能提升说起

从消费级产品到数据中心企业级场景,NAND Flash凭借其高性能、大容量、低功耗以及低成本等特性大受欢迎,是目前应用最为广泛的半导体非易失存储介质。为了满足业务场景越来越严苛的性能要求,人们想了许多方法来提升基于NAND Flash的系统性能,具体可分为以下几类:

图一 Flash系统性能提升概览

  1. 优化AC Timing,提升总线频率

优化AC Timing 和提升总线频率是两个东西, 不是说优化AC Timing 会提升总线频率。优化AC Timing 是。优化总线频率可以减少数据在总线上的传输时间,频率越高,单位时间内传输的数据量越多。

1.1 优化AC Timing

在满足可靠传输的基础上,提升NAND Flash总线频率,尽可能使用较小的时序参数进行操作。特别是在Page Size越来越大(2K 4K 8K 16KB)的情况下,优化时序参数从而减小数据在总线上的传输时间显得尤为重要,这也是过去二十多年来人们一直在持续努力的方向。

优化NAND AC timing 是改善闪存的内因,AC timing 是性能的根本决定因素。我们都知道SLC NAND 比 MLC NAND 快, MLC NAND 比TLC NAND 快,其中就是他们的AC Timing 差异。姚明打篮球,可以轻松抢篮板,首先根本因素是他的身高优势,其他的训练技巧是锦上添花。

NAND 本身的AC timing,有些是NAND 控制的时间, 如tRead, tPROG 作为使用者是无法修改的, 这不是闪存系统优化考虑的事情,这种事情交给原厂下一个产品优化吧。有写AC timing 是系统上层控制的, 如tWC, tRC。 对于任何一款已量产NAND, 我们看它的data sheet, 它的AC Timing 都有 Min 值, Ave 值, Max 值。 之所以有一个min ~ max 范围, 主要是物理时序总会有一个差异性,正态分布,不可能是同一个值。闪存器件允许 host 的值有一定区间, 是为了兼容更多的闪存主机系统。

作为闪存系统或者闪存控制器, 为了提高性能, 最取巧的方式就是使用min的AC timing

优化NAND AC timing ,可给闪存带来显著的性能提升。

  • 这种优化方式是最简单的, 成本最小的,尤其是还没有做过此优化的闪存系统而言, 只需要改下闪存控制系统的记时、记数设定,可能就完成这个优化了

  • 可以显著减少总的闪存操作(如Read, Write)时间.

  • 为交叉操作(Interleave)优化打下了基础

当Page Size 从2KB, 4KB增大到 16KB ,越来越大的时候, 这个就更明显。

尤其时对于Read 操作特别明下, 因为Read 操作数据传输时间比Read Busy tR 更长。

下面看下AC timing 优化的实际效果, 以tWC 为例。

对于一款NAND, 原来tWC min 是20ns, 如果闪存主控的tWC 设置没有用 min 值, 用了更大的值, 会对性能影响多大呢? 通过对大量闪存主控实验可得出下面结果。

说明:

tWC 从 20ns增长25ns, 4KB data 传入到 NAND page 103ns,SLC program 总的耗时增加了 7%, TLC program 耗时增加了 2%。

tWC 从 20ns增长30ns, 4KB data 传入到 NAND page 123ns,SLC program 总的耗时增加了 14%, TLC program 耗时增加了 4%。这个实验做的次数最多, 用了 3 款主控做实验。

tWC 从 20ns增长45ns, 4KB data 传入到 NAND page 185ns,SLC program 总的耗时增加了 35%, TLC program 耗时增加了 10%。

很明显, tWC 变大,增加了数据从主控传入NAND 的时间, 继而导致Program总的时间增加。给我们的启发就是, 在超过tWC 的min 范围内, 主控尽量使用较小的 tWC。

对于其他AC Timing 也是这个道理。可能你会觉得有的值本来就很小, 觉得没必要优化, 其实不然,只要这个AC timing 在读写中经常出现, 就不应被忽略, 应优化尽优化。

雪崩的时候, 没有一片雪花是无辜的

1.2 优化总线频率

减小数据在总线上的传输时间还有一个方向是提高IO总线频率。频率就是带宽, 家里用上网对带宽感受特别明显,百兆带宽升级到千兆带宽,那滋味可美了不是吗?

对于闪存IO总线,比如总线接口速率为200Mbps (100MHz)时,完成4KB数据传输需要大约40us,但将总线接口速率提升到1600Mbps (800MHz)时,完成4KB数据传输仅需要大约5us。国产SSD 致钛7100 各项评测跑分都超过三星之流,得益于它的闪存 2400Mbps 频率。

2. 使用Cache Read/Program

一般情况下,LUN(Logic Unit Number)是NAND Flash最小的逻辑操作单元,读/写操作是串行执行的,即一个读/写命令完成后,才能进行下一个读/写操作。Cache Read/Program允许用户在NAND Flash Array Busy时,同时在总线上进行读/写数据传输,从而提高流水效率。

图 Cache Read 性能比较[6]

可提升33%的读性能。

图 Cache Program 性能比较[6]

可提升9%的写入性能。

3. 多路并发技术

正是因为有了多路并发技术,才使得基于NAND Flash的固态存储产品能达到GB级别的读/写性能。

3.1多平面(Multi Plane)操作

因为一个Die里有多个plane, 每个Plane 有独立的Cache 缓冲区和 Data 缓冲区,允许用户并发读/写Die内的不同Plane。

实现原理和细节参考:

[深入理解SSD系列 闪存实战2.1.6] NAND FLASH 多平面读(Multi Plane Read)时序及原理_闪存交错读时序(Interleave Read)_元存储的博客-CSDN博客

[深入理解SSD系列 闪存实战2.1.8] NAND FLASH Multi Plane Program(写)操作_multi plane 为何能提高闪存速度_元存储的博客-CSDN博客

3.2 通道内交错(Interleave)并发

允许用户在满足一定约束的情况下,在通道内的不同CE或CE内的不同Die之间进行交织操作

3.3多通道(channel)同时并发

允许用户在不同的通道上并发执行独立的命令和数据操作;

图. 双通道配置示例

两个通道可以同时传输数据和读写NAND, 速度是通道数目的倍数。一般在SSD 中有 2 channel、4 Channle、8 Channel,以4 Channle较常见。通道数目越多, 越可以达到 PCIE 总线的极限速度。

可见,以上优化覆盖了NAND Flash基础时序/指令优化到系统级的综合优化,在实际应用中可以根据系统要求组合选用。

参考

  1. 必看“芯”知识 | NAND Flash接口的演进史,https://www.unionmem.com/news_detail-107-56.html

  1. ONFI spec:http://www.onfi.org/specifications

  1. 2022, Phison, NAND Flash 101: Flash Device Interfaces:https://phisonblog.com/nand-flash-101-flash-device-interfaces-2/

  1. 2021, 移动NAND闪存存储的演进: https://phisonblog.com/the-evolution-of-mobile-nand-flash-memory-storage-2/

  1. 芯片中的数学——均衡器EQ和它在高速外部总线中的应用:https://zhuanlan.zhihu.com/p/48343011

  1. Micron, Optimizing NAND Flash Performance 2008, https://www.docin.com/p-232060088.html

相关文章:

闪存系统性能优化方向集锦?AC timing? Cache? 多路并发?

1. 从Flash系统的性能提升说起从消费级产品到数据中心企业级场景,NAND Flash凭借其高性能、大容量、低功耗以及低成本等特性大受欢迎,是目前应用最为广泛的半导体非易失存储介质。为了满足业务场景越来越严苛的性能要求,人们想了许多方法来提…...

【每日一题】——网购

🌏博客主页:PH_modest的博客主页 🚩当前专栏:每日一题 💌其他专栏: 🔴 每日反刍 🟢 读书笔记 🟡 C语言跬步积累 🌈座右铭:广积粮,缓称…...

百度终于要出手了?文心一言

文心一言 百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 前几天炒的风风火火的ChatGPT,虽然 ChatGPT 很强大&a…...

8年Java架构师面试官教你正确的面试姿势,10W字面试题带你成功上岸大厂

从最开始的面试者变成现在的面试官,工作多年以及在面试中,我经常能体会到,有些面试者确实是认真努力工作,但坦白说表现出的能力水平却不足以通过面试,通常是两方面原因: 1、“知其然不知其所以然”。做了多…...

Mybatis-Plus详解

简介MyBatis-Plus (opens new window)(简称 MP)是一个 MyBatis (opens new window)的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。特性(官网提供)无侵入:只做增强…...

购物清单(蓝桥杯C/C++省赛)

目录 1 问题描述 2 文件的读取格式 3 代码实现 1 问题描述 小明刚刚找到工作,老板人很好,只是老板夫人很爱购物。老板忙的时候经常让小明帮忙到商场代为购物。小明很厌烦,但又不好推辞。 这不,XX大促销又来了!老板…...

【蓝桥杯集训·每日一题】AcWing 4496. 吃水果

文章目录一、题目1、原题链接2、题目描述二、解题报告1、思路分析2、时间复杂度3、代码详解三、知识风暴求组合数一、题目 1、原题链接 4496. 吃水果 2、题目描述 n 个小朋友站成一排,等着吃水果。 一共有 m 种水果,每种水果的数量都足够多。 现在&…...

selenium(6)-----unittest框架

unittest框架 1)测试固件 1)setUp()是用来初始化测试环境所做的工作 2)tearDown()是用来清理环境所做的工作 2)测试套件 把不同的测试脚本,不同类中的测试用例给组织起来放到一个测试套中执行 3)测试用例的要以test_开头 4)如何使用unittest框架 只需要在脚本中定义…...

统计软件与数据分析--Lesson3

dataframe数据常用python操作dataframe数据常用知识点1.创建dataframe1.1使用字典创建DataFrame:1.2使用列表创建DataFrame:1.3使用numpy数组创建DataFrame:1.4从TXT文件中创建DataFrame:1.5从CSV文件中创建DataFrame:…...

竞赛无人机搭积木式编程——以2022年TI电赛送货无人机一等奖复现为例学习(7月B题)

在学习本教程前,请确保已经学习了前4讲中无人机相关坐标系知识、基础飞行控制函数、激光雷达SLAM定位条件下的室内定点控制、自动飞行支持函数、导航控制函数等入门阶段的先导教程。 同时用户在做二次开发自定义的飞行任务时,可以参照第5讲中2021年国赛植…...

oracle基础操作

oracle基础操作语法: 1、查询会话 SQL> select count(*) from v$session;2、增大连接数 SQL> alter system set processes5000 scope spfile;3、增大会话数 SQL> alter system set sessions7552 scopespfile;4、查询 参数: SQL> sho…...

python爬虫数据写入excel

在Jmeter118中描述了如何将接口请求的响应数据写入到csv中,同样的接口如果采用python写法,会简便很多,主要是用到了python中的pandas库#爬取展台数据import requestsimport pandas as pdurlhttps://ficonline.cfaa.cn/Exhibition/searchExhib…...

优思学院|六西格玛DMAIC,傻傻搞不清?

DMAIC还是搞不清? DMAIC是一个用于过程改进和六西格玛的问题解决方法论。它是以下五个步骤的缩写: 定义(Define):明确问题,设定项目的目标和目的。绘制流程图,并收集数据,以建立未来…...

【Linux】网络编程套接字(下)

🎇Linux: 博客主页:一起去看日落吗分享博主的在Linux中学习到的知识和遇到的问题博主的能力有限,出现错误希望大家不吝赐教分享给大家一句我很喜欢的话: 看似不起波澜的日复一日,一定会在某一天让你看见坚持…...

【Linux网络】网络编程套接字(上)

🎇Linux: 博客主页:一起去看日落吗分享博主的在Linux中学习到的知识和遇到的问题博主的能力有限,出现错误希望大家不吝赐教分享给大家一句我很喜欢的话: 看似不起波澜的日复一日,一定会在某一天让你看见坚持…...

十二、51单片机之DS1302

1、DS1302简介 (1)详情查看数据手册。 (2)管角描述 管教名称功能1Vcc2双供电配置中的主电源供电引脚2X1与标准的32.768kHz晶振相连。用于ds1302记时。3X24GND电源地5CE输入信号,CE信号在读写时必须保持高电平6I/O输入/推挽输出I/O,是三线接口的双向数…...

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于…...

HTML樱花飘落

樱花效果 FOR YOU GIRL 以梦为马&#xff0c;不负韶华 LOVE YOU FOREVER 实现代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html><head><meta http-equiv"…...

力扣-排名靠前的旅行者

大家好&#xff0c;我是空空star&#xff0c;本篇带大家了解一道简单的力扣sql练习题。 文章目录前言一、题目&#xff1a;1407. 排名靠前的旅行者二、解题1.正确示范①提交SQL运行结果2.正确示范②提交SQL运行结果3.正确示范③提交SQL运行结果4.正确示范④提交SQL运行结果5.其…...

马上要面试了,还有八股文没理解?让ChatGPT来给你讲讲吧——如何更好使用ChatGPT?

最近这段时间 ChatGPT 掀起了一阵 AI 热潮&#xff0c;目前来看网上大部分内容都是在调戏 AI&#xff0c;很少有人写如何用 ChatGPT 做正事儿。 作为一个大部分知识都是从搜索引擎和 GitHub 学来的程序员&#xff0c;第一次和 ChatGPT 促膝长谈后&#xff0c;基本认定了一个事…...

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分&#xff1a; 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析&#xff1a; CTR…...

云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?

大家好&#xff0c;欢迎来到《云原生核心技术》系列的第七篇&#xff01; 在上一篇&#xff0c;我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在&#xff0c;我们就像一个拥有了一块崭新数字土地的农场主&#xff0c;是时…...

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略&#xff0c;并且实现了基本的选区操作&#xff0c;还调研了自绘选区的实现。那么相对的&#xff0c;我们还需要设计编辑器的选区表达&#xff0c;也可以称为模型选区。编辑器中应用变更时的操作范围&#xff0c;就是以模型选区为基准来…...

java 实现excel文件转pdf | 无水印 | 无限制

文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...

ffmpeg(四):滤镜命令

FFmpeg 的滤镜命令是用于音视频处理中的强大工具&#xff0c;可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下&#xff1a; ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜&#xff1a; ffmpeg…...

Java入门学习详细版(一)

大家好&#xff0c;Java 学习是一个系统学习的过程&#xff0c;核心原则就是“理论 实践 坚持”&#xff0c;并且需循序渐进&#xff0c;不可过于着急&#xff0c;本篇文章推出的这份详细入门学习资料将带大家从零基础开始&#xff0c;逐步掌握 Java 的核心概念和编程技能。 …...

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

以光量子为例,详解量子获取方式

光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学&#xff08;silicon photonics&#xff09;的光波导&#xff08;optical waveguide&#xff09;芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中&#xff0c;光既是波又是粒子。光子本…...

算法岗面试经验分享-大模型篇

文章目录 A 基础语言模型A.1 TransformerA.2 Bert B 大语言模型结构B.1 GPTB.2 LLamaB.3 ChatGLMB.4 Qwen C 大语言模型微调C.1 Fine-tuningC.2 Adapter-tuningC.3 Prefix-tuningC.4 P-tuningC.5 LoRA A 基础语言模型 A.1 Transformer &#xff08;1&#xff09;资源 论文&a…...

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变(硬件篇)

本项目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脉宽调制)电源模块,能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。 供电电源 输入电压采集 上图为本设计的电源电路,图中 D1 为二极管, 其目的是防止正负极电源反接, …...