cpu 多级缓存L1、L2、L3 与主存关系
现代 CPU 的多级缓存(L1、L2、L3)和主存(DRAM)构成了一个层次化的内存系统,旨在通过减少内存访问延迟和提高数据访问速度来优化计算性能。以下是对多级缓存和主存的详细解析:
1. 缓存层次结构
现代 CPU 通常采用三级缓存结构:L1、L2 和 L3。每一级缓存的容量、速度和访问延迟都不同,形成了一个从快到慢、从小到大的层次结构。
L1 缓存(一级缓存)
-
位置:最接近 CPU 核心,通常每个核心独享。
-
容量:最小,通常为 32KB 到 64KB(分为 L1 指令缓存和 L1 数据缓存)。
-
速度:最快,访问延迟通常为 1-3 个时钟周期。
-
作用:存储 CPU 核心最频繁使用的指令和数据,提供最快的访问速度。
L2 缓存(二级缓存)
-
位置:位于 L1 缓存和 L3 缓存之间,通常每个核心独享或共享。
-
容量:中等,通常为 256KB 到 1MB。
-
速度:比 L1 慢,访问延迟通常为 10-20 个时钟周期。
-
作用:作为 L1 缓存的补充,存储更多的指令和数据,减少对 L3 缓存的访问。
L3 缓存(三级缓存)
-
位置:位于 L2 缓存和主存之间,通常由多个核心共享。
-
容量:最大,通常为几 MB 到几十 MB。
-
速度:比 L2 慢,访问延迟通常为 30-50 个时钟周期。
-
作用:作为 L2 缓存的补充,存储更多的数据,减少对主存的访问。
主存(DRAM)
-
位置:位于缓存层次结构的最外层,通过内存控制器与 CPU 通信。
-
容量:最大,通常为几 GB 到几百 GB。
-
速度:最慢,访问延迟通常为 100-300 个时钟周期。
-
作用:存储所有运行程序的数据和指令,是 CPU 访问的最终数据源。
- 图示如下:
-

2. 缓存的工作原理
缓存的核心思想是利用局部性原理(Locality Principle),包括时间局部性和空间局部性:
-
时间局部性:如果一个数据被访问,那么它很可能在不久的将来再次被访问。
-
空间局部性:如果一个数据被访问,那么它附近的数据也可能被访问。
缓存通过以下机制工作:
-
缓存行(Cache Line):缓存以缓存行为单位存储数据,通常为 64 字节。当 CPU 访问一个数据时,整个缓存行会被加载到缓存中。
-
缓存命中(Cache Hit):如果 CPU 需要的数据在缓存中,则直接从缓存中读取,速度极快。
-
缓存未命中(Cache Miss):如果数据不在缓存中,则需要从下一级缓存或主存中加载,导致较高的延迟。
3. 缓存一致性(Cache Coherence)
在多核 CPU 中,每个核心都有自己的 L1 和 L2 缓存,而 L3 缓存通常是共享的。为了确保多个核心访问同一数据时的一致性,CPU 使用缓存一致性协议(如 MESI 协议)来管理缓存数据的状态:
-
MESI 协议:缓存行可以处于以下四种状态:
-
Modified(M):缓存行已被修改,与主存不一致。
-
Exclusive(E):缓存行未被修改,且只存在于当前缓存中。
-
Shared(S):缓存行未被修改,且可能存在于多个缓存中。
-
Invalid(I):缓存行无效,不能使用。
-
通过缓存一致性协议,CPU 可以确保多个核心对同一数据的访问是正确且一致的。

4. 缓存对性能的影响
缓存的设计和性能对 CPU 的整体性能有重大影响:
-
缓存命中率:缓存命中率越高,CPU 访问内存的延迟越低,性能越好。
-
缓存未命中惩罚:缓存未命中会导致 CPU 等待数据从下一级缓存或主存中加载,增加了延迟。
-
伪共享(False Sharing):当多个核心频繁修改同一缓存行中的不同数据时,会导致缓存行在不同核心之间频繁无效化,降低性能。
5. 缓存与主存的对比
| 特性 | L1 缓存 | L2 缓存 | L3 缓存 | 主存(DRAM) |
|---|---|---|---|---|
| 容量 | 32KB - 64KB | 256KB - 1MB | 几 MB - 几十 MB | 几 GB - 几百 GB |
| 速度 | 最快(1-3 周期) | 较快(10-20 周期) | 较慢(30-50 周期) | 最慢(100-300 周期) |
| 位置 | 每个核心独享 | 每个核心独享或共享 | 多个核心共享 | 所有核心共享 |
| 作用 | 存储最频繁使用的数据 | 补充 L1 缓存 | 补充 L2 缓存 | 存储所有数据 |
6. 优化缓存使用的策略
为了充分利用多级缓存,程序设计和内存分配可以采取以下策略:
-
局部性分配:将相关的数据分配在相邻的内存区域中,提高缓存命中率。
-
减少伪共享:通过填充或对齐数据,避免多个核心频繁修改同一缓存行。
-
数据预取:通过预取技术提前将数据加载到缓存中,减少缓存未命中。
-
缓存友好的算法:设计算法时考虑缓存行的大小和访问模式,减少缓存未命中。
总结
多级缓存(L1、L2、L3)和主存构成了现代 CPU 的内存层次结构,通过减少内存访问延迟和提高数据访问速度来优化性能。缓存的设计和性能对 CPU 的整体性能有重大影响,程序设计和内存分配可以通过优化缓存使用来进一步提升性能。
相关文章:
cpu 多级缓存L1、L2、L3 与主存关系
现代 CPU 的多级缓存(L1、L2、L3)和主存(DRAM)构成了一个层次化的内存系统,旨在通过减少内存访问延迟和提高数据访问速度来优化计算性能。以下是对多级缓存和主存的详细解析: 1. 缓存层次结构 现代 CPU 通…...
MyBatis 的核心配置文件是干什么的? 它的结构是怎样的? 哪些是必须配置的,哪些是可选的?
MyBatis 的核心配置文件(通常命名为 mybatis-config.xml)是 MyBatis 应用程序的入口点,它定义了 MyBatis 的全局配置信息 。 核心配置文件的作用: 配置 MyBatis 的运行时行为: 通过 <settings> 标签设置全局参数ÿ…...
哪些业务场景更适合用MongoDB?何时比MySQL/PostgreSQL好用?
哪些业务场景更适合用MongoDB?何时比MySQL/PostgreSQL好用? 就像淘宝的个性化推荐需要灵活调整商品标签,MongoDB这种"变形金刚"式的数据库,在处理以下三类中国特色业务场景时更具优势: 一、动态数据就像&q…...
Java学习——day20
文章目录 1. 异常处理与优化1.1 在文件操作中使用 try-catch1.2 try-with-resources 语法1.3 使用 finally 块关闭资源1.4 代码健壮性与优化 2. 实践任务2.1 改进思路2.2 示例改进要点2.3 检查点 3. 总结3.1 改进后的完整代码: 4. 今日生词 今日学习目标:…...
基于Python+SQLite实现校园信息化统计平台
一、项目基本情况 概述 本项目以清华大学为预期用户,作为校内信息化统计平台进行服务,建立网页端和移动端校内信息化统计平台,基于Project_1的需求实现。 本项目能够满足校内学生团体的几类统计需求,如活动报名、实验室招募、多…...
[多线程]基于阻塞队列(Blocking Queue)的生产消费者模型的实现
标题:[多线程]基于阻塞队列(Blocking Queue)的生产消费者模型的实现 水墨不写bug 文章目录 一、生产者消费者模型特点:二、实现2.1详细解释1. 成员变量2. 构造函数3. Isfull 和 Isempty4. Push 函数5. Pop 函数6. 析构函数7. GetSize 函数 三、总结与多线…...
vue组件库el-menu导航菜单设置index,地址不会变更的问题
请先确认 1.路由已配置好 route-index.js如下, 2.view-ProHome.vue中已预留路由展示位 3.导航菜单复制组件库,并做修改 其中index与路由配置的地址一致 运行后发现点击菜单,url地址还是不变,查看组件库 Element - The worlds …...
JavaScript通过文件地址获取文件名称
在 JavaScript 中,可以通过文件链接地址提取文件名称。文件名称通常是链接中最后一个 / 之后的部分,可能还包含查询参数或哈希片段。以下是几种常见的提取文件名称的方法: 方法 1:使用 URL 对象和 pathname URL 对象可以解析链接…...
MySQL 优化方案
一、MySQL 查询过程 MySQL 查询过程是指从客户端发送 SQL 语句到 MySQL 服务器,再到服务器返回结果集的整个过程。这个过程涉及多个组件的协作,包括连接管理、查询解析、优化、执行和结果返回等。 1.1 查询过程的关键组件 连接管理器:管理…...
智能对话小程序功能优化day1-登录鉴权
目录 1.数据库表构建。 2.完善登录相关的实例对象。 3.登录相关功能实现。 4.小程序效果。 最近尝试下trae加入claude3.7后的读图生成代码功能,可以看到简单的页面一次性生成确实准确率高了不少,想起来之前笔记中开发的智能问答小程序功能还是有些简…...
【架构艺术】Go语言微服务monorepo的代码架构设计
近期因为项目架构升级原因,笔者着手调研一些go项目monorepo的代码架构设计,目标是长期把既有微服务项目重要的部分都转移到monorepo上面,让代码更容易维护,协作开发更加方便。虽然经验不多,但既然有了初步的调研&#…...
MinIO的预签名直传机制
我们传统使用MinIo做OSS对象存储的应用方式往往都是在后端配置与MinIO的连接和文件上传下载的相关接口,然后我们在前端调用这些接口完成文件的上传下载机制,但是,当并发量过大,频繁访问会对后端的并发往往会对服务器造成极大的压力…...
谈谈List,Set,Map的区别
List、Set 和 Map 是 Java 集合框架(Java Collections Framework)中的三种主要接口,它们各自有不同的特点和用途。以下是它们的区别和使用场景的详细解释: 1. List(列表) 1.1 特点 有序集合:Li…...
投资晚报 3.12
一、 晚间要闻 1、CME美联储观察:美联储3月降息25个基点的概率为3% 3 月 12 日,据 CME「美联储观察」数据,美联储 3 月降息 25 个基点的概率为 3%,维持不变的概率为 97%。 2、美国劳工统计局将于今晚20:30公布2月CPI数据 3 月…...
蓝桥 2109统计子矩阵
问题描述 给定一个NM 的矩阵 A, 请你统计有多少个子矩阵 (最小 11, 最大 NM) 满足子矩阵中所有数的和不超过给定的整数 K ? 输入格式 第一行包含三个整数 N,M 和 K. 之后 NN 行每行包含 M 个整数, 代表矩阵 A. 输出格式 一个整数代表答案。 样例输入 3 4 10 1 2 3 4 5…...
Qt开源控件库(qt-material-widgets)的编译及使用
项目简介 qt-material-widgets是一个基于 Qt 小部件的 Material Design 规范实现。 项目地址 项目地址:qt-material-widgets 本地构建环境 Win11 家庭中文版 VS2019 Qt5.15.2 (MSVC2019) 本地构建流程 克隆后的目录结构如图: 直接使用Qt Crea…...
vue的 props 与 $emit 以及 provide 与 inject 的 组件之间的传值对比
好的,下面是 props 与 $emit 以及 provide 与 inject 的对比: 1. props 与 $emit props:父组件通过 props 向子组件传递数据,子组件接收后不可修改。子组件只能读取 props 传递给它的数据。如果需要修改或更新父组件的状态&#…...
用python批量生成文件夹
问题描述 当批量生成文件夹时,手动右键创建文件夹是一个繁琐的过程,尤其是文件夹的命名过程。假设从3月10日到3月19日,每天要为某个日常工作创建一个名为2025031x的文件夹,手动创建文件夹并命名费时费力。 百度给出了以下四种方法…...
Json 转义符号处理(Mongo changeStream op log)
使用mongo-kafka组件订阅mongo的changeStream得到 一个带有很多转义符号的json字符串 "{\"_id\": {\"_data\": \"8267D0F733000001502B022C0100296E5A1004366730C56F7E41A790BDA4CF23259A4F46645F6964006467B91713A024A00E32CDF6800004\"},…...
懒加载(Lazy Loading):原理、实现与优化策略
懒加载(Lazy Loading) 是一种优化网页性能的技术,主要用于延迟加载非关键资源(如图片、视频、脚本等),直到它们真正需要被使用时才加载。懒加载可以显著减少页面初始加载时间,降低带宽消耗&…...
dns劫持是什么?常见的劫持类型有哪些?如何预防?
DNS劫持的定义 DNS劫持(Domain Name System Hijacking)是一种网络攻击手段,攻击者通过篡改域名解析的过程,将用户对某个域名的访问请求重定向到错误或恶意的IP地址。这种攻击可能导致用户访问到钓鱼网站、恶意广告页面࿰…...
蓝桥杯省赛真题C++B组2024-握手问题
一、题目 【问题描述】 小蓝组织了一场算法交流会议,总共有 50 人参加了本次会议。在会议上,大家进行了握手交流。按照惯例他们每个人都要与除自己以外的其他所有人进行一次握手(且仅有一次)。但有 7 个人,这 7 人彼此之间没有进行握手(但这…...
【MySQL】基本操作 —— DDL
目录 DDLDDL 常用操作对数据库的常用操作查看所有数据库创建数据库切换、显示当前数据库删除数据库修改数据库编码 对表的常用操作创建表数据类型数值类型日期和时间类型字符串类型 查看当前数据库所有表查看指定表的创建语句查看指定表结构删除表 对表结构的常用操作给表添加字…...
XML语法
一、XML简介 (一)定义 XML(eXtensible Markup Language,可扩展标记语言)是一种简单的文本格式,用于标记电子文件使其具有结构性的标记语言。它与HTML(HyperText Markup Language,超…...
游戏引擎学习第152天
仓库:https://gitee.com/mrxiao_com/2d_game_3 回顾昨天的内容 这个节目展示了我们如何从零开始制作一款完整的游戏。我们不使用任何游戏引擎或库,而是从头开始创建一款游戏,整个开发过程都会呈现给大家。你将能够看到每一行代码的编写,了解…...
考研数学非数竞赛复习之Stolz定理求解数列极限
在非数类大学生数学竞赛中,Stolz定理作为一种强大的工具,经常被用来解决和式数列极限的问题,也被誉为离散版的’洛必达’方法,它提供了一种简洁而有效的方法,使得原本复杂繁琐的极限计算过程变得直观明了。本文&#x…...
故障诊断——neo4j入门
文章目录 neo4jQuickStartDemo neo4j QuickStart 详情可见博客:https://www.cnblogs.com/nhdlb/p/18703804,使用docker拉取最近的一个版本进行创建 docker run -it -d -p 7474:7474 -p 7687:7687 \ -v /disk5/neo4j_docker/data:/data \ -v /disk5/ne…...
【CXX】6.2 str — rust::Str
Rust::Str 公共 API // rust/cxx.hclass Str final { public:Str() noexcept;Str(const Str &) noexcept;Str(const String &) noexcept;// 如果输入不是 UTF-8,抛出 std::invalid_argument 异常。Str(const std::string &);Str(const char *);Str(con…...
【JavaWeb】快速入门——HTMLCSS
文章目录 一、 HTML简介1、HTML概念2、HTML文件结构3、可视化网页结构 二、 HTML标签语法1、标题标签2、段落标签3、超链接4、换行5、无序列表6、路径7、图片8、块1 盒子模型2 布局标签 三、 使用HTML表格展示数据1、定义表格2、合并单元格横向合并纵向合并 四、 使用HTML表单收…...
unordered_set 的常用函数
在 C 的标准库中,std::unordered_set 是基于哈希表实现的哈希集合。下面介绍这种语言里哈希集合的常用函数。 C std::unordered_set 1. 元素操作 insert 功能:向哈希集合中插入元素。如果元素已经存在,则不会重复插入。示例代码:…...
