计算机组成原理——cache
3.4cache
出自up主Beokayy传送门
1.局部性原理
- 时间局部性:
- 在最近的未来要用到的信息,很可能是现在正在使用的信息,因为程序中存在循环。
- 空间局部性:
- 在最近的未来要用到的信息,很可能与现在正在使用的信息在存储空间上是邻近的,因为指令通常是顺序存放、顺序执行的。
- 数据也一般是以向量、数组形式簇聚地存储在一起的。
- 时间局部性好,例如数组元素经常被反复访问,例如出现循环指令:
for(i = 0; i <= 9; i++){temp = 1;for(j = 0; j <= i; j++)temp *= a[j];sum += temp;
}
- 空间局部性好,即访问顺序与存放顺序一致:
程序A
int func(int a[M][N]){int i, j, sum = 0;for(i = 0; i < M; i++)for(j = 0; j < N; j++)sum += a[i][j];return sum;
}
程序B
int func(int a[M][N]){int i, j, sum = 0;for(j = 0; j < N; j++)for(i = 0; i < M; i++)sum += a[i][j];return sum;
}
- 若按行存储,则存储顺序为
a[0][0], a[0][1], a[0][2]……
。 - 程序A的访问顺序为
a[0][0], a[0][1], a[0][2]……
,程序B的访问顺序为a[0][0], a[1][0], a[2][0]……
。故程序A的空间局部性好,程序B的空间局部性差。
2.cache的工作原理
cache的组成
- 为便于cache和主存交换信息,cache和主存会被划分成大小相等的块,每块由若干字节组成。
- 由于cache容量远小于主存容量,故cache中的块数远少于主存中的块数,仅保存主存中最活跃的若干块的副本。
- CPU与cache之间的数据交换以字为单位,cache与主存之间的数据交换以cache块为单位。
cache的命中率
- CPU与访问的信息已被放入cache中的比率即为cache的命中率。
- 命中率
H=Nc/(Nc+Nm)
:- cache的总命中次数为
Nc
。 - 访问主存的次数为
Nm
。
- cache的总命中次数为
- cache - 主存系统的平均访问时间
Ta=Htc+ (1-H) tm
:- cache命中率为
H
。 - 命中时访问cache的时间为
tc
。 - 未命中时的访问时间为
tm
。
- cache命中率为
CPU在cache中的访问过程
cache地址与主存地址的关系
cache行的内容
- 标记位:
- 和主存地址划分的标记位完全一样,作用是精准匹配cache行和其对应的主存块。
- 有效位:
- 1bit,说明cache中存放的数据是否有效,有效位为1时表示cache行有效。
- 脏位:
- 1bit,使用回写法时才有脏位,脏位为1时表示该cache行中的数据被修改过,替换时需要写回主存。
- 替换算法控制位:
- 随机算法:0bit。
- LRU/FIFO:log2(路数)bit。
3.cache和主存的映射方式
直接映射
- 基本思想:把主存每一块映射到一个固定的cache行中。
- 映射关系:cache行号=主存块号%cache行数。
- 主存地址结构:
- 主存块号被分解成标记字段和cache行号字段,块内地址的划分不变。
- 假设cache共有 2 c 2^c 2c行,主存共有 2 m 2^m 2m块,主存块大小占 2 b 2^b 2b字节,按字节编址,则cache行号占c位,主存块号占m位,块内地址占b位,而标记字段占m - c位。
- 只有标记位相同且有效位为1时,cache才命中。
- cache不命中时,CPU会从主存读出该地址所在的主存块,并把信息送到直接映射对应的cache行中,将有效位置1,并将标记设置为地址中的高t位,同时将该地址中的内容送往CPU。
全相联映射
- 基本思想:主存中的每一块可以装入cache中的任何位置,每一行的标记用于指出该行取自主存的哪一块
- 主存地址结构:
组相联映射
- 基本思想:将cache分为 Q Q Q个大小相同的组,每个主存块可装入固定组中的任意一行。每组有 r r r个cache行,则称为 r r r路组相联。
- 映射关系:cache组号=主存块号%cache组数。
- 主存地址结构:
4.cache的替换算法
近期最少使用算法LRU
- 依据局部性原理,选择近期内长久未访问过的cache行作为替换的行
随机算法
- 随机确定替换的cache块
先进先出算法FIFO
- 选择最早调入的cache行进行替换
5.cache写策略
全写法+非写分配法
- 全写法:
- cache写命中时,必须把数据同时写入cache和主存。
- 当某一块需要替换时,不必把这一块写回主存,用新调入的块直接覆盖即可。
- 非写分配法:
- cache写不命中时,只对主存中的块进行修改,而不调入cache。
回写法+写分配法
- 回写法:
- cache写命中时,只把数据写入cache,而不立即写入主存,只有当该块被换出时才写回主存。
- 为了避免不一致隐患,引入脏位(修改位)。若脏位为1,则说明对应cache行中的块被修改过,替换时需要写回主存;若脏位为0,则说明对应cache行中的块未被修改过,替换时无需写回主存。
- 写分配法:
- cache写不命中时,将对应主存块调入cache中,再修改这个cache块
相关文章:

计算机组成原理——cache
3.4cache 出自up主Beokayy传送门 1.局部性原理 时间局部性: 在最近的未来要用到的信息,很可能是现在正在使用的信息,因为程序中存在循环。 空间局部性: 在最近的未来要用到的信息,很可能与现在正在使用的信息在存储…...

EasyExcel使用导出模版后设置 CellStyle失效问题解决
EasyExcel使用导出模版后在CellWriteHandler的afterCellDispose方法设置 CellStyle失效问题解决方法 问题描述:excel 模版塞入数据后,需要设置单元格的个性化设置时失效,本文以设置数据格式为例(设置列的数据展示时需要加上千分位…...
关于AWESOME-DIGITAL-HUMAN的部署
AWESOME-DIGITAL-HUMAN是一个开源数字人项目,可以容器化部署,资源占用少,可以对接dify,使用起来也很方便,非常感谢开发者。 容器化部署后,其实是有两个容器,分别启动两个服务,一个前…...
WebAssembly 及 HTML Streaming:重塑前端性能与用户体验
WebAssembly 及 HTML Streaming:重塑前端性能与用户体验 引言 在移动互联网时代,用户对 Web 应用的性能和体验要求日益苛刻。白屏时间、首屏渲染速度、交互流畅度,甚至 SEO 优化,都成为前端工程师必须面对的挑战。传统的前端技术…...
python同步mysql数据
python写了一个简单的mysql数据同步脚本,只作为学习练习,大佬勿喷 # -*- coding: utf-8 -*- """ Time:2025/5/29 14:38 Auth:HEhandsome """ import pymysql from pymysql import Connectclass Mysql:def __init__(self):#源数据库self.sou_hos…...
shell之通配符及正则表达式,grep参数
通配符与正则表达式 通配符(Globbing) 通配符是由 Shell 处理的特殊字符,用于路径或文件名匹配。当 Shell 在命令参数中遇到通配符时,会将其扩展为匹配的文件路径;若没有匹配项,则作为普通字符传递给命令…...
RuoYi前后端分离框架集成手机短信验证码(一)之后端篇
一、背景 本项目基于RuoYi 3.8.9前后端分离框架构建,采用Spring Security实现系统权限管理。作为企业级应用架构的子模块,系统需要与顶层项目实现用户数据无缝对接(以手机号作为统一用户标识),同时承担用户信息采集的重要职能。为此,我们在保留原有账号密码登录方式的基…...

Knife4j框架的使用
文章目录 引入依赖配置Knife4j使用Knife4j 访问 SpringBoot 生成的文档 Knife4j 是基于 Swagger 的增强工具,对 Swagger 进行了拓展和优化,从而有更美观的界面设计和更强的功能 引入依赖 Spring Boot 2.7.18 版本 <dependency> <groupId>c…...

深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用
近日,深兰科技创始人、董事长陈海波受邀率队赴南京市,先后考察了南京江宁滨江经济开发区与鼓楼区,就推进深兰AI医诊大模型在南京的落地应用,与当地政府及相关部门进行了深入交流与合作探讨。 此次考察聚焦于深兰科技自主研发的AI医…...

【芯片设计中的交通网络革命:Crossbar与NoC架构的博弈C架构的博弈】
在芯片设计领域,总线架构如同城市交通网,决定了数据流的通行效率。随着AI芯片、车载芯片等复杂场景的爆发式增长,传统总线架构正面临前所未有的挑战。本文将深入解析两大主流互连架构——Crossbar与NoC的优劣,揭示芯片"交通网…...

deepseek告诉您http与https有何区别?
有用户经常问什么是Http , 什么是Https ? 两者有什么区别,下面为大家介绍一下两者的区别 一、什么是HTTP HTTP是一种无状态的应用层协议,用于在客户端浏览器和服务器之间传输网页信息,默认使用80端口 二、HTTP协议的特点 HTTP协议…...

mac将自己网络暴露到公网
安装服务 brew tap probezy/core && brew install cpolar// 安装cpolar sudo cpolar service install // 启动服务 sudo cpolar service start访问管理网站 http://127.0.0.1:9200/#/tunnels/list 菜单“隧道列表” 》 编辑 自定义暴露的端口 再到在线列表中查看公网…...
考研政治资料分享 百度网盘
考研资料分享考研资料合集 百度网盘(仅供参考学习) 通过网盘分享的文件:2026考研英语数学政治最新等3个文件 链接: https://pan.baidu.com/s/1iK2LvbkoreNxHZ7fmOkcyQ?pwd4drt 提取码: 4drt 链接: https://pan.baidu.com/s/1FuNV…...

拓扑排序算法剖析与py/cpp/Java语言实现
拓扑排序算法深度剖析与py/cpp/Java语言实现 一、拓扑排序算法的基本概念1.1 有向无环图(DAG)1.2 拓扑排序的定义1.3 拓扑排序的性质 二、拓扑排序算法的原理与流程2.1 核心原理2.2 算法流程 三、拓扑排序算法的代码实现3.1 Python实现3.2 C实现3.3 Java…...

罗马-华为
SPA应用:single-page application:单页应用SPA是一种网络应用程序或网站的模型,它通过动态重写当前页面来与用户交互,这种方法避免了页面之间切换打断用户体验在单页应用中 集成 ROMA Connect 主要包含四个组件:数据集成( FDI )、服务集成( APIC )、消息集成 ( MQS …...
单例模式的隐秘危机
引言 单例模式作为设计模式中的基石,广泛应用于配置管理、线程池、缓存系统等关键场景。然而,许多开发者误以为“私有构造函数”足以保障其唯一性,却忽视了反射机制、对象克隆、序列化反序列化这三把“隐形利刃”——它们能绕过常规防御&…...
微信小程序常用方法
微信小程序 常用方法 setData() https://developers.weixin.qq.com/miniprogram/dev/reference/api/Page.html#%E7%BB%84%E4%BB%B6%E4%BA%8B%E4%BB%B6%E5%A4%84%E7%90%86%E5%87%BD%E6%95%B0 在微信小程序中,setData 是一个非常重要的方法,主要用于更新…...

切片器导航-大量报告页查看的更好方式
切片器导航-大量报告页查看的更好方式 现在很多报告使用的是按钮导航,即使用书签按钮来制作页面导航的方式。但是当我们的报告有几十页甚至上百页的时候,使用书签按钮来制作页面导航,无论是对于报表制作者还是报告使用者来说都是一种很繁琐的…...
火山引擎声音复刻
首先,我需要确定火山引擎是什么,扣子声音复刻具体指什么。火山引擎是字节跳动旗下的云服务平台,提供各种技术解决方案。声音复刻应该属于他们的AI语音相关服务。 接下来,用户可能想知道这个功能的应用场景。比如,企业用…...
【数据分析】Pandas
目录 🌟 前言🏗️ 技术背景与价值🩹 当前技术痛点🛠️ 解决方案概述👥 目标读者说明 🧠 一、技术原理剖析📊 核心概念图解💡 核心作用讲解🔧 关键技术模块说明⚖️ 技术选…...
【ROS2】Qt Debug日志重定向到ROS2日志管理系统中
1、注册消息处理函数 Qt 利用 qInstallMessageHandler 接口可以 注册消息处理函数; 将QDebug等输出重定向到ROS2的日志管理中,使用 RCLCPP_DEBUG 输出日志 示例: 1)定义消息处理函数 namespace GW {void ros2Logger(QtMsgType type, const QMessageLogContext &cont…...
经典SQL查询问题的练习第一天
首先有三张表,学生表、课程表、成绩表 student:studentId,studentName; course:courseId,courseName,teacher; score:score,studentId,courseId; 接着有以下几道题目: ①查询课程编号为‘0006’的总成绩: 首先总成绩&#x…...

ubuntu 22.04安装k8s高可用集群
文章目录 1.环境准备(所有节点)1.1 关闭无用服务1.2 环境和网络1.3 apt源1.4 系统优化1.5 安装nfs客户端 2. 装containerd(所有节点)3. master的高可用方案(master上操作)3.1 安装以及配置haproxyÿ…...

使用java实现word转pdf,html以及rtf转word,pdf,html
word,rtf的转换有以下方案,想要免费最靠谱的是LibreOffice方案, LibreOffice 是一款 免费、开源、跨平台 的办公软件套件,旨在为用户提供高效、全面的办公工具,适用于个人、企业和教育机构。它支持多种操作系统(Windows、macOS、…...

使用LSTM进行时间序列分析
LSTM(长短期记忆网络,Long Short-Term Memory)是一种特殊的循环神经网络(RNN),专门用于处理时间序列数据。由于其独特的结构设计,LSTM能够有效地捕捉时间序列中的长期依赖关系,这使得…...

【密码学——基础理论与应用】李子臣编著 第十三章 数字签名 课后习题
题目 逐题解析 13.1 知道p83,q41,h2,g4,x57,y77。 我看到答案,“消息M56”的意思居然是杂凑值,也就是传统公式的H(M)。 选择k23,那么r(g^k mod p) mod q 51 mod 4110,sk(H(M)xr) mod q29 ws mod q17,u1(mw) mod q9,u2(rw) m…...

k8s中kubeSphere的安装使用+阿里云私有镜像仓库配置完整步骤
一、实验目的 1、掌握kubeSphere 的安装部署 2、掌握kubesphere 使用外部镜像仓库; 2、熟悉图像化部署任务:产生pod---定义服务--验证访问 本次实验旨在通过 KubeSphere 平台部署基于自定义镜像(nginx:1.26.0 )的有状态副本集…...

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible
Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible...
JSON解析性能优化全攻略:协程调度器选择与线程池饥饿解决方案
简介 JSON解析是现代应用开发中的基础操作,但在使用协程处理时,若调度器选择不当,会导致性能严重下降。特别是当使用Dispatchers.IO处理JSON解析时,可能触发线程池饥饿,进而引发ANR或系统卡顿。本文将深入剖析这一问题的技术原理,提供全面的性能检测方法,并给出多种优化…...

arcgis js 4.x 的geometryEngine计算距离、面积、缓冲区等报错、失败
在arcgis js 4.x版本中geometryEngine.geodesicArea计算面积时,有时会失败,失败的主要原因是,当前底图的坐标系不是WGS84大地坐标系(代号4326)或者web墨卡托投影(代号102113, 102100, 3857这三种之一&#…...