当前位置: 首页 > news >正文

芯片工程师求职题目之CPU篇(3)

1. 什么是cache(缓存)?它的工作原理是什么?

Cache是少量的快速内存。它位于主存储器和中央处理器之间。每当CPU请求memory位置的内容时,首先检查cache中是否有此数据。如果数据存在于cache中,CPU直接从cache中获得数据。这是更快的,因为CPU不需要去memory拿数据。如果数据不在cache中,则从memory读取一块内容到cache中,然后传递所需的数据块给CPU。当一个地址在cache中被查找时,如果缓存中包含该地址的内容,它就被称为cache命中。反之称之为cache丢失。

2. 在有cache使能的机器上,在链表(linked list)中搜索数据与在向量(vector)中搜索数据的程序的性能会有差异吗?

链表是一种将元素存储在非连续内存位置的数据结构,而向量是一种将元素存储在连续位置的数据结构。

对于使用cache的设计:如果一个内存位置存在于cache中,那么很有可能其它连续字节也会存在于cache中,因为从主存到cache的任何读取通常都是根据cache line(通常是32或64或128字节)进行的。正因为如此,在有cache的机器上,搜索向量比搜索链表要快。

3. 将memory映射到cache的不同方法有哪些?比较每种方法的优缺点。

有3种主要的映射技术用于映射memory和cache的内容。在每一种映射中,memory和cache被话费为很多块(cache line,通常为64字节大小),这是用于映射的最小大小。

  • 直接映射:在直接映射中,memory中每个块只能映射到cache的一个特定块中。这是所有映射中最简单的,通过知道memory地址,可以很容易计算出cache中可能位置,并且仅与单个位置的标记位进行比较就可以算出是否命中cache。这种映射的缺点是,即使cache可能未满,但如果memory访问是在同一块中的地址,则可能导致更多的替换并且效率不高。
  • 全相联映射:在全相联映射中,任何memory块都可以映射到cache中的任何块。这种方式的优点是cache的所有位置都可以被充分利用,命中率高。但是成本高,查找是否命中最慢。
  • 组相联映射:它是直接映射和全相联映射的折中,在组相联映射中,cache块被分为若干个块集合。memory地址与cache地址的映射转换有两部分,组地址是按直接映射方式,按地址进行访问,而块地址是采用全相联方式,按内容访问。这种映射的优点是cache块的冲突概率比较低,块的利用率大幅度提高,块失效率明显降低。但是实现难度和造价都要比直接映射高。不过,现在这种映射在cache实现中使用最为广泛。

4. 4路组相联映射的cache的总大小为256KB。如果每个cache块(cache line)的大小是64字节,那么cache中有多个集合(cache set)?假设地址位宽为32-bit,需要多少地址位作为标签位(tag)

Cache的块总数 = (256*1024)/64 = 4096。因为cache是4路组相联,集合数 = 4096/4 = 1024。给定一个32位的地址(address)和64字节的cache块,address[5:0]用于索引cache块内部的字节,address[15:6]被用来找出哪一组地址映射。剩余的address[31:16]用作标签位,也就是16位。

5. Write-through和write-back的cache区别是什么?各有什么优缺点?

Write-through cache:在write-through cache中,每个对cache的写操作同时也写入memory。这很容易设计,因为相对于cache而言,memory总是最新的,但缺点会经常占用memory带宽。

Write-back cache:在write-back cache中,每次对cache的写操作都只写到cache中。写memory被延迟,直到cache块被替换掉。Write-back cache在memory带宽使用上更友好,因为数据只在需要时才写回memory。但如果系统中有多个cache可以缓存相同的地址,那么维护一致性的数据就会变得复杂,因为内存可能并不总是有最新的数据。

6. Inclusive cache和exclusive cache有什么不同?

Cache的inclusive和exclusive属性适用于具有多个cache级别的设计,例如包含L1、L2和L3 cache。

如果L1 cache中存在的所有内容被设计为也存在于L2 cache中,则L1 cache称为inclusive cache。如果保证所有的内容最多只存在于一个L1或L2 cache中,而不同时存在于两个cache中,那么这些cache就称为exclusive cache。Exclusive cache的优点是多级cache可以一起存储更多的数据。Inclusive cache的优点是,在多处理器系统中,如果必须从处理器的cache中删除一个cache块,则只需要在L2 cache中检查它就行,而对于exclusive cache,则必须检查它是否存在于L1和L2 cache中。

相关文章:

芯片工程师求职题目之CPU篇(3)

1. 什么是cache(缓存)?它的工作原理是什么? Cache是少量的快速内存。它位于主存储器和中央处理器之间。每当CPU请求memory位置的内容时,首先检查cache中是否有此数据。如果数据存在于cache中,CPU直接从cache中获得数据。这是更快…...

Grounding dino + segment anything + stable diffusion 实现图片编辑

目录 总体介绍总体流程 模块介绍目标检测: grounding dino目标分割:Segment Anything Model (SAM)整体思路模型结构:数据引擎 图片绘制 集成样例 其他问题附录 总体介绍 总体流程 本方案用到了三个步骤,按顺序依次为&#xff1a…...

如何选择更快更稳定的存储服务器

选择更快、更稳定的存储服务器需要考虑以下几个方面: 存储介质:存储服务器的主要存储介质包括固态硬盘(SSD)和机械硬盘(HDD)。相比于机械硬盘,固态硬盘具有更高的读写速度和更低的延迟&#xf…...

此芯科技加入 openKylin 开源社区

导读近日消息,据此芯科技官方公众号表示,此芯科技目前已经签署 openKylin 社区 CLA(Contributor License Agreement 贡献者许可协议),正式加入 openKylin 开源社区。 此芯科技成立于 2021 年,是一家专注于设…...

开发一个RISC-V上的操作系统(七)—— 硬件定时器(Hardware Timer)

目录 往期文章传送门 一、硬件定时器 硬件实现 软件实现 二、上板测试 往期文章传送门 开发一个RISC-V上的操作系统(一)—— 环境搭建_riscv开发环境_Patarw_Li的博客-CSDN博客 开发一个RISC-V上的操作系统(二)—— 系统引导…...

电池的正极是带正电?

首先说明结论:电池正极带正电,负极带负电。 一个错误的实例: 如果说电流是从电池正极流动到电池负极,那么电子就是从负极流动到正极,那么正极就是带负电。----这个说法是错误的。这是因为,根据那么很出名…...

Go 协程为什么比进程和线程占用的系统资源低?

1 介绍 进程是一个程序在执行时所占据的独立虚拟内存空间,Linux为每个进程分配一个虚拟内存空间,包括栈、未使用的内存、堆、BSS、DATA和TEXT等。 线程可以看作是轻量级的进程,多个线程在一个进程中“共生”,每个线程拥有独立的…...

性能测试—Jmeter工具

文章目录 性能测试1. 术语介绍2. 方法3. 应用场景4. 工具(Jmeter)4.1 介绍4.2 元件和组件4.2.2 元件4.2.1 组件 4.3 作用域4.4 参数化4.5 执行脚本 性能测试 1. 术语介绍 响应时间(Response time):对请求作出响应所需要的时间。 在互联网上对…...

【分布式系统】聊聊高性能设计

每个程序员都应该知道的数字 高性能 对于以上的数字,其实每个程序员都应该了解,因为只有了解这些基本的数字,才能知道对于CPU、内存、磁盘、网络之间数据读写的时间。1000ms 1S。毫秒->微秒->纳秒-秒->分钟 为什么高性能如此重要的…...

自动驾驶数据集汇总

1.Nuscenes 数据集链接:nuScenes nuscenes数据集下有多个任务,涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、规划控制等多个任务; nuScenes数据集是一个具有三维目标注释的大型自动驾驶数…...

面向对象的基本原则

背景 面向对象是抽象技术的一种实现,将对象作为真实世界中实体的抽象,代表了特定的一块密集而内聚的信息。在面向对象设计及实现中,重点考虑的就是如何做到关注点分离。因为对象内的联系通常比对象间的联系更强。关注点分离就是将对象中高频…...

C语言开发基础知识(一)

文章目录 数据类型宏变量函数inline 内联函数static 关键字的作用const 关键字的作用extern 关键字的作用volatile 关键字的作用include 关键字的作用数组、字符串指针堆内存管理结构体文件操作数据类型 C语言中数据类型分有符号和无符号,默认是有符号的。 有符号类型: 数据…...

​API网关类型与区别​

什么是API网关? 在现代软件架构中,API(应用程序编程接口)网关起着重要的作用。它是一个中间层,用于管理和控制应用程序之间的通信。API网关可以提供一些关键功能,如流量控制,安全认证&#xff…...

linux:nginx网站升级至http2

参考: 怎样把网站升级到http/2 - 知乎 HTTP/2 与 HTTP/1.1:它们如何影响 Web 性能? | Cloudflare 总结: nginx.conf修改 http2需要ssl支持 listen 443 ssl http2;...

Flutter:屏幕适配

flutter_screenutil flutter_screenutil是一个用于在Flutter应用程序中进行屏幕适配的工具包。它旨在帮助开发者在不同屏幕尺寸和密度的设备上创建响应式的UI布局。 flutter_screenutil提供了一些用于处理尺寸和间距的方法,使得开发者可以根据设备的屏幕尺寸和密度…...

中科亿海微ROM使用

标题 ROM(Read-Only Memory,只读存储器)是一种在FPGA(Field-Programmable Gate Array,现场可编程门阵列)中常用的存储器类型。与RAM(Random Access Memory,机存取存储器)…...

Python接口自动化测试之UnitTest详解

基本概念 UnitTest单元测试框架是受到JUnit的启发,与其他语言中的主流单元测试框架有着相似的风格。其支持测试自动化,配置共享和关机代码测试。支持将测试样例聚合到测试集中,并将测试与报告框架独立。 它分为四个部分test fixture、TestC…...

python——案例17:判断某年是否是闰年

案例17:判断某年是否是闰年 判断依据:闰年就是能被400整除,或者能被4整除的年份numint(input(输入年份:))if num%1000: if num%4000: #整百年份的判断print("%s年是闰年"%num) #…...

allure测试报告

使用pytest结合Allure进行测试报告生成的简单教程 allure测试报告 Allure基于Java开发,因此我们需要提前安装Java 8或以上版本的环境。 ◆安装allure-pytest插件在DOS窗口输入命令“pip3 install allure-pytest”,然后按“Enter”键。 下载安装Allure…...

Vue 路由懒加载

Vue 路由懒加载 随着 Web 应用的复杂性不断增加,性能优化成为了开发人员必须面对的挑战之一。Vue 路由懒加载是一项关键技术,它可以帮助我们提高 Web 应用的加载速度,从而提升用户体验。 在本篇技术博文中,我们将深入探讨 Vue 路…...

基于算法竞赛的c++编程(28)结构体的进阶应用

结构体的嵌套与复杂数据组织 在C中,结构体可以嵌套使用,形成更复杂的数据结构。例如,可以通过嵌套结构体描述多层级数据关系: struct Address {string city;string street;int zipCode; };struct Employee {string name;int id;…...

业务系统对接大模型的基础方案:架构设计与关键步骤

业务系统对接大模型:架构设计与关键步骤 在当今数字化转型的浪潮中,大语言模型(LLM)已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中,不仅可以优化用户体验,还能为业务决策提供…...

【Java学习笔记】Arrays类

Arrays 类 1. 导入包:import java.util.Arrays 2. 常用方法一览表 方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序(自然排序和定制排序)Arrays.binarySearch()通过二分搜索法进行查找(前提:数组是…...

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解

JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用,结合SQLite数据库实现联系人管理功能,并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能,同时可以最小化到系统…...

PAN/FPN

import torch import torch.nn as nn import torch.nn.functional as F import mathclass LowResQueryHighResKVAttention(nn.Module):"""方案 1: 低分辨率特征 (Query) 查询高分辨率特征 (Key, Value).输出分辨率与低分辨率输入相同。"""def __…...

20个超级好用的 CSS 动画库

分享 20 个最佳 CSS 动画库。 它们中的大多数将生成纯 CSS 代码,而不需要任何外部库。 1.Animate.css 一个开箱即用型的跨浏览器动画库,可供你在项目中使用。 2.Magic Animations CSS3 一组简单的动画,可以包含在你的网页或应用项目中。 3.An…...

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好,我是java1234_小锋老师,看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...

pikachu靶场通关笔记19 SQL注入02-字符型注入(GET)

目录 一、SQL注入 二、字符型SQL注入 三、字符型注入与数字型注入 四、源码分析 五、渗透实战 1、渗透准备 2、SQL注入探测 (1)输入单引号 (2)万能注入语句 3、获取回显列orderby 4、获取数据库名database 5、获取表名…...

在 Spring Boot 中使用 JSP

jsp&#xff1f; 好多年没用了。重新整一下 还费了点时间&#xff0c;记录一下。 项目结构&#xff1a; pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...