数据库管理-第226期 内存至超线程(20240805)
数据库管理226期 2024-08-05
- 数据库管理-第226期 内存至超线程(20240805)
- 1 CPU内缓存结构
- 2 缓存与内存
- 3 单核单线程
- 4 超线程
- 5 超线程的利弊
- 总结
数据库管理-第226期 内存至超线程(20240805)
作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database(Oracle与MySQL)
PostgreSQL ACE Partner
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、年度墨力之星,ITPUB认证专家、专家百人团成员,OCM讲师,PolarDB开源社区技术顾问,HaloDB外聘技术顾问,OceanBase观察团成员,青学会MOP技术社区(青年数据库学习互助会)技术顾问
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭
8月第一篇技术文章,离上一篇又隔了好几天,上周末在公众号写了篇骂人的,最终发现,还是写技术文章舒服一点。
上周吕海波老师写了一篇《详解超线程:一点也不逻辑的逻辑CPU》(https://mp.weixin.qq.com/s/-oZossf4tatoAehIo_Ldug),我想班门弄斧一下,深入一点点。
1 CPU内缓存结构

以我笔记本上的AMD Ryzen 9 6900HX(8核心16线程)为例,通过CPU-Z我们可以看到CPU内部是存在3级缓存结构的,称为L1、L2、L3缓存:
- L1缓存:L1缓存被分为数据缓存(8x32KB,256KB)和指令缓存(8x32KB,256KB),总计0.5MB,这一部分是每个物理核心独享的。L1缓存是最快且容量最小的存储级别,是CPU首先寻找数据的位置。当所需数据存在于L1缓存时,即缓存命中,CPU 便会从L1缓存中直接读取数据进入核心操作或操作完成后写入数据。
- L2缓存:L1缓存被分为(8x512KB),总计4MB,这一部分是每个物理核心独享的。当缓存未命中,即所需数据不在L1缓存中时,CPU 转而检查L2缓存。L2缓存容量更大,但速度稍慢。
- L3 缓存:L3缓存为16路总计16MB,这一部分是所有物理核心共享的。如果L2缓存也未命中,CPU会接着检查L3缓存。L3缓存是所有缓存级别中容量最大但响应速度最慢的。

2 缓存与内存
即便有了上一节中对CPU内部三级缓存的概述,但是仍然对其没有直观的感受。
首先我们要知道一点,CPU物理核心都是需要对数据进行操作的,为了提升CPU物理核心的使用效率,CPU物理核心就需要更快的获得数据,那么我们来看看为啥即便是有了大容量的内存,还需要在CPU内部构建多级缓存,这里看看AIDA64的内存与缓存的测试结果:

这里可以看到内存无论是延迟还是带宽与CPU内部缓存都是有着巨大的差距的,就更别说即便是PCIe4.0 NVMe SSD与内存之间的差异了。这样的设计就是让常用的数据和指令尽可能缓存在贴近CPU物理核心的地方,以提升CPU物理核心处理数据的效率。这里可以画一张从磁盘到CPU的数据传输路径:

虽然从磁盘到缓存的带宽和延迟有着巨大的差异,但是容量确实反着来的,全量数据才磁盘,内存中有部分数据,缓存则是很小一部分数据。这么设计的缘由其实是将数据以不同容量“预读”在不同带宽、延迟的内存/缓存之中,当高速小容量的缓存需要交换数据时可以更好的从低速大容量的缓存/内存中“预载”的数据中更快的交互数据。越是与磁盘数据交互多的场景,这种设计效果越好,这也是数据库要尽可能充分利用内存资源的重要原因之一。
3 单核单线程
这里就要看一下CPU物理核心在单核单线程下的工作原理了,这里要重申一点,一个物理核心在同一个时间点只能处理一件事情。那么物理核心处理一次请求的流程大致如下:

这里就可以看到请求1来的时候会讲对应数据缓存,CPU物理核心去读取,操作完成后返回给缓存并反馈给请求发起方,待缓存清理后请求2才能执行对应的操作。那么在缓存进行数据交互的时候CPU物理核心就会处于空闲状态,即便缓存速度很快,也会浪费大量CPU资源(这里可以看看CPU频率和时间的比值)。
4 超线程
那么超线程技术实现了些什么?其实就是将缓存交换的时间给节省出来,简单来说就是在CPU物理核心在做数据操作的时候,有另一路缓存在提前缓存数据:

这样CPU就会减少甚至消除等待缓存交换数据的过程,从而提升CPU物理核心的利用效率,从另一个角度提升了CPU物理核心处理并发的能力。从一些资料查看,可以带来至少30%以上的性能提升。并且这是通过CPU物理层面实现的。
5 超线程的利弊
超线程的优势肯定是提高CPU物理核心利用效率,从而从整体层面提高CPU处理并发的效率,但是要实现这一功能,CPU需要增加一些简单的物理线路来实现,会增加晶体管数量、核心面积以及发热量。
另一方面如果是以前面图片为例,请求1和请求2可能分属两个不同的进程,可能会增加同一进程响应延迟,但是对于碎片化较多的操作请求(比如数据库),那么超线程技术还是可以带来很客观的性能提升。但是在比如游戏的场景中,往往更看重核心频率且都是线性处理,那么超线程可能会带来一些反作用(这也看游戏的多核心优化做的如何)。
总结
本期简单介绍了一下内存、缓存以及超线程之间的关系与原理。
老规矩,知道写了些啥。
相关文章:
数据库管理-第226期 内存至超线程(20240805)
数据库管理226期 2024-08-05 数据库管理-第226期 内存至超线程(20240805)1 CPU内缓存结构2 缓存与内存3 单核单线程4 超线程5 超线程的利弊总结 数据库管理-第226期 内存至超线程(20240805) 作者:胖头鱼的鱼缸…...
Django学习-数据迁移与数据导入导出
文章目录 一、数据迁移二、数据导入导出1. 数据导出2. 数据导入 一、数据迁移 数据迁移是将项目里定义的模型生成相应的数据表。主要的迁移指令如下: # 第一次生成自定义模型与django admin自带模型迁移文件,后续只生成新增模型迁移文件。后面加App名…...
【Nuxt】编程式导航和动态路由
编程式导航 navigateTo: 更多用法:navigateTo <template><div class"app-container"><button click"goToCategory">Category</button><NuxtPage/></div> </template> <script setup&…...
14. 计算机网络HTTPS协议(二)
1. 前言 上一章节中我们主要就 HTTPS 协议的前置知识进行介绍,下面会继续介绍 HTTPS 的通信过程以及抛出一些常见问题的探讨。因为候选人准备面试的时间和精力是比较有限的,我们在学习的过程要抓住重点,如果感觉对于细节缺乏了解,可以通过维基百科和查阅 StackOverflow 等…...
【算法设计题】实现以字符串形式输入的简单表达式求值,第2题(C/C++)
目录 第2题 实现以字符串形式输入的简单表达式求值 得分点(必背) 题解 1. 初始化和变量定义 2. 获取第一个数字并存入队列 3. 遍历表达式字符串,处理运算符和数字 4. 初始化 count 并处理加减法运算 代码详解 🌈 嗨…...
Kylin系列-入门
Kylin系列-入门 Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力,以支持超大规模数据。以下是对Kylin系列的入门介绍: 一、基本概念 1. 定义 Apache Kylin是由eBa…...
力扣-46.全排列
刷力扣热题–第二十六天:46.全排列 新手第二十六天 奋战敲代码,持之以恒,见证成长 1.题目简介 2.题目解答 这道题目想了会,思路比较好想,但一直没调试成功,所以就参考了力扣官网的代码,积累一下回溯算法的实现和基本实现思路,即先试探后回溯,结果在下面…...
博物馆展厅AI交互数字人,解锁创新的文化交互体验
在智能化时代,博物馆展厅融入AI交互数字人,可以为游客给予实时交互的旅游服务,AI交互数字人可以承担智能引导、讲解、接待、客服与导游等多重角色,为游客塑造崭新的旅游体验。 AI交互数字人相比传统的录屏解说相比,AI…...
DS18B20数字温度传感器操作解析
文章目录 引言特点工作原理引脚说明配置寄存器温度寄存器时序初始化时序写时序读时序 引言 DS18B20 是一种广泛使用的数字温度传感器,具有高精度和易用性。是Dallas Semiconductor公司(现为Maxim Integrated公司)生产的单总线数字温度传感器…...
你的财富正在被一个叫做通货膨胀的怪兽给吞噬掉,你却浑然不觉。
据统计,2024年全球总体通货膨胀率预计达到5.8%,这意味着:你的财富正在被一个叫做通货膨胀的怪兽给吞噬掉,你却浑然不觉。 数据来源:国际货币基金组织 如何跑赢通货膨胀? 家庭财富的积累速度,要…...
医疗设备漏费控制管理系统的必然性及未来发展性
医疗设备控费的必然性 医疗改革的要求 随着医疗改革的不断深入,原有的医药模式已经发生了改变。药品和耗材零差价的执行,使得医院需要寻找新的开源节流、降耗增效的方法。医疗设备控费系统的出现,正是为了满足这种管理需求。 控制成本和优…...
软件设计师笔记-网络基础知识
计算机网络的发展 计算机网络(计算机技术通信技术)的发展是一个逐步演进的过程,从简单的具有通信功能的单机系统,到复杂的以局域网及因特网为支撑环境的分布式计算机系统,这一历程经历了多个关键阶段: #me…...
MMC和eMMC的区别
MMC 和 eMMC 的区别 1. MMC MMC(MultiMediaCard)是一种接口协议,定义了符合这一接口的内存器,称为 MMC 储存体或 MMC 卡。它是一种非易失性存储器件,广泛应用于消费类电子产品中。 1.1 外观及引脚定义 MMC卡共有七个…...
亚马逊爬虫(Amazonbot)IP地址,真实采集数据
一、数据来源: 1、这批亚马逊爬虫(Amazonbot)IP来源于尚贤达猎头公司网站采集数据; 2、数据采集时间段:2023年10月-2024年7月; 3、判断标准:主要根据用户代理是否包含“Amazonbot”和IP核…...
Spring Boot(八十四):集成Thumbnailator来生成缩略图
1 Thumbnailator简介 Thumbnailator是一个用于Java的缩略图生成库。通过Thumbnailator提供的流畅接口(fluent interface)的方式可以完成复杂的缩略图处理任务,无需访问Image I/O API并通过Graphics2D对象手动操作BufferedImages。 2 代码示例 2.1 引入依赖 <dependency&g…...
MySQL基础操作全攻略:增删改查实用指南(上)
本节目标: NOT NULL - 指示某列不能存储 NULL 值。 UNIQUE - 保证某列的每行必须有唯一的值。 DEFAULT - 规定没有给列赋值时的默认值。 PRIMARY KEY - NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标 识&am…...
SAP MM学习笔记 - 豆知识02 - MR21 修改物料原价,MM02 修改基本数量单位/评价Class,MMAM 修改物料类型/评价Class
上一章讲了一些豆知识。比如 - MM50 批量扩张品目 - XK05/06 Block/消除供应商 - MM06/MM16 品目消除 - SE11/SE16/SE16/SE16N/SE16H/DB02 等查看常用的操作Table和数据的T-code SAP MM学习笔记- 豆知识01 - MM50 批量扩张,XK05/XK06 Block/消除供应商…...
谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存
文章目录 一,谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存1,在Elasticsearch的配置类中增加通用设置2,索引数据3,验证 一,谷粒商城实战笔记-126-全文检索-ElasticSearch-整合-测试保存 1,在…...
flutter开发环境搭建与android studio 安装配置
flutter开发环境搭建与android studio 安装配置 安装 android studio 下载安装 Android Studio 开发工具 Android Studio官网安装的时看到配置路径就换成自己其他盘的路径即可,其他的一路下一步就ok安装完毕,运行打开缺少 android sdk 按照提示下载即可…...
postgresql 字符串 替换
postgresql 字符串 替换 在PostgreSQL中,可以使用replace()函数来替换字符串中的某个部分。该函数的语法如下: REPLACE(string text, from text, to text) 其中: string 是要进行替换操作的原始字符串。 from 是原始字符串中需要被替换掉的…...
java.net.SocketTimeoutException: Connect timed out
Could not install Gradle distribution from https://services.gradle.org/distributions/gradle-8.13-bin.zip. Reason: java.net.SocketTimeoutException: Connect timed outAndroid Studio 从 Gradle 官方服务器下载 gradle-8.13-bin.zip 时,网络连接超时&#…...
OpenClaw浏览器自动化:千问3.5-27B驱动智能检索与内容聚合
OpenClaw浏览器自动化:千问3.5-27B驱动智能检索与内容聚合 1. 为什么需要浏览器自动化助手 作为一个经常需要做市场调研的技术人,我过去总是陷入这样的循环:打开十几个浏览器标签页,在不同平台间反复切换,手动复制粘…...
嵌入式系统栈溢出问题分析与防护实践
1. 栈溢出问题现象与初步分析最近在调试一个嵌入式系统时,遇到了一个非常典型的栈溢出问题。现象很简单:一个局部变量status的值莫名其妙地从0x01变成了其他值。最诡异的是,在两次打印status之间,代码并没有直接修改这个变量。简化…...
OpenClaw自动化测试:Kimi-VL-A3B-Thinking多模态交互验证框架
OpenClaw自动化测试:Kimi-VL-A3B-Thinking多模态交互验证框架 1. 为什么需要AI驱动的自动化测试 去年接手一个客户端项目时,我遇到了一个典型痛点——每次发版前的手动回归测试需要3个人天。更麻烦的是,UI微调导致的视觉差异很难通过传统断…...
敏捷还是瀑布?数字化项目的治理模式选择
敏捷还是瀑布?数字化项目的治理模式选择 项目背景:24年酒店PMS换系统和CRM上线。一、前言:当"稳定交付"遇上"快速迭代" 传统零售和酒店餐饮行业每年都要面对数十个数字化项目的治理决策。从ERP升级到会员中台建设&#x…...
04_RAGFlow之知识图谱与Text2SQL
RAGFlow之知识图谱与Text2SQL:构建智能检索的双引擎 知识体系结构 RAGFlow技术栈 │ ├── 知识图谱层 │ ├── 实体识别与关系提取(NER Relation Extraction) │ ├── 图谱查询与推理(Graph Query & Reasoning&a…...
linux——消息队列进程间通信
ftok函数key_t ftok( char * fname, int id ) //系统建立IPC通讯(如消息队列、共享内存时)必须指定一个ID值。通常情况下,该id值通过ftok函数得到。 参数: fname就时你指定的文件名(该文件必须是存在而且可以访问的)。 id是子序…...
OpenClaw故障排除手册:千问3.5-9B连接问题大全
OpenClaw故障排除手册:千问3.5-9B连接问题大全 1. 开篇:为什么需要这份手册? 上周我在本地部署OpenClaw对接千问3.5-9B模型时,连续遇到了三个诡异的连接错误。每次报错都像在玩解谜游戏——错误信息含糊不清,社区讨论…...
ANDOVER PS120/240电源模块
ANDOVER PS120/240 电源模块是一款工业控制系统用电源设备,主要用于为控制器、I/O 模块及相关设备提供稳定的直流或交流电源。一、基本概述型号:PS120/240类型:电源模块用途:为工业控制系统提供稳定可靠的电力支持二、主要功能提供…...
仿真波形截图](https://example.com/waveform.jpg
永磁同步电机全速域无位置传感器控制仿真,高频注入改进滑膜控制,PMSM矢量控制仿真 1,在零低速域,采用无数字滤波器高频方波注入法,减少滤波的相位影响,且对凸极性要求不高; 2,在中高…...
