当前位置: 首页 > news >正文

Linux之HugePage的原理与使用

Linux之HugePage的原理与使用

    • 虚拟地址与物理地址
      • 虚拟地址
      • 物理地址
      • 虚拟地址与物理地址的转换
    • HugePage的概念
    • Linux使用HugePage
      • 创建HugePage
      • 在程序中使用HugePage
    • 总结

虚拟地址与物理地址

在研究HugePage之前,首先需要明白虚拟地址和物理地址的概念。在计算机系统中,虚拟地址和物理地址是两个重要的概念。

虚拟地址

虚拟地址是由操作系统为每个进程分配的地址空间。每个进程都认为自己拥有独立的、连续的地址空间,从地址零开始。

  • 提供了一种内存保护机制。不同的进程有各自独立的虚拟地址空间,一个进程不能直接访问另一个进程的内存,从而防止了进程之间的非法访问和干扰。
  • 实现了多任务环境下的内存管理。操作系统可以在物理内存不足时,将部分暂时不用的页面存储到磁盘上,当需要时再重新加载到内存中,使得多个进程可以在有限的物理内存下同时运行。
  • 方便程序的编写和移植。程序员可以在不考虑实际物理内存布局的情况下进行编程,提高了开发效率。而且,由于虚拟地址空间的独立性,程序可以在不同的硬件平台上更容易地进行移植。

物理地址

物理地址是计算机内存中实际的存储单元地址。

  • 物理地址直接对应着内存中的实际存储位置,是数据真正存储的地方。
  • 硬件设备(如 CPU、内存控制器等)通过物理地址来访问内存中的数据。

虚拟地址与物理地址的转换

为了让进程能够正确地访问内存中的数据,操作系统需要将虚拟地址转换为物理地址。这个转换过程通常由硬件(如内存管理单元 MMU)和操作系统共同完成,并且需要MTT(内存转换表,Memory Translate Table)以及MPT(内存保护表,Memory Protect Table)。

  1. 当进程访问一个虚拟地址时,MMU 会根据页表等数据结构将虚拟地址转换为物理地址。
  2. 如果转换过程中发现所需的页面不在物理内存中,操作系统会触发页面错误,然后将所需的页面从磁盘加载到物理内存中,并更新页表,再次进行地址转换。

总之,虚拟地址和物理地址在计算机系统中起着不同的作用,虚拟地址为进程提供了独立的地址空间和内存保护,而物理地址则是实际存储数据的位置。通过虚拟地址到物理地址的转换,操作系统实现了高效的内存管理和多任务环境下的程序运行。
例如下图的转换所示:
在这里插入图片描述

HugePage的概念

Linux 会以页为单位管理内存,而默认的页面大小为 4KB,虽然部分处理器会使用 8KB、16KB 或者 64KB 作为默认的页面大小,不过 4KB 仍然是操作系统的默认页面配置的主流。这样一来,一个程序可能会使用很多的内存页面,而每个页面都需要相应的MTT(Memory Translate Table)和MPT(Memory Protect Table)来进行虚拟地址(VA)到物理地址(PA)的转换,当一个程序需要大量的内存时,由于每个页面都很小,就需要很多的MTT和MPT,从而会增加系统的开销,影响程序的性能。
为此,Linux中应用了大页(HugePage)的概念,也就是使用比较大的内存页面,2MB 一般都是 HugePages 的默认大小,在 arm64 和 x86_64 的架构上甚至支持 1GB 的大页面,是 Linux 默认页面大小的 262144 倍。这样,当一个应用程序需要大量的内存时,就可以只是使用非常少的内存页面就能够满足程序的需求,可以大大降低所需要的MTT和MPT,提升性能。
在这里插入图片描述
可以通过如下所示的命令查看有关HugePage的信息:

cat /proc/meminfo | grep Huge

例如如下的结果:
在这里插入图片描述
上图的结果表示,HugePage的大小为2048KB也就是2MB,现有的HugePage有两个,并且它们都没有被使用。

Linux使用HugePage

创建HugePage

首先需要在linux系统中创建HugePage,然后才可以去使用,创建并加载HugePage的命令如下所示,这里使用的时默认的大页(HugePage)大小,2MB:

  • 创建一定数量的HugePage
sudo sysctl -w vm.nr_hugepages=<HugePage 数量>
  • 挂载 HugePages 文件系统
sudo mkdir /mnt/huge
sudo mount -t hugetlbfs none /mnt/huge
  • 检查 HugePages 是否被正确使用
cat /proc/meminfo | grep Huge

也可以使用如下所示的命令查看已经挂载了的HugePage:

mount | grep hugetlbfs

其运行结果为:
在这里插入图片描述
可以看出,我创建并且挂载了两个大页。

在程序中使用HugePage

在linux中一般使用 mmap 或 shmget 来分配和使用大页需要在程序中明确地调用这些函数,并指定所需的标志和内存大小。
例如下面的示例代码,我们使用了等待用户输入字符这种方法,或者死循环的方法也可以,以便于使得程序运行很长的时间,从而我们就可以通过命令行来检验程序是否使用了大页:

hp.c

#include <stdio.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>int main() {size_t hugepage_size = 2 * 1024 * 1024;  // 大页大小,2MBint fd = open("/mnt/huge/none", O_CREAT | O_RDWR, 0755);  // 打开大页文件系统路径if (fd < 0) {perror("Failed to open hugetlbfs");return 1;}// 使用 mmap 分配大页void *addr = mmap(NULL, hugepage_size, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS | MAP_HUGETLB, fd, 0);if (addr == MAP_FAILED) {perror("mmap failed");return 1;}// 向大页写入数据strcpy((char *)addr, "Hello, Huge Page!");printf("Huge page allocated at: %p\n", addr);printf("Data in huge page: %s\n", (char *)addr);  // 读取并打印数据// 程序运行,等待输入以退出printf("Press Enter to exit...");getchar();// 使用完毕后,记得释放内存munmap(addr, hugepage_size);close(fd);return 0;
}

对代码进行编译:

gcc -o hpt hp.c

运行程序:

sudo ./hpt

在这里插入图片描述

为了验证我们的程序是否使用了指定的大页,我们首先查看程序的进程:

ps aux | grep hpt

命令行运行之后的结果为:
在这里插入图片描述
这里需要注意,真正使用了大页的是中间那行所表示的进程号,这是由于第一行的进程号是原始的c程序的进程,在其中我们开启了一个调用大页,所以会重新开启一个进程,最后那一行的进程可以不用管,与我们的大页示例程序无关,如果非要去深究一下,那么,它实际上表示的是对应的那个大页分配给了我们的这个程序。

这里记录一下程序运行的pid,我的就是169136,后续在使用的时候需要替换为你自己的pid。

然后我们再次运行下面的命令:

cat /proc/meminfo | grep Huge

结果为:
在这里插入图片描述
可以看出来,空闲的HugePage只有一个,实际上非空闲的那个HugePage正在被我们的程序使用。

在前面我们已经得到了程序的pid,现在就使用这个pid直接去查看程序所使用的页面,命令行如下所示:

sudo cat /proc/<pid>/smaps | grep -i Private_Hugetlb

例如我的命令就是:

sudo cat /proc/169136/smaps | grep -i Private_Hugetlb

得到的结果为:
在这里插入图片描述
可以看出,的确使用了一个大小为2048KB也就是2MB的大页HugePage。

至此,我们成功使用了大页并对其进行了验证,可以关闭之前的那个程序了。

总结

本文介绍了虚拟地址、物理地址、地址转换、大页(HugePage)等概念,并在linux中创建大页,然后还使用c语言编写程序真实地使用了HugePage并且对其使用情况进行了检验和分析。希望本文对大家有所帮助和启发。

相关文章:

Linux之HugePage的原理与使用

Linux之HugePage的原理与使用 虚拟地址与物理地址虚拟地址物理地址虚拟地址与物理地址的转换 HugePage的概念Linux使用HugePage创建HugePage在程序中使用HugePage 总结 虚拟地址与物理地址 在研究HugePage之前&#xff0c;首先需要明白虚拟地址和物理地址的概念。在计算机系统…...

一步步优化Redis实现分布式锁

分布式锁概念 在多线程的程序里&#xff0c;为了避免同时操作一个共享变量产生数据问题&#xff0c;会加一个互斥锁&#xff0c;以确保共享变量的正确性&#xff0c;使用范围是同一个进程。 那如果是多个进程&#xff0c;需要同时操作一个共享资源&#xff0c;如何互斥呢&…...

C++进阶——二叉搜索树

目录 一、基本概念 二、性能分析 三、模拟实现 四、使用场景 1.key搜索场景 2.key/value搜索场景 一、基本概念 二叉搜索树&#xff08;Binary Search Tree&#xff09;&#xff0c;看名字就知道,是可以用来搜索数据的一种二叉树。 它可以是空树&#xff08;一个数据都…...

Require:业界优秀的HTTP管理方案。

方案异步JDK额外依赖特点HttpURLConnection 【优点】Java内置&#xff0c;简单易用。对于简单的HTTP请求和响应处理非常合适。 【缺点】功能相对较少&#xff0c;不支持现代特性&#xff08;如异步请求、连接池等&#xff09;。API相对繁琐&#xff0c;处理复杂请求时代码冗长。…...

装饰模式(Decorator Pattern)在 Go 语言中的应用

文章目录 引言什么是装饰模式&#xff1f;在Go语言中的应用定义接口实现具体逻辑创建装饰器使用装饰器 装饰模式 vs 中间件装饰模式中间件区别 总结 引言 在软件开发中&#xff0c;设计模式是解决常见问题的模板。装饰模式&#xff08;Decorator Pattern&#xff09;是一种结构…...

Windows系统部署redis自启动服务

文章目录 引言I redis以本地服务运行(Windows service)使用MSI安装包配置文件,配置端口和密码II redis服务以终端命令启动缺点运行redis-server并指定端口和密码III 知识扩展确认redis-server可用性Installing the Service引言 服务器是Windows系统,所以使用Windows不是re…...

34岁IT男的职场十字路口:是失业预警,还是转型契机?

在信息技术这片充满机遇与挑战的广袤领域&#xff0c;34岁&#xff0c;一个看似正值壮年却暗藏危机的年龄&#xff0c;成为了许多IT男性不得不面对的职场考验。当“34岁现象”逐渐凸显&#xff0c;我们不禁要问&#xff1a;在这个快速变化的时代&#xff0c;34岁的IT男&#xf…...

复试经验分享《三、计算机学科专业基础综合》- 数据结构篇

复试经验分享 三、计算机学科专业基础综合 3.1 数据结构 3.1.1 概念 时间复杂度 时间复杂度是指执行算法所需要的计算工作量一般情况下&#xff0c;按照基本操作次数最多的输入来计算时间复杂度&#xff0c;并且多数情况下我们去最深层循环内的语句所描述的操作作为基本操作…...

数学建模算法与应用 第16章 优化与模拟方法

目录 16.1 线性规划 Matlab代码示例&#xff1a;线性规划求解 16.2 整数规划 Matlab代码示例&#xff1a;整数规划求解 16.3 非线性规划 Matlab代码示例&#xff1a;非线性规划求解 16.4 蒙特卡洛模拟 Matlab代码示例&#xff1a;蒙特卡洛模拟计算圆周率 习题 16 总结…...

windows下安装、配置neo4j并服务化启动

第一步&#xff1a;下载Neo4j压缩包 官网下载地址&#xff1a;https://neo4j.com/download-center/ &#xff08;官网下载真的非常慢&#xff0c;而且会自己中断&#xff0c;建议从以下链接下载&#xff09; 百度网盘下载地址&#xff1a;链接&#xff1a;https://pan.baid…...

【JVM】—深入理解G1回收器—回收过程详解

深入理解G1回收器—回收过程详解 ⭐⭐⭐⭐⭐⭐ Github主页&#x1f449;https://github.com/A-BigTree 笔记链接&#x1f449;https://github.com/A-BigTree/Code_Learning ⭐⭐⭐⭐⭐⭐ 如果可以&#xff0c;麻烦各位看官顺手点个star~&#x1f60a; 文章目录 深入理解G1回收…...

2、CSS笔记

文章目录 二、CSS基础CSS简介CSS语法规范CSS代码风格CSS选择器CSS基础选择器标签选择器类选择器--最常用id选择器通配符选择器 CSS复合选择器交集选择器--重要并集选择器--重要后代选择器--最常用子代选择器--重要兄弟选择器相邻兄弟选择器通用兄弟选择器 属性选择器伪类选择器…...

使用XML实现MyBatis的基础操作

目录 前言 1.准备工作 1.1⽂件配置 1.2添加 mapper 接⼝ 2.增删改查操作 2.1增(Insert) 2.2删(Delete) 2.3改(Update) 2.4查(Select) 前言 接下来我们会使用的数据表如下&#xff1a; 对应的实体类为&#xff1a;UserInfo 所有的准备工作都在如下文章。 MyBatis 操作…...

智汇云舟亮相WAFI世界农业科技创新大会,并参编数字农业产业图谱

10月10日&#xff0c;2024WAFI世界农业科技创新大会农食行业创新与投资峰会在北京金海湖国际会展中心举行。中国农业大学MBA教育中心主任、教授付文阁、平谷区委常委、统战部部长刘堃、华为公共事业军团数字政府首席专家刘丹、荷兰瓦赫宁根大学前校长Aalt Dijkhuizen、牧原食品…...

昇思MindSpore进阶教程--数据处理性能优化(中)

大家好&#xff0c;我是刘明&#xff0c;明志科技创始人&#xff0c;华为昇思MindSpore布道师。 技术上主攻前端开发、鸿蒙开发和AI算法研究。 努力为大家带来持续的技术分享&#xff0c;如果你也喜欢我的文章&#xff0c;就点个关注吧 shuffle性能优化 shuffle操作主要是对有…...

Vivado - Aurora 8B/10B IP

目录 1. 简介 2. 设计调试 2.1 Physical Layer 2.2 Link Layer 2.3 Receiver 2.4 IP 接口 2.5 调试过程 2.5.1 Block Design 2.5.2 释放 gt_reset 2.5.3 观察数据 3. 实用技巧 3.1 GT 坐标与布局 3.1.1 选择器件并进行RTL分析 3.1.2 进入平面设计 3.1.3 收发器布…...

图(Java语言实现)

一、图的概念 顶点&#xff08;Vertex&#xff09;&#xff1a;图中的数据元素&#xff0c;我们称之为顶点&#xff0c;图至少有一个顶点&#xff08;非空有穷集合&#xff09;。 边&#xff08;Edge&#xff09;&#xff1a;顶点之间的关系用边表示。 1.图&#xff08;Graph…...

GPT 生成绘画_Java语言例子_超详细

基于spring ai &#xff1a;简化Java AI开发&#xff0c;提升效率与维护性 过去在使用Java编写AI应用时&#xff0c;主要困境在于缺乏统一的标准化封装&#xff0c;开发者需要针对不同的AI服务提供商查阅各自独立的文档并进行接口对接&#xff0c;这不仅增加了开发的工作量&am…...

华为OD机试 - 小朋友分组最少调整次数 - 贪心算法(Python/JS/C/C++ 2024 E卷 100分)

华为OD机试 2024E卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试真题&#xff08;Python/JS/C/C&#xff09;》。 刷的越多&#xff0c;抽中的概率越大&#xff0c;私信哪吒&#xff0c;备注华为OD&#xff0c;加入华为OD刷题交流群&#xff0c;…...

数字农业与遥感监测平台

随着全球人口的增长和气候变化的挑战&#xff0c;农业的可持续发展变得尤为重要。数字农业作为现代农业发展的重要方向&#xff0c;正逐渐成为提高农业生产效率、保障粮食安全的关键手段。遥感技术作为数字农业的重要组成部分&#xff0c;通过监测作物生长状况、土壤湿度、病虫…...

Open WebUI:企业级自托管AI平台架构深度解析

Open WebUI&#xff1a;企业级自托管AI平台架构深度解析 【免费下载链接】open-webui Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 WebUI&#xff0c;设计用于完全离线操作&#xff0c;支持各种大型语言模型&#xff08;LLM&#xff09;运行器&#xff0c;包括Ollama…...

别再踩坑了!UniApp集成支付宝支付,从创建应用到上线审核的保姆级避坑指南

UniApp集成支付宝支付全流程避坑指南&#xff1a;从密钥配置到审核上线的实战经验 第一次在UniApp项目中集成支付宝支付时&#xff0c;我花了整整三天时间反复调试——不是因为代码逻辑复杂&#xff0c;而是那些看似简单的配置环节处处是坑。本文将分享我从七个关键环节总结的…...

Zotero 7保姆级配置指南:从PC到安卓平板,用坚果云实现文献无缝同步

Zotero 7跨设备文献管理终极方案&#xff1a;Windows与安卓全链路同步实战 作为一名长期与文献打交道的科研工作者&#xff0c;最痛苦的莫过于在实验室电脑上精心整理的参考文献&#xff0c;回到家中平板上却无法查阅。这种割裂感我深有体会——直到发现Zotero 7与坚果云的组合…...

ELK+Metricbeat搭建服务器监控看板:CPU/内存/磁盘全搞定

ELKMetricbeat实战&#xff1a;打造企业级服务器监控看板 当服务器集群规模超过50台时&#xff0c;凌晨三点被电话叫醒处理性能问题的运维人员&#xff0c;最需要的不是咖啡&#xff0c;而是一套能实时呈现CPU、内存、磁盘等关键指标的智能监控系统。本文将手把手带您用ELK Sta…...

用快马平台十分钟复刻notepad++:打造你的轻量级web代码编辑器原型

今天尝试用InsCode(快马)平台快速复刻一个Notepad风格的Web代码编辑器原型&#xff0c;整个过程比想象中顺利很多。作为一个经常需要临时测试代码片段的开发者&#xff0c;这种轻量级工具特别适合快速验证想法。 确定核心功能框架 首先梳理了Notepad最常用的几个功能&#xff1…...

Kali桥接模式实战:从静态IP到动态DHCP的完整网络配置指南

1. 为什么需要桥接模式&#xff1f; 很多刚接触Kali Linux的朋友都会有这样的疑问&#xff1a;为什么虚拟机要配置桥接模式&#xff1f;简单来说&#xff0c;桥接模式让虚拟机就像一台真实存在的物理设备一样接入网络。想象一下你家里新买了一台电脑&#xff0c;插上网线就能直…...

3步解锁音乐收藏新维度:从音质到视觉的全方位升级

3步解锁音乐收藏新维度&#xff1a;从音质到视觉的全方位升级 【免费下载链接】Netease_url 网易云无损解析 项目地址: https://gitcode.com/gh_mirrors/ne/Netease_url 在数字音乐收藏领域&#xff0c;我们常常面临三重困境&#xff1a;想听无损音质却受限于平台限制&a…...

【VS Code】Windows10下VS Code配置Graphviz和DOT语言环境:从零开始到高效绘图

1. 为什么选择GraphvizDOTVS Code组合&#xff1f; 如果你经常需要绘制流程图、组织结构图或者算法示意图&#xff0c;一定遇到过这些烦恼&#xff1a;用鼠标拖拽调整图形太费时间&#xff0c;修改布局要反复操作&#xff0c;多人协作时版本混乱。GraphvizDOT语言正是为解决这些…...

保姆级教程:用vLLM V1源码复现官方Demo,手把手调试核心执行循环

深入vLLM V1核心&#xff1a;从源码构建到执行循环全解析 在当今大模型推理领域&#xff0c;效率优化已成为开发者关注的焦点。vLLM作为高性能推理框架的代表&#xff0c;其V1版本通过重构核心架构带来了显著的性能提升。本文将带您从零开始搭建vLLM V1开发环境&#xff0c;通…...

AI转PSD终极指南:快速实现矢量图到Photoshop分层文件的完美转换

AI转PSD终极指南&#xff1a;快速实现矢量图到Photoshop分层文件的完美转换 【免费下载链接】ai-to-psd A script for prepare export of vector objects from Adobe Illustrator to Photoshop 项目地址: https://gitcode.com/gh_mirrors/ai/ai-to-psd 还在为Illustrato…...