当前位置: 首页 > article >正文

linux内核高端内存映射-kmap/kunmap

动态映射高端内存页面,在32位系统中,物理内存分为低端内存(Low Memory,直接映射区)和高端内存(High Memory,动态映射区)。低端内存可通过固定偏移(PAGE_OFFSET)直接映射到内核虚拟地址空间,而高端内存(超出直接映射范围的物理内存)需通过 kmap动态分配虚拟地址并建立映射,供内核临时访问.kmap是Linux内核中用于将物理页面(尤其是高端内存页面)映射到内核虚拟地址空间的函数,使得内核能够通过虚拟地址直接访问物理内存。它是内核处理高端内存(High Memory)动态映射的核心机制之一,主要用于32位系统(虚拟地址空间有限),64位系统因地址空间充足,通常无需高端内存映射,kmap行为会更简化。1、关键数据结构mm/highmem.c /* * Describes one page-virtual association */ struct page_address_map { struct page *page; void *virtual; struct list_head list; /*挂接到page_address_slot-lh上*/ }; 每个page占用一个,512*4k2MPKMAP区刚好2M大小pkmap : 0xbfe00000 - 0xc0000000 ( 2 MB) static struct page_address_map page_address_maps[LAST_PKMAP]/*512*/; /* * Hash table bucket */ static struct page_address_slot { struct list_head lh; /* List of page_address_maps */ spinlock_t lock; /* Protect this buckets list */ } ____cacheline_aligned_in_smp page_address_htable[1PA_HASH_ORDER/*17,128*/]; arch/arm/include/asm/highmem.h 若页面属于高端内存(物理地址high_memory),kmap通过PKMAP区域(永久内核映射区)动态分配虚拟地址并建立映射 /* pkmap : 0xbfe00000 - 0xc0000000 ( 2 MB)*/ #define PKMAP_BASE (PAGE_OFFSET - PMD_SIZE) /*0xc0000000-0x2000000xbfe00000*/ /*2M/4K 512*/ #define LAST_PKMAP PTRS_PER_PTE /*512*/ #define LAST_PKMAP_MASK (LAST_PKMAP - 1) #define PKMAP_NR(virt) (((virt) - PKMAP_BASE) PAGE_SHIFT) #define PKMAP_ADDR(nr) (PKMAP_BASE ((nr) PAGE_SHIFT)) /*标记pkmap区中内个虚拟地址页面是否已经被映射*/ static int pkmap_count[LAST_PKMAP/*512*/]; static __cacheline_aligned_in_smp DEFINE_SPINLOCK(kmap_lock); 页表项 pte_t * pkmap_page_table; 高端内存提供的核心操作接口如下: #ifdef CONFIG_HIGHMEM void *kmap(struct page *page); void kunmap(struct page *page); void *kmap_atomic(struct page *page); void __kunmap_atomic(void *kvaddr); void *kmap_atomic_pfn(unsigned long pfn); struct page *kmap_atomic_to_page(const void *ptr); #endif2、kmap实现arch/arm/mm/highmem.c void *kmap(struct page *page) { might_sleep(); if (!PageHighMem(page)) /*非高端内存,线性映射区*/ return page_address(page); /*返回page对应虚拟地址*/ return kmap_high(page); } include/linux/page-flags.h #define PageHighMem(__p) is_highmem(page_zone(__p)) static inline int is_highmem(struct zone *zone) { #ifdef CONFIG_HIGHMEM int zone_off (char *)zone - (char *)zone-zone_pgdat-node_zones; return zone_off ZONE_HIGHMEM * sizeof(*zone) || (zone_off ZONE_MOVABLE * sizeof(*zone) zone_movable_is_highmem()); #else return 0; #endif } static inline struct zone *page_zone(const struct page *page) { return NODE_DATA(page_to_nid(page))-node_zones[page_zonenum(page)]; } page-flags的位分配由内核在编译时通过宏定义(如ZONES_SHIFT、NODES_SHIFT、SECTIONS_SHIFT等)确定, 不同架构/内核版本可能略有差异,但核心结构一致各个部分在page-flags内部偏移量计算 static inline int page_to_nid(const struct page *page) { return (page-flags NODES_PGSHIFT) NODES_MASK; } static inline enum zone_type page_zonenum(const struct page *page) { return (page-flags ZONES_PGSHIFT) ZONES_MASK; } 通过计算page所在的zone来判断page是在低端还是高端内存。 /** * page_address - get the mapped virtual address of a page * page: struct page to get the virtual address of * * Returns the pages virtual address. */ void *page_address(const struct page *page) { unsigned long flags; void *ret; struct page_address_slot *pas; if (!PageHighMem(page)) /*低端内存地址*/ return lowmem_page_address(page); /*page在page_address_htable[]中对应的slot槽位*/ pas page_slot(page); ret NULL; spin_lock_irqsave(pas-lock, flags); if (!list_empty(pas-lh)) { /*非空*/ struct page_address_map *pam; /*遍历返回地址*/ list_for_each_entry(pam, pas-lh, list) { if (pam-page page) { ret pam-virtual; goto done; } } } done: spin_unlock_irqrestore(pas-lock, flags); return ret; } hash计算,将冲突的地址挂接到槽位对应链表lh上 static struct page_address_slot *page_slot(const struct page *page) { return page_address_htable[hash_ptr(page, PA_HASH_ORDER/*7*/)/*hash值*/]; } static inline unsigned long hash_ptr(const void *ptr, unsigned int bits) { return hash_long((unsigned long)ptr, bits); } #define hash_long(val, bits) hash_32(val, bits) static inline u32 hash_32(u32 val, unsigned int bits) { /* On some cpus multiply is faster, on others gcc will do shifts */ u32 hash val * GOLDEN_RATIO_PRIME_32; /*对val取黄金比列值*/ /* High bits are more random, so use them. */ return hash (32 - bits); /*进行移位操作,保留高位bits*/ } /** * kmap_high - map a highmem page into memory * page: struct page to map * * Returns the pages virtual memory address. * * We cannot call this from interrupts, as it may block. */ void *kmap_high(struct page *page) { unsigned long vaddr; /* * For highmem pages, we cant trust virtual until * after we have the lock. */ lock_kmap(); vaddr (unsigned long)page_address(page); if (!vaddr) /*未被映射*/ vaddr map_new_virtual(page); /*从FKMAP中找到一个可用虚拟地址,并设置pte*/ pkmap_count[PKMAP_NR(vaddr)]; /*pkmap_count[] 为2*/ BUG_ON(pkmap_count[PKMAP_NR(vaddr)] 2); unlock_kmap(); return (void*) vaddr; } static inline unsigned long map_new_virtual(struct page *page) { unsigned long vaddr; int count; unsigned int last_pkmap_nr; unsigned int color get_pkmap_color(page); start: count get_pkmap_entries_count(color); printk(-----%s,color:%d \n,__func__,color); /* Find an empty entry */ for (;;) { last_pkmap_nr get_next_pkmap_nr(color); if (no_more_pkmaps(last_pkmap_nr, color)) { /*清除无效地址*/ flush_all_zero_pkmaps(); count get_pkmap_entries_count(color); } if (!pkmap_count[last_pkmap_nr]) /*可以使用*/ break; /* Found a usable entry */ if (--count) continue; /* count0, fkmap中无可用地址空间等待其他人释放空间出来 将任务进行休眠,存在其他任务释放高端内存时会将该任务唤醒 */ /* * Sleep for somebody else to unmap their entries */ { DECLARE_WAITQUEUE(wait, current); wait_queue_head_t *pkmap_map_wait get_pkmap_wait_queue_head(color); __set_current_state(TASK_UNINTERRUPTIBLE); /*不可中断休眠*/ add_wait_queue(pkmap_map_wait, wait); unlock_kmap(); schedule(); remove_wait_queue(pkmap_map_wait, wait); lock_kmap(); /* Somebody else might have mapped it while we slept */ if (page_address(page)) return (unsigned long)page_address(page); /* Re-start */ goto start; } } /*找到可以使用的虚拟地址*/ vaddr PKMAP_ADDR(last_pkmap_nr); /*虚拟地址*/ set_pte_at(init_mm, vaddr, (pkmap_page_table[last_pkmap_nr]), mk_pte(page, kmap_prot)); pkmap_count[last_pkmap_nr] 1; /*1*/ set_page_address(page, (void *)vaddr); return vaddr; } static inline int get_pkmap_entries_count(unsigned int color) { return LAST_PKMAP; } /* * Get next index for mapping inside PKMAP region for page with given color. */ static inline unsigned int get_next_pkmap_nr(unsigned int color) { static unsigned int last_pkmap_nr; /*静态变量*/ last_pkmap_nr (last_pkmap_nr 1) LAST_PKMAP_MASK; return last_pkmap_nr; } static inline int no_more_pkmaps(unsigned int pkmap_nr, unsigned int color) { return pkmap_nr 0; /*溢出*/ } static void flush_all_zero_pkmaps(void) { int i; int need_flush 0; flush_cache_kmaps(); /*清cache*/ for (i 0; i LAST_PKMAP/*512*/; i) { struct page *page; /* * zero means we dont have anything to do, * 1 means that it is still in use. Only * a count of 1 means that it is free but * needs to be unmapped */ /* 计数为0意味着我们无需执行任何操作 大于1意味着它仍在使用中 只有计数为1时,才意味着它是空闲的,但需要被解除映射 */ if (pkmap_count[i] ! 1) continue; pkmap_count[i] 0; /* sanity check */ BUG_ON(pte_none(pkmap_page_table[i])); /* * Dont need an atomic fetch-and-clear op here; * no-one has the page mapped, and cannot get at * its virtual address (and hence PTE) without first * getting the kmap_lock (which is held here). * So no dangers, even with speculative execution. */ /*解除映射*/ page pte_page(pkmap_page_table[i]); pte_clear(init_mm, PKMAP_ADDR(i), pkmap_page_table[i]); set_page_address(page, NULL); need_flush 1; } if (need_flush) flush_tlb_kernel_range(PKMAP_ADDR(0), PKMAP_ADDR(LAST_PKMAP)); } #define PKMAP_NR(virt) (((virt) - PKMAP_BASE) PAGE_SHIFT) #define PKMAP_ADDR(nr) (PKMAP_BASE ((nr) PAGE_SHIFT)) /** * set_page_address - set a pages virtual address * page: struct page to set * virtual: virtual address to use */ void set_page_address(struct page *page, void *virtual) { unsigned long flags; struct page_address_slot *pas; struct page_address_map *pam; BUG_ON(!PageHighMem(page)); pas page_slot(page); /*槽位号*/ if (virtual) { /* Add */ pam page_address_maps[PKMAP_NR((unsigned long)virtual)]; pam-page page; pam-virtual virtual; spin_lock_irqsave(pas-lock, flags); list_add_tail(pam-list, pas-lh); /*将pam加入到pas-list中*/ spin_unlock_irqrestore(pas-lock, flags); } else { /* Remove */ spin_lock_irqsave(pas-lock, flags); list_for_each_entry(pam, pas-lh, list) { if (pam-page page) { list_del(pam-list); /*将pam从pas-list中删除*/ spin_unlock_irqrestore(pas-lock, flags); goto done; } } spin_unlock_irqrestore(pas-lock, flags); } done: return; }若页面属于高端内存(物理地址high_memory),kmap通过PKMAP区域(永久内核映射区)动态分配虚拟地址并建立映射:PKMAP区域:内核虚拟地址空间中预留的固定区域。映射过程检查页面是否已通过PKMAP映射:内核维护pkmap_count数组(跟踪每个PKMAP槽位的引用计数)和pkmap_page_table(页表项)若未映射,从PKMAP区域分配一个空闲虚拟地址槽位,更新页表建立物理页框与虚拟地址的映射若PKMAP区域已满(所有槽位被占用),kmap会阻塞当前进程,等待其他映射释放槽位(通过 schedule()主动让出 CPU)3、kunmap实现void kunmap(struct page *page) { BUG_ON(in_interrupt()); if (!PageHighMem(page)) /*非高端内存直接返回*/ return; kunmap_high(page); } /** * kunmap_high - unmap a highmem page into memory * page: struct page to unmap * * If ARCH_NEEDS_KMAP_HIGH_GET is not defined then this may be called * only from user context. */ void kunmap_high(struct page *page) { unsigned long vaddr; unsigned long nr; unsigned long flags; int need_wakeup; unsigned int color get_pkmap_color(page); wait_queue_head_t *pkmap_map_wait; lock_kmap_any(flags); /*虚拟地址*/ vaddr (unsigned long)page_address(page); BUG_ON(!vaddr); nr PKMAP_NR(vaddr); /* * A count must never go down to zero * without a TLB flush! */ need_wakeup 0; switch (--pkmap_count[nr]) { /*设置为1,由flush_all_zero_pkmaps来进行回收处理*/ case 0: BUG(); case 1: /* * Avoid an unnecessary wake_up() function call. * The common case is pkmap_count[] 1, but * no waiters. * The tasks queued in the wait-queue are guarded * by both the lock in the wait-queue-head and by * the kmap_lock. As the kmap_lock is held here, * no need for the wait-queue-heads lock. Simply * test if the queue is empty. */ /*存在释放时就将因为fkmap无可用虚拟地址而休眠的任务唤醒*/ pkmap_map_wait get_pkmap_wait_queue_head(color); need_wakeup waitqueue_active(pkmap_map_wait); } unlock_kmap_any(flags); /* do wake-up, if needed, race-free outside of the spin lock */ if (need_wakeup) wake_up(pkmap_map_wait); /*唤醒任务*/ }注意事项:必须配对使用kunmap:映射后需显式解除,否则会导致虚拟地址槽位泄漏(PKMAP区域耗尽后后续映射失败)写后标记脏页:若修改了文件映射的页面(如vma-vm_file非空),需调用set_page_dirty(page)或set_page_dirty_lock(page)标记脏页,确保数据回写磁盘避免长期映射:kmap映射的地址应尽快释放,尤其在高并发场景下,减少PKMAP区域竞争

相关文章:

linux内核高端内存映射-kmap/kunmap

动态映射高端内存页面,在32位系统中,物理内存分为低端内存(Low Memory,直接映射区)和高端内存(High Memory,动态映射区)。低端内存可通过固定偏移(PAGE_OFFSET)直接映射到内核虚拟地址空间,而高端内存(超出直接映射范围的物理内存)需通过 kmap动态分配虚拟地址并建立映射,供内核…...

大数据开发面试必背:Oracle vs MySQL 核心差异

大数据开发面试必背:Oracle vs MySQL 核心差异(全维度对比实战示例) Oracle和MySQL是大数据开发/数仓面试中最常对比的两大数据库,本文从数据类型、语法、函数、事务、性能等核心维度,结合表格对比代码示例图形化逻辑&…...

文件操作(三)

一、fgetc函数1.1.函数原型:int fgetc ( FILE * stream );1.2.函数功能从流中获取字符,字符输入函数。返回指定流的内部文件位置指示器当前指向的字符。然后,内部文件位置指示器将前进到下一个字符。1.3.示例如下1.3.1.读文件代码如下&#x…...

期货软件开发 - 交易登录

C# WinForm 登录窗体代码,包括核心功能、关键逻辑,让你能清晰理解每一部分的作用。一、代码整体功能总结这段代码实现了一个期货交易系统的登录窗体(FrmLogin),核心功能包括:版本校验与自动更新账号密码登录…...

实测整理|免费编程体验课汇总(附获取方式)

作为深耕教育领域的博主,最近后台被问爆的问题就是:“想入门编程,有没有免费体验课?”“怕踩坑不想盲目报课,先试试水可行?”其实不管是零基础想入门的新手、想转行的职场人,还是想培养孩子逻辑…...

实战案例三:Claude Code + PDF 技能解析文档数据

PDF 文档是商业环境中常见的数据载体,从合同到报告,从发票到简历,大量有价值的信息存储在 PDF 中。本案例将展示如何利用 Claude Code 的 PDF 技能,高效提取和处理 PDF 文档中的数据。 场景描述 假设你是一家电商公司的运营人员,每周都会收到一份销售报告 PDF,包含各地…...

COMSOL激光超声仿真:板状材料中激光激发超声波的数值模拟

COMSOL激光超声仿真:板状材料中激光激发超声波的数值模拟 版本为5.6,低于5.6的版本打不开此模型在材料科学与无损检测等领域,激光超声技术因其独特优势备受关注。借助COMSOL软件,我们能够对板状材料中激光激发超声波的过程进行精确数值模拟。…...

终于等来了!OpenCowork 原生支持Mac啦,AI协作工具党狂喜

哈喽各位爱折腾AI工具的小伙伴们!好久没给大家安利实用的开源工具了,今天这款我亲测用了快两周,真的太香了必须分享给你们👇 它就是由国内AIDotNet团队开发的跨平台AI协作桌面工具——OpenCowork,简单来说就是你可以把…...

SSH免密登录配置指南

每次 SSH 登录都要输入密码,确实很影响效率。解决这个问题的核心方法,就是配置SSH密钥认证。简单来说,就是让你的电脑(客户端)和远程服务器(服务端)通过一对“钥匙”来互相确认身份,…...

CentOS7 部署 FastDFS 5.11 + Nginx 1.14 文件服务器(完整实践)

文章目录CentOS7 部署 FastDFS Nginx 文件服务器(完整实践)一、FastDFS 简介二、实验环境三、软件版本四、安装包下载五、环境准备六、安装 libfastcommon七、安装 FastDFS八、配置 FastDFS九、配置 Tracker十、配置 Storage十一、配置 Client十二、启动…...

小程序开发部署流程完整指南

小程序开发部署流程完整指南 本文详细介绍微信小程序从本地开发、构建、上传到正式发布的完整部署流程,以 Taro React 技术栈为例。 一、小程序部署的本质 小程序与公众号不同:前端代码运行在微信提供的沙箱环境中,代码需上传到微信服务器&…...

深度解读谷歌地图Gemini整合:从技术架构看AI如何重构LBS应用

【导语】2026年3月,谷歌地图宣布整合Gemini模型,推出对话式搜索Ask Maps和沉浸式导航。这不仅是产品功能的升级,更是LBS(基于位置的服务)应用与AI大模型深度融合的标志性事件。 自然语言理解如何实现从关键词到复杂意图…...

OpenClaw深度解析:开源AI数字员工如何实现7x24小时运行?小白程序员必看!收藏版

本文深入拆解了OpenClaw开源AI项目的火爆原因,核心在于其独特的架构设计,包括Agent Loop决策、Tools工具集和Gateway持续在线模块,实现了AI的7x24小时运行。文章强调开源带来的信任、生态和分发优势,对比Claude Code,指…...

别再瞎折腾了!这些Web渗透靶场让你从菜鸟变大神

最近有朋友问我,想学Web渗透测试但不知道从哪里下手,网上的教程看了一堆,理论倒是懂了不少,可一到实际操作就抓瞎。说实话,这种情况我见得太多了,就像学游泳一样,光看视频是永远学不会的&#x…...

磁盘参数错误恢复实战:零基础用户也能掌握的4步操作法

在数字化存储时代,磁盘参数错误如同潜伏在数据世界中的“隐形杀手”,它可能让重要文件瞬间消失、系统无法识别存储设备,甚至引发企业级存储阵列的瘫痪。无论是个人用户保存的珍贵照片,还是企业数据库中的核心数据,都可…...

高效处理报销票与发票:批量合并打印实战经验

在企业日常财务管理中,报销票据和各类发票的打印与整理是一项高频且繁琐的任务。尤其是在大型公司或物业、法律、人事等部门,每个月都可能产生上百份票据。 传统方式通常是手动下载、逐个打印,不仅耗时,而且容易出错。如何快速、…...

Reddit 发布关于B2B营销机会的报告

知名社交新闻论坛Reddit近日发布了一份新报告,着重探讨了在其平台进行B2B(企业对企业)营销的潜力与机会。尽管Reddit传统上并非B2B营销的首选平台,但报告指出,其平台上深入、专业的社区讨论实际上能显著影响企业的采购…...

OpenClaw安全风险持续发酵:官方预警升级,多所高校紧急部署防控措施

开源AI智能体OpenClaw(俗称“龙虾”)掀起全网使用热潮后,其安全隐患引发监管部门高度关注。工信部等相关部门明确提示,在默认配置或不当使用情况下,该工具极易引发网络攻击、信息泄露等安全问题,及时为“龙…...

作为一名市场运营,我的“养虾”初体验:上手JiuwenClaw,让AI智能体真的“越用越懂我”

一、前言最近,AI Agent(智能体)的概念非常火,但很多产品要么部署复杂,要么用起来像个死板的“工具人”。作为一名市场运营,在看到openJiuwen社区发布了基于Python开发的“小龙虾” JiuwenClaw,并…...

Springboot 组件注册 条件注解

组件注册方式:ConfigurationBean1、作用Bean 是 Spring 中手动注册 Bean 的核心注解,作用在方法上,告诉 Spring: 该方法的返回值会被 Spring 容器管理(成为 IoC 容器中的一个 Bean);2、自定义be…...

什么是系统函数 内核态与用户态

系统函数(即系统调用)是操作系统提供给用户程序的、访问底层资源(如 CPU、内存、磁盘、网络等)的唯一合法入口。任何试图绕过系统调用、直接访问底层资源的行为,在现代操作系统中都是被硬件和内核协同禁止的——不是“很难”,而是“根本不可能”。 ✅ 完全正确!而且这句…...

库早报|OPPO:无感折痕屏背后有两项3D打印技术;威拉里三期项目开工;五轴3D打印机TOP.E R1将亮相TCT亚洲展

2026年3月13日 星期五你在打印时错过了什么,快来看看吧!01OPPO:无感折痕屏离不开两项3D打印技术3月11日,OPPO举办Find N6无感折痕技术沟通会,公布了“无感折痕、久用平整”背后的技术细节。其中,新一代钛合…...

LabVIEW 双通道示波器:从源码到综合分析的奇妙之旅

labview 双通道示波器源码,电压及时间测量,频谱分析,在电子测量与信号分析的领域,LabVIEW 以其图形化编程的便捷性和强大功能,成为众多工程师和爱好者的得力工具。今天咱就来唠唠 LabVIEW 双通道示波器源码&#xff0c…...

高性价比多片锯公司

在木工加工行业,无论是实木开料、地板生产,还是托盘、龙骨制造,企业对核心设备——多片锯的需求始终围绕三个核心:高精度、高稳定、高效率。然而,市场常见痛点也异常突出:低端设备价格诱人但故障频发、损耗…...

Shopee买家账号注册与养号实战经验:跨境电商账号体系搭建思路

在跨境电商不断发展的今天,Shopee 已成为东南亚及多个新兴市场的重要电商平台。对于从事跨境业务的人来说,Shopee买家账号的注册与养护同样十分关键。一个稳定、安全的买家账号,不仅能保障日常使用的顺畅,也有助于长期的账号管理与…...

样件合格却被判“死刑”?复盘一次比亚迪SQE的现场审核,这六个字是关键

在制造业干久了,你会发现一个怪象:很多老板把“质量”挂在嘴边,却把“合规”扔在脑后。前两天去一家精密结构件厂调研,这场景又在我脑海里过了一遍。老赵做五金加工十几年,技术底子厚得很,甚至拿下了某国产…...

矿井工作面的数学游戏:用代码拆解气固耦合

煤与瓦斯气固耦合模型案列分析讲解假设你面前有一块煤,内部藏着蠢蠢欲动的瓦斯气体。当采煤机开始作业,煤体变形导致瓦斯压力变化,这种动态过程就像在玩一场物理引擎的即时战略游戏——气固耦合模型就是你的操作界面。今天我们用Python写个简…...

2026年AI写作工具深度评测:从效率提升到专业赋能的全面指南

在内容创作行业深耕五年,我见证了AI写作工具从概念到实用的全过程。如今,AI不再是遥不可及的技术概念,而是每个内容创作者的必备利器。本文将通过详实的分析和实测数据,带你深入了解主流AI写作工具的核心价值与应用场景。 一、AI…...

政企宽带所有终端网页打开慢(但能打开)的排查思路

(2026年最新实用版,按从快到慢、从内到外顺序,90%问题能在前3步解决) 因为是全公司终端都慢,基本排除单个电脑/手机问题,重点排查 DNS 公司网关/防火墙 运营商链路 三大主因。 政企宽带(电信…...

【程序员转行】AI会取代程序员?真相是:不会用大模型的才会被淘汰

“AI会不会抢走我的程序员工作?” 这大概是当下每一位技术人睡前都可能闪过的疑问。尤其是在技术迭代日新月异的IT圈,当你亲眼看到AI能自动生成规范代码、精准定位隐藏Bug、甚至辅助完成架构设计初稿时,难免会陷入深深的焦虑:自己…...