当前位置: 首页 > article >正文

migrate_disable_switch及cpus_ptr、user_cpus_ptr的相关细节

一、背景在之前的博客 cpu offline/online时线程的绑核属性设置的相关细节 里我们做了有关cpu绑核属性的一些相关实验针对的是cpu offline/online的切换的场景其实这个场景下进行分析比较好能帮助我们理解task_struct里的有关绑核属性的如cpus_ptr、user_cpus_ptr、cpus_mask这些数值的具体含义我们在第二章里针对之前博客里的实验结果做进一步细节阐述在第三章里我们针对另一个相关函数migrate_disable_switch进行分析。二、cpus_ptr、user_cpus_ptr、cpus_mask的相关细节我们先通过如下命令剔除掉堆栈调用链的打印只关注cpus_ptr、user_cpus_ptr、cpus_mask这几个变量的数值以及调用set_cpus_allowed_common时的入参ctx的ctx-flags的数值2.1 user_cpus_ptr记录着用户设置的绑核属性如上图可以看到user_cpus_ptr指向的数值在cpu从online变offline再从offline变online整个期间都保持不变所以它是记录着实际用户设置的绑核属性但是要注意1用户设置的绑核属性会因为cpu的offline的情况而不能真正应用到任务的绑核属性里去2一旦cpu的offline事件导致任务的没有可选用的核的话会触发select_fallback_rq的例程user_cpus_ptr会被设为NULL有关这个实验及原理见下面 2.2 一节2.2 user_cpus_ptr在cpu offline后没有可选核时的变化及调用栈复现还是比较方便的就是如下图先设置任务的绑核属性到cpu1上然后把cpu1下线查看内核日志。如下图红色框出的部分可以看到user_cpus_ptr在cpu1下线的时候user_cpus_ptr由有值的情况变成NULL另外可以看到before after为一组进行了三组也就是在cpu1下线时调用了三次set_cpus_allowed_common函数。我们一次次地来进行分析相关的调用栈。第一次如上图是在调用__balance_push_cpu_stop时如下图调用了select_fallback_rq函数而__balance_push_cpu_stop则是之前的博客 balance_callbacks及cpu offline的相关细节 里介绍balance_push里的一个关键步骤回到select_fallback_rq的函数看对应源代码select_fallback_rqcpuset_cpus_allowed_fallback—————if (cpuset_cpus_allowed_fallback(p)) {可以和堆栈对上的这次设置是如下图在cpuset_cpus_allowed_fallback里调用do_set_cpus_allowed标记上了SCA_USER的flags然后要设置的user_mask为NULL这样最终调用到set_cpus_allowed_common的时候如下图就将user_cpus_ptr交换成了NULL第一次执行完之后如下图cpus_mask是空的这肯定是不行的来看第二次对应调用链select_fallback_rqdo_set_cpus_allowed(p, task_cpu_possible_mask(p));__do_set_cpus_allowed(p, ac);对应代码里select_fallback_rq的部分在执行了上图里的红色框出的逻辑之后cpus_mask变成了cpu_possible_mask这是包含还正在下线过程中的cpu的第三次的调用如下图可以看到就是触发了work去做cpu offline时的设置剔除offline cpu的绑核属性的逻辑第三次完成之后就是cpu_possible_mask剔除了offline的cpu的状态2.3 总结一下user_cpus_ptr在cpu offline后没有可选核的调用其实上面的 2.2 里分析的三次调用的前两次就是下图里的这个for循环依次看case cpuset然偶是case possible也就是先看cgroup的cpuset的范围是否可以选出来可以跑的cpu然后再去用possible的mask注意case cpuset的里头的逻辑的break只是跳出了switch的case还是要重新回到for循环去检查is_cpu_allowed是否p任务可以在dest_cpu上跑先从cgroup的cpuset作为mask的逻辑如下图下图里的is_in_v2_mode就是检查是否是cgroup v2三、migrate_disable_switch的相关细节在set_cpus_allowed_common的逻辑里有如下红色框出的逻辑这部分逻辑是和另外一个会在__schedule()里调用的migrate_disable_switch的逻辑相关的在__schedule()时如果发现需要切换任务也就是prev ! next那么就需要检查prev的任务是否处于migrate_disabled的状态在rt-linux里进入普通spinlock后如果被实时任务抢占就会变成migrate_disabled的状态当然migrate_disabled还有别的很多情况migrate_disabled的状态是一个还算比较常见的状态。在检查到任务是migrate_disabled的状态的话就要设置cpus_mask到当前任务所在的rq对应的cpus_mask上其实也就是这一个cpu的mask。3.1 rq的cpumask已经有了task_struct里的cpus_mask为什么还需要有rq的这个cpumask这是因为migrate_disabled的状态是一个临时状态而migrate_enable之后需要对cpumask进行恢复那么cpumask就是记录着之前的旧的cpu的mask状态。这也反映出一点就是task_struct的cpus_mask并不是真正的任务的即刻的绑核属性状态而任务当前实际的绑核属性状态是由cpus_ptr所指向也是为什么migrate_disable_switch的下图里的set_cpus_allowed_common函数里的红色框出的部分在设置完p-cpus_ptr后就可以直接返回了3.2 migrate_disable_switch下判断cpus_ptr是否指向cpus_mask正是因为上图里的红色框出的这个设置在migrate_disable_switch的下图逻辑在判断出如果cpus_ptr已经不等于p-cpus_mask的话就可以直接返回了因为已经设置过了如果不是该migrate_disable_switch导致的特殊设置cpus_ptr成rq的cpumask那么cpus_ptr一直会指向到cpus_mask的地址上3.3 migrate_disabled的任务会影响cpu offline要注意任务如果以migrate_disabled的状态一直没有得到调度那么该cpu是不能offline的用于检查rq上是否有该类型任务的函数是rq_has_pinned_tasks对应于migrate_disable里下图的nr_pinned的设置有关为什么会导致cpu无法offline在之前的博客 里的 3.1 一节里有介绍。3.4 migrate_enable的逻辑migrate_enable里会把cpus_mask重新通过__set_cpus_allowed_ptr设置到cpus_ptr上调用链migrate_enable__set_cpus_allowed_ptr(p, ac);__set_cpus_allowed_ptr_locked(p, ctx, rq, rf);__do_set_cpus_allowed(p, ctx);p-sched_class-set_cpus_allowed(p, ctx);.set_cpus_allowed set_cpus_allowed_common,p-cpus_ptr ctx-new_mask;

相关文章:

migrate_disable_switch及cpus_ptr、user_cpus_ptr的相关细节

一、背景 在之前的博客 cpu offline/online时线程的绑核属性设置的相关细节 里,我们做了有关cpu绑核属性的一些相关实验,针对的是cpu offline/online的切换的场景,其实这个场景下进行分析比较好能帮助我们理解task_struct里的有关绑核属性的…...

告别卡顿!手把手调试 Android 14 ShellTransitions 动画启动流程与常见问题

告别卡顿!手把手调试 Android 14 ShellTransitions 动画启动流程与常见问题 如果你正在开发系统 UI、Launcher 或需要定制窗口动画的 Android 应用,那么 ShellTransitions 动画的卡顿问题一定让你头疼过。Android 14 对窗口过渡动画进行了重大重构&#…...

OpenClaw硬件控制:Qwen3.5-9B通过串口操作物联网设备

OpenClaw硬件控制:Qwen3.5-9B通过串口操作物联网设备 1. 为什么选择OpenClaw控制物联网设备 去年我在搭建智能温室种植系统时,遇到了一个典型问题:市面上的物联网中台要么价格昂贵,要么灵活性不足。作为一个喜欢折腾的开发者&am…...

深入浅出Linux ftrace:从内核配置到实战分析(附debugfs挂载全流程)

深入浅出Linux ftrace:从内核配置到实战分析 在Linux系统开发与调试过程中,内核级追踪工具的重要性不言而喻。面对复杂的系统行为、性能瓶颈或难以复现的偶发问题,传统的日志和调试手段往往力不从心。ftrace作为Linux内核原生提供的轻量级追踪…...

AI编程CLI工具对比:模型、工具与工作流

在人工智能辅助编程的时代,命令行界面(CLI)工具正成为开发者提升效率的利器。它们将大模型的智能直接集成到终端工作流中,让编写代码、生成文档、解释命令变得前所未有的轻松。Claude Code、Codex、OpenCode和Gemini CLI是这一领域…...

Fortitude Biomedicines宣布针对治疗中轴型脊柱关节炎的疾病驱动T细胞信号通路的领先项目

• 任命Rahul Patel博士为临床开发高级副总裁,不仅强化领导团队,还将为加速领先项目的临床开发提供关键支持Fortitude Biomedicines, Inc.(以下简称“Fortitude”)是一家领先的生物制药公司,专注于开发免疫细胞靶向生物…...

Kotoba-Whisper日语优化模型在Faster-Whisper-GUI中的适配分析

Kotoba-Whisper日语优化模型在Faster-Whisper-GUI中的适配分析 【免费下载链接】faster-whisper-GUI faster_whisper GUI with PySide6 项目地址: https://gitcode.com/gh_mirrors/fa/faster-whisper-GUI 问题引入:日语语音识别的效率与兼容性挑战 在语音识…...

论文阅读:arxiv 2026 Agent Privilege Separation in OpenClaw: A Structural Defense Against Prompt Injectio

总目录 大模型安全研究论文整理 2026年版:https://blog.csdn.net/WhiffeYF/article/details/159047894 https://arxiv.org/abs/2603.13424 Agent Privilege Separation in OpenClaw: A Structural Defense Against Prompt Injection 该论文名为《Agent Privilege …...

Windows网络神器:5分钟掌握socat-windows终极指南,轻松搞定端口转发与数据流处理

Windows网络神器:5分钟掌握socat-windows终极指南,轻松搞定端口转发与数据流处理 【免费下载链接】socat-windows unofficial windows build of socat http://www.dest-unreach.org/socat/ 项目地址: https://gitcode.com/gh_mirrors/so/socat-windows…...

AI写论文秘籍!4款AI论文生成工具推荐,告别写论文的痛苦时刻!

你是否也在苦恼于期刊论文的撰写?面对海量的文献资料、繁琐的格式要求,以及不断的修改过程,让许多学术研究者感到效率低下,真的很困扰。不过别担心,下面推荐的四款AI论文写作工具可以帮助你轻松解决这些难题。从文献检…...

栈序列合法性验证:从原理到代码的深度解析

栈序列合法性验证:从原理到代码的深度解析📌问题定义:到底要验证什么?🧠核心原理:抓住出栈序列,就是解题关键📝分步推演:用例子看懂整个过程步骤1:验证出栈第…...

高采样率真的会带来更多噪声吗?深入解析ADC采样与噪声的关系

1. 揭开ADC采样率与噪声的迷思 "采样率越高噪声越大?"这个问题困扰过不少刚接触信号处理的工程师。我第一次用ADC芯片采集心电信号时也踩过这个坑——明明选了最高采样率1MHz,结果波形上全是毛刺,还不如隔壁同事用100kHz采的干净。…...

蚂蚁集团Linux驱动工程师面试经验与NPU开发解析

1. 蚂蚁集团Linux驱动工程师社招面经全解析作为一名在Linux驱动开发领域摸爬滚打多年的工程师,我最近参加了蚂蚁集团的社招面试。整个面试过程持续了近两小时,面试官主要围绕NPU/AI芯片相关的驱动开发经验展开深度考察。虽然最终因为业务匹配度问题未能如…...

Ubuntu部署mosquitto:从零构建高可用MQTT消息中台

1. 为什么选择mosquitto作为MQTT消息中台 MQTT协议已经成为物联网设备通信的事实标准,而mosquitto作为最轻量级的开源MQTT broker之一,特别适合作为企业级消息中台的核心组件。我最早接触mosquitto是在一个智能农业项目中,当时需要连接200多个…...

SolidWorks 扫掠实战:从零构建带倒角的方形螺旋管

1. 从零开始理解方形螺旋管建模 第一次用SolidWorks做方形螺旋管时,我盯着屏幕发呆了半小时——明明圆形螺旋管点几下就能搞定,换成方形截面怎么就报错连连?后来才发现,这种带倒角的异形螺旋管建模,关键不在于操作步骤…...

uv下载软件包

需要在项目根目录执行uv add 包名 否则找不到项目的.venv,会下载到终端的conda环境uv add openai...

Python 爬虫实战:从入门到精通,爬取某站数据

前言 在大数据时代,数据采集是数据分析、人工智能、商业决策的基础环节。Python 凭借简洁的语法、丰富的第三方库,成为爬虫开发的首选语言。但对于大多数初学者而言,往往停留在静态网页爬取阶段,面对当下网站普遍存在的异步加载、…...

OpenClaw多任务队列:千问3.5-35B-A3B-FP8批量处理100+图片分析

OpenClaw多任务队列:千问3.5-35B-A3B-FP8批量处理100图片分析 1. 为什么需要批量图片处理方案 上周我接手了一个自媒体团队的素材整理需求——他们积压了300多张未分类的配图需要紧急处理。手动操作需要完成以下工作:按主题分类图片、提取图中的文字信…...

别光看手册了!手把手教你用STM32F103C6T6的37个IO口点亮第一个LED(附最小系统图)

从零玩转STM32F103C6T6:37个IO口的实战入门指南 当你第一次拿到这块邮票大小的STM32F103C6T6开发板时,可能会被密密麻麻的引脚和手册里晦涩的术语吓到。别担心,这篇文章就是要帮你跨过这个门槛——我们不会停留在理论层面,而是直接…...

ESPDateTime:面向ESP32/ESP8266的轻量级NTP时间同步库

1. 项目概述 ESPDateTime 是一款专为 ESP8266 和 ESP32 平台设计的轻量级日期时间管理库,其核心目标并非替代 POSIX time.h 的完整实现,而是解决嵌入式物联网设备在资源受限、无 RTC 硬件备份、网络连接不稳定等现实约束下, 可靠获取、同…...

从零到精通:Android系统下tcpdump抓包全攻略(含ROM编译指南)

从零到精通:Android系统下tcpdump抓包全攻略(含ROM编译指南) 在移动互联网时代,网络数据包分析已成为Android开发者必备的调试技能之一。无论是排查应用网络请求异常,还是分析第三方SDK的隐秘通信行为,tcpd…...

深度解析:软考高级科目中哪个最适合零基础考生?

1. 零基础考生如何选择软考高级科目 对于没有任何计算机背景的考生来说,选择软考高级科目确实是个令人头疼的问题。我见过太多零基础考生一开始就选错了方向,结果白白浪费了时间和精力。根据我这些年接触过的上百位考生的经验,**信息系统项目…...

读了50篇文献还是理不清脉络?百考通AI 5分钟生成有主线、有批判的文献综述

在高校学术写作中,文献综述是连接已有研究与创新探索的关键桥梁。它不仅体现作者对领域现状的掌握程度,更直接影响后续研究的深度与可行性。然而,对许多学生而言,撰写一篇专业、规范、有逻辑的综述常常令人望而却步——资料庞杂、…...

OpenClaw+Qwen3.5-9B避坑指南:5个典型配置错误修复

OpenClawQwen3.5-9B避坑指南:5个典型配置错误修复 1. 为什么需要这份避坑指南 上周我在本地部署OpenClaw对接Qwen3.5-9B模型时,连续踩了三个配置坑,导致整个周末都在和报错信息搏斗。最崩溃的是,有些错误提示非常隐晦——比如模…...

Windows下OpenClaw安装避坑:对接Qwen3-32B-Chat镜像详解

Windows下OpenClaw安装避坑:对接Qwen3-32B-Chat镜像详解 1. 为什么选择WindowsQwen3-32B-Chat组合 去年我在尝试自动化办公流程时,发现很多AI助手工具要么需要上传数据到云端,要么对硬件要求极高。直到遇到OpenClaw这个本地化AI智能体框架&…...

Arduino Portenta H7低功耗库深度解析:Sleep/Deep Sleep/Standby三模式实战

1. 项目概述Arduino Portenta H7 Low Power Library 是专为 Arduino Portenta H7 开发板设计的底层功耗管理库,其核心目标是为嵌入式开发者提供对 STM32H747XI 双核微控制器(Cortex-M7 Cortex-M4)全层级低功耗模式的细粒度控制能力。该库并非…...

新手也能搞定的应急响应实战:用知攻善防靶场复现近源渗透与挖矿事件

新手也能搞定的应急响应实战:用知攻善防靶场复现近源渗透与挖矿事件 网络安全应急响应是每个安全从业者的必修课,但对于刚入门的新手来说,面对真实的攻击事件往往无从下手。本文将带你通过知攻善防靶场,手把手复现"近源渗透O…...

SHTC3温湿度传感器Arduino底层驱动库详解

1. 项目概述Deneyap Sıcaklık Nem ler,即 Deneyap 温湿度传感器模块(型号 M01,MPV1.0),是一款面向土耳其教育与创客生态的嵌入式环境感知单元,其核心传感元件为 Sensirion 公司出品的 SHTC3 数字温湿度传…...

从雅可比矩阵到概率重塑:标准化流如何成为生成式模型的精确解?

1. 标准化流:生成式模型的精确解 想象你手里有一张白纸,上面画着一个标准圆形。现在你想把它变成一幅复杂的山水画,但又希望每一步修改都能精确追踪——这就是标准化流(Normalizing Flows)在概率分布世界做的事情。与其…...

告别环境冲突!VSCode里用IDF插件轻松管理多个ESP-IDF版本(5.3/4.4自由切换)

多版本ESP-IDF项目管理实战:VSCode高效工作流全解析 当你的工作台同时躺着基于ESP-IDF 5.3的智能家居网关和基于4.4版本的工业传感器项目时,每次切换都需要重新配置环境参数吗?作为经历过这种折磨的开发者,我想分享一套经过实战检…...