当前位置: 首页 > article >正文

Docker的进程和Cgroup概念

Docker的进程和Cgroup概念

  • 容器里的进程组织或关系
    • 0号进程:containerd-shim
    • 1号进程:容器内的第一个进程
    • 进程收到信号后的三种反应
    • 两个特权信号
    • 在容器内执行 kill 命令的行为
  • Cgroup 介绍
    • CPU Cgroup 中与 CFS 相关的参数
    • Kubernetes 中的资源管理
    • memory cgroup
  • 容器的可用磁盘进行配额

容器里的进程组织或关系

0号进程:containerd-shim

角色:

  • containerd-shim 是容器的父进程,负责管理容器的生命周期,接收容器内的执行的指令。
  • 它通过调用 runc 创建容器,并处理容器内的指令。

特点:

  1. 容器依赖:
    • containerd-shim 是容器的祖宗进程,如果它挂掉,整个容器也会退出。
  2. 进程管理:
    • 如果容器的1号进程结束,containerd-shim 会回收容器命名空间中的所有进程。
    • 如果1号进程未结束,但其子进程结束,子进程会成为僵尸进程,需要由1号进程回收。
  3. 信号处理:
    • docker stop 会向容器的1号进程发送 SIGTERM(-15)信号。
      • 如果1号进程没有信号转发能力,它会向容器内的所有进程发送 SIGKILL(-9)信号。
      • 如果1号进程有信号转发能力,它会向容器内的所有进程转发 SIGTERM(-15) 信号。

1号进程:容器内的第一个进程

角色:

  • 1号进程是容器内的第一个进程,代表容器的生命周期。
  • 它通常是用户指定的应用程序进程。

特点:

  1. 生命周期:
    • 1号进程结束,容器也会结束。
    • 1号进程必须在前台运行,否则容器会退出。
  2. 功能缺陷(与操作系统进程的区别):
    • 容器内的1号进程不一定是所有用户进程的祖先。
    • 如果1号进程成为孤儿进程,它会被init进程(0号进程)收养。
    • 用户开发的1号进程可能缺乏回收僵尸进程和转发信号的能力。

应具备的能力:

  • 回收僵尸进程::定期调用 wait 或 waitpid 回收僵尸子进程。
  • 信号转发:将接收到的信号(如 SIGTERM)转发给子进程。
~# docker container inspect text | grep -i pid
pid:41404---------对应的就是容器内的1号进程~# ps -elf | grep 41404
pid:41404 ppid:41382---------对应的就是容器内的0号进程

进程收到信号后的三种反应

信号是操作系统向进程发送的一种通知,用于通知进程发生了某种事件。可以用于进程间通信或控制进程行为。

  1. 忽略(Ignore):
    • 进程对信号不做任何处理。
    • 示例:忽略 SIGTERM 信号,进程不会被终止。
  2. 捕获(Catch):
    • 进程可以注册自定义的处理函数(handler)来处理捕获的信号。
    • 当信号到达时,触发 handler 执行。
    • 示例:trap 'echo "signal received"' SIGTERM
  3. 默认行为(Default):
    • 每个信号都有默认行为,由操作系统定义。
    • 示例:
      • SIGTERM 的默认行为是终止进程。
      • SIGKILL 的默认行为是强制终止进程。

两个特权信号

SIGKILL (-9)

  • 作用: 强制终止进程。
  • 特点:
    • 无法被忽略。
    • 无法被捕获。
  • 使用场景: 当进程无响应时,强制终止进程。

SIGSTOP (-19):

  • 作用: 暂停进程的运行
  • 特点:
    • 无法被忽略。
    • 无法被捕获。
  • 恢复运行: 发送 SIGCONT (-18) 信号。

SIGTERM(-15)信号是可以被进程忽略或者捕获的

在容器内执行 kill 命令的行为

kill -9 1

  • 无法杀死容器内的1号进程。
  • 原因: 容器内的1号进程被打上了 SIGNAL_UNKILLABLE 标签。

kill -19 1

  • 无法暂停容器内的1号进程。
  • 原因: 容器内的1号进程被打上了 SIGNAL_UNKILLABLE 标签。

kill -15 1

  • 有可能杀死容器内的1号进程。
  • 如果1号进程没有注册 SIGTERM 信号的处理函数,它会忽略该信号。
  • 如果1号进程注册了 SIGTERM 信号的处理函数,它会执行该函数。

Cgroup 介绍

Cgroup(Control Group)是 Linux 内核提供的一种机制,用于限制、控制和监控进程组的资源使用。它允许系统管理员对一组进程的资源使用进行精细化管理,包括 CPU、内存、磁盘 I/O 等。Cgroup 是容器技术(如 Docker、Kubernetes)中实现资源隔离和管理的基础。

为何要用 Cgroup?Cgroup 的主要作用是限制容器或进程组对宿主机资源的使用,防止某个容器或进程过度占用资源,从而影响其他容器或进程的正常运行。通过 Cgroup,可以确保宿主机上的多个容器或进程能够公平、稳定地共享系统资源。

在 Linux 系统中,可以通过以下命令查看和管理 Cgroup

# 查看当前的 Cgroup 控制层级
cat /proc/cgroups# 创建一个新的 Cgroup
mkdir /sys/fs/cgroup/cpu/my_cgroup# 将一个进程加入到 Cgroup 中
echo "PID" > /sys/fs/cgroup/cpu/my_cgroup/tasks# 设置 CPU 限制
echo "2" > /sys/fs/cgroup/cpu/my_cgroup/cpu.cfs_quota_us

CPU Cgroup 中与 CFS 相关的参数

CFS(Completely Fair Scheduler)是 Linux 内核中的一种调度算法,用于公平地分配 CPU 时间给各个进程。Cgroup 中与 CFS 相关的参数决定了进程组对 CPU 的使用率。

  1. cpu.cfs_period_us:表示 CPU 的时间周期,单位为微秒 (μs)。例如,设置为 100ms (100,000 μs),表示一个周期为 100 毫秒。
  2. cpu.cfs_quota_us:表示在该时间周期内,控制组内的进程最多可以使用的 CPU 时间。例如,设置为 50ms (50,000 μs),表示在 100ms 的周期内,进程最多可以使用 50ms 的 CPU 时间。此时,CPU 使用率为 50ms / 100ms = 0.5,即 50%。
  3. cpu.shares:用于控制同一层级下的多个控制组之间的 CPU 资源分配。当宿主机上的 CPU 资源不足时,cpu.shares 会生效,决定各个控制组之间的 CPU 资源分配比例。cpu.shares 的值越大,分配的 CPU 资源越多。

总结:

  • cpu.cfs_quota_us与cpu.cfs_period_us这两个值决定了每个控制组所有进程可使用cpu资源的最大值
  • cpu.shares这个值决定了cpu cgroup子系统下控制组可用cpu的相对比例,不过只有当系统上cpu被占满时,这个比例才会在各个控制组间起作用

Kubernetes 中的资源管理

在 Kubernetes 中,Pod 的资源请求和限制可以通过 requests 和 limits 来设置。

  1. requests:表示 Pod 对资源的最低需求。Kubernetes 会根据 requests 来调度 Pod,确保节点上有足够的资源。requests 对应 Cgroup 中的 cpu.shares,表示初始的 CPU 资源申请量。实际使用量可以超过 requests,但不会低于它。
  2. limits:表示 Pod 对资源使用的上限。Kubernetes 会通过 Cgroup 限制 Pod 的资源使用,确保不会超过 limits 设置的值。limits 对应 Cgroup 中的 cpu.cfs_quota_us 和 cpu.cfs_period_us,表示 CPU 使用的硬性上限。

但是要注意,limits 设置的上限是否能达到,还取决于宿主机的实际资源情况。如果宿主机资源不足,Pod 可能无法达到 limits 设置的上限。

memory cgroup

每个容器都有对应的 memory cgroup 控制组,位于 /sys/fs/cgroup/memory/system.slice/docker - xxx,用于管理容器内存。

主要参数:

  • memory.limit_in_bytes:设置容器内所有进程可占用的物理内存上限,子 group 最多只能设置到父级 group 的该值。
  • memory.oom_control:默认为 0,表示开启 OOM 机制;可设为 1 关闭,通过 echo 1 > memory.oom_control 实现。
  • memory.usage_in_bytes:只读参数,显示容器内所有进程占用的物理内存总量。

示例: 容器启动时,rss 为 100 M,page cache 为 899 M,内存总使用量为 999 M;随着进程运行,申请更多内存后,rss 增至 200 M,page cache 减至 699 M,内存总使用量仍为 899 M,但实际进程占用的物理内存增大。

容器的可用磁盘进行配额

默认情况,容器内的可用磁盘空间是没有限制的。

容器内的文件系统 = lowerdir + upperdir

写入操作

  • 在容器内写容器文件系统里写东西(任何目录都没有挂载任何外部存储卷)
    • 那此时写入的数据,都写到了upperdir层,也就是写到的宿主机上。
    • 所以如果不加以限制,很有可能会导致宿主机磁盘空间写满。

如何解决问题?有两种方式:

  • 对容器的可用磁盘进行配额
  • 对容器写操作的目录,应该挂载一个专门的外部存储卷(推荐)

相关文章:

Docker的进程和Cgroup概念

Docker的进程和Cgroup概念 容器里的进程组织或关系0号进程:containerd-shim1号进程:容器内的第一个进程进程收到信号后的三种反应两个特权信号在容器内执行 kill 命令的行为 Cgroup 介绍CPU Cgroup 中与 CFS 相关的参数Kubernetes 中的资源管理memory cg…...

Day68:类的多态

在面向对象编程(OOP)中,多态(Polymorphism)是指不同类的对象对同一消息作出响应的能力。换句话说,多态允许不同类的对象使用相同的方法名,但实现不同的行为。多态是通过继承和方法重写来实现的,通常可以分为方法重写和接口重载。 在 Python 中,多态常常通过方法重写来…...

一种解决SoC总线功能验证完备性的技术

1. 前言 通过总线将各个IP通过总线连接起来的SoC芯片是未来的大趋势,也是缩短芯片开发周期,抢先进入市场的常用方法。如何确保各个IP是否正确连接到总线上,而且各IP的地址空间分配是否正确,是一件很棘手的事情。本文提出了一种新…...

【Linux系统】线程:线程库 / 线程栈 / 线程库源码阅读学习

一、线程库 1、线程库介绍:命名与设计 命名:线程库通常根据其实现目的和平台特性进行命名。例如,POSIX标准定义了Pthreads(POSIX Threads),这是一个广泛使用的线程库规范,适用于多种操作系统。此…...

深度剖析 Redis:缓存穿透、击穿与雪崩问题及实战解决方案

一、缓存基本使用逻辑 在应用程序中,为了提高数据访问效率,常常会使用缓存。一般的缓存使用逻辑是:根据 key 去 Redis 查询是否有数据,如果命中就直接返回缓存中的数据;如果缓存不存在,则查询数据库&#…...

如何使用el-table的多选框

对el-table再次封装,使得功能更加强大! 本人在使用el-table时,因为用到分页,导致上一页勾选的数据在再次返回时,没有选中,故在原有el-table组件的基础之上再次进行了封装。 1.首先让某些不需要勾选的列表进…...

【工具变量】上市公司企业渐进式创新程度及渐进式创新锁定数据(1991-2023年)

测算方式: 参考顶刊《经济研究》孙雅慧(2024)老师的做法,用当期创新和往期创新的内容重叠度作为衡量渐进式创新程度的合理指标。通过搜集海量专利摘要,测算当前专利申请和既有专利的内容相似度,反映企业在…...

LM Studio 部署本地大语言模型

一、下载安装 1.搜索:lm studio LM Studio - Discover, download, and run local LLMs 2.下载 3.安装 4.更改成中文 二、下载模型(软件内下载) 1.选择使用代理,否则无法下载 2.更改模型下载目录 默认下载位置 C:\Users\用户名\.lmstudio\models 3.搜…...

嵌入式工程师面试经验分享与案例解析

嵌入式工程师岗位受到众多求职者的关注。面试流程严格,技术要求全面,涵盖C/C编程、数据结构与算法、操作系统、嵌入式系统开发、硬件驱动等多个方向。本文将结合真实案例,深入剖析嵌入式工程师的面试流程、常见问题及应对策略,帮助…...

英特尔至强服务器CPU销量创14年新低,AMD取得进展

过去几年是英特尔56年历史上最艰难的时期之一。该公司在晶圆代工、消费级处理器和服务器芯片等各个领域都面临困境。随着英特尔重组其晶圆代工业务,新的分析显示其服务器业务的现状和未来前景不容乐观。 英特尔最近发布的10-K文件显示:“数据中心和人工…...

判断您的Mac当前使用的是Zsh还是Bash:echo $SHELL、echo $0

要判断您的Mac当前使用的是Zsh还是Bash,可以使用以下方法: 查看默认Shell: 打开“终端”应用程序,然后输入以下命令: echo $SHELL这将显示当前默认使用的Shell。例如,如果输出是/bin/zsh,则说明您使用的是Z…...

使用Springboot实现MQTT通信

目录 一、MQ协议 MQTT 特点 MQTT 工作原理 MQTT 主要应用场景 MQTT 配置与注意事项 二、MQTT服务器搭建 三、参考案例 MQTT(Message Queuing Telemetry Transport)是一种基于发布/订阅模型的轻量级消息传输协议,常用于物联网&#xff…...

植物大战僵尸融合版(电脑/安卓)

《植物大战僵尸融合版》是一款由B站UP主“蓝飘飘fly”制作的同人策略塔防游戏,基于经典《植物大战僵尸》玩法,加入了独特的植物融合系统。 出于方便,软件是便携版,解压后双击即可畅玩。 游戏主页依旧是植物大战僵尸经典界面。右下…...

02DevOps基础环境准备

准备两台Linux的操作系统,最简单的方式就是在本机上使用虚拟机搭建两个操作系统(实际生产环境是两台服务器,虚拟机的方式用于学习使用) 我搭建的两台服务器的ip分别是192.168.1.10、192.168.1.11 192.168.1.10服务器用于安装doc…...

苍穹外卖-day12(工作台、数据导出)

工作台Apache POI导出运营数据Excel报表 功能实现:工作台、数据导出 工作台效果图: 数据导出效果图: 在数据统计页面点击数据导出:生成Excel报表 1. 工作台 1.1 需求分析和设计 1.1.1 产品原型 工作台是系统运营的数据看板&…...

说一下 Tcp 粘包是怎么产生的?

TCP 粘包是什么? TCP 粘包(TCP Packet Merging) 是指多个小的数据包在 TCP 传输过程中被合并在一起,接收方读取时无法正确分辨数据边界,导致数据解析错误。 TCP 是流式协议,没有数据包的概念,…...

详解享元模式

引言 在计算机中,内存是非常宝贵的资源,而程序中可能会有大量相似或相同的对象,它们的存在浪费了许多空间。而享元模式通过共享这些对象,从而解决这种问题的。 1.概念 享元模式(Flyweight Pattern):运用共享技术有效地…...

第18章 不可变对象设计模式(Java高并发编程详解:多线程与系统设计)

1.线程安全 所谓共享的资源,是指在多个线程同时对其进行访问的情况下,各线程都会使其发生变化,而线程安全性的主要目的就在于在受控的并发访问中防止数据发生变化。除了使用synchronized关键字同步对资源的写操作之外, 还可以在线…...

openEuler22.03LTS系统升级docker至26.1.4以支持启用ip6tables功能

本文记录了openEuler22.03LTS将docker升级由18.09.0升级至26.1.4的过程(当前docker最新版本为27.5.1,生产环境为保障稳定性,选择升级到上一个大版本26的最新小版本)。 一、现有环境 1、系统版本 [rootlocalhost opt]# cat /etc…...

< OS 有关 > Ubuntu 版本升级 实践 24.04 -> 24.10, 安装 .NET

原因: 想安装 .NET 9 去编译 GitHut 项目,这回用不熟悉的 Ubuntu来做,不知道怎么拐去给 Ubuntu 升级,看到现在版本是 24.10 但不是 LTS 版本,记录下升级过程。 一、实践过程: 1. 查看当前版本 命令1: l…...

某咨询大数据解决方案介绍(32页PPT)

本文档介绍了一个大数据平台解决方案,旨在解决企业当前面临的数据问题,包括数据定义缺失、重复采集和存储、数据不完整以及缺乏可靠决策依据等。通过引入大数据技术,该方案强调从被动的IT支撑向主动的数据核心服务转型,以实现科学…...

ZooKeeper作为注册中心有什么问题? ZooKeeper作为注册中心,海量服务同时重启有什么问题?

目录 ZooKeeper作为注册中心存在的问题 性能瓶颈 一致性保证 复杂性 扩展性 单点故障 数据模型限制 社区和生态 安全性 总结 ZooKeeper作为注册中心,海量服务同时重启有的问题 1. ZooKeeper集群压力剧增 2. ZooKeeper Leader节点压力 3. 会话和临时节点管理 4.…...

matlab simulink 汽车四分之一模型主动被动悬架-LQR

1、内容简介 略 matlab simulink 可以交流、咨询、答疑 124- 2、内容说明 略汽车悬架系统由弹性元件、导向元件和减振器组成,是车身与车轴之间连接的所有组合体零件的总称,也是车架(或承载式车身)与车桥(或车轮)之间一切力传递装置的总称,其主要功能是使车轮与地面有很好的…...

从零开始:OpenCV 图像处理快速入门教程

文章大纲 第1章 OpenCV 概述 1.1 OpenCV的模块与功能  1.2 OpenCV的发展 1.3 OpenCV的应用 第2章 基本数据类型 2.1 cv::Vec类 2.2 cv::Point类 2.3 cv::Rng类 2.4 cv::Size类 2.5 cv:&…...

基础相对薄弱怎么考研

复习总体规划 明确目标 选择专业和院校:根据你的兴趣、职业规划和自身实力,选择适合自己的专业和院校。可以参考往年的分数线、报录比、复试难度等。了解考试科目:不同专业考试科目不同,一般包括: 公共课&#xff1a…...

强化学习笔记6——异同策略、AC、等其他模型总结

异步两种方法:1:经验回放 2:数据动作非同时产生 举例QLearning为什么是异策略? 生成动作时e的概率从Q表选,1-e概况随机。 更新策略时,贪心策略选择Q_max作为动作。 策略优化两种主要方法:基于梯…...

Linux提权--passwd提权

passwd​ 命令用于更改用户密码。在 Linux 系统中,普通用户可以通过 passwd​ 更改自己的密码,但如果攻击者能够以某种方式执行 passwd​ 命令更改 root 用户的密码,他们就能获取 root 权限。 1.常见的 passwd 提权方法 SUID 设置&#xff1…...

一、本地部署安装 DeepSeek 并训练本地知识库,并调用对话框进行问答

本地部署安装 DeepSeek 1、硬件环境 操作系统:Windows10 内存:16G 显卡:NIVIDIA GeForce RTX 2060 6G 2、安装步骤 (1)安装 Ollama 访问Ollama 官网,点击 “Download for Windows” 下载安装程序。下载…...

海思的一站式集成环境Hispark Studio更新了

HiSpark Studio是海思提供的面向智能设备开发者提供一站式集成开发环境,支持代码编辑、编译、烧录和调试等功能。我以前在评测星闪芯片的时候用过,当时写了篇博客:【星闪开发连载】WS63E开发板Windows环境的构建_hispark studio-CSDN博客。那…...

从零开始构建强大 AI 对话系统:ollama + deepseek + open-webui 完整部署教程(Docker 版)

文章目录 前言一、工具简介二、前期准备三、部署步骤1. 安装并配置 ollama2. 部署 open-webui 四、调试与验证五、Docker Compose 简化部署六、注意事项与常见问题1. ollama run 500 报错2. 硬件配置对性能的影响3. **ollama** 启动与 **open-webui** 调用速度差异4. 内存不足导…...