当前位置: 首页 > article >正文

【Linux】从硬件到软件了解进程

在这里插入图片描述
个人主页~


从硬件到软件了解进程

  • 一、冯诺依曼体系结构
  • 二、操作系统
  • 三、操作系统进程管理
    • 1、概念
    • 2、PCB和task_struct
    • 3、查看进程
    • 4、通过系统调用fork创建进程
      • (1)简述
      • (2)系统调用生成子进程的过程
        • 〇提出问题
        • ①fork函数
        • ②父子进程关系
        • ③解答问题

一、冯诺依曼体系结构

我们常见的嵌入式结构,包括哈佛结构冯诺依曼体系结构,我们所使用的计算机电脑就是冯诺依曼体系结构,下图就是该体系的直观图
在这里插入图片描述
在这里的存储器指的是内存,如果不考虑缓存的情况,这里的CPU能且只能对内存进行读写,不能访问输入输出设备,输入输出设备要输入输出数据也只能写入内存或者从内存中读取,就是说,虽然CPU是中央处理器,但对于冯诺依曼结构来说,内存才是中心的部件,所有数据必须先经过内存然后再流向别处

冯诺依曼体系结构是计算机设备得以普及的重大突破,我们知道计算机的存储速度如下图,寄存器是最快的存储也是最贵的,机械硬盘HDD是最慢的存储也是最便宜的,如果没有冯诺依曼结构,我们的计算机要不然就是便宜速度慢,要不就是昂贵速度快,冯诺依曼结构的原理是,在CPU进行计算的时候,内存已经接收外部输入设备输入的数据并存储,然后在CPU进行完计算后将结果取出,然后将结果放到输出设备,再把输入的数据交给CPU进行计算,这样,低速的输入输出设备、中速的内存以及高速的CPU有机整合,形成了现代计算机雏形

在这里插入图片描述

二、操作系统

任何计算机系统都包含一个基本的程序集合,它就被称为操作系统,我们前面说过,操作系统就是操作系统内核+命令行解释器(shell),设计操作系统的目的就是更好地与硬件交互管理软件资源,为应用程序提供一个良好的执行环境
在这里插入图片描述
如上图所示,我们可以清楚看到对于用户和系统软件部分的交互,我们是不能直接调用操作系统的,操作系统像一只小蜗牛,它缩在壳里伸出触角与你交流,除了触角以外,你是碰不到蜗牛的身体的,你只能碰到壳,这里的触角就是系统调用接口,而操作系统也有壳,除了调用系统调用接口,其他的方式都没法间接使用操作系统,因为系统调用在使用上操作比较基础,对用户的要求比较高,所以开发者就对部分系统调用进行适度封装,从而形成了库,有了库我们程序员就可以更好的进行开发软件,然后开发出来的软件再被普通人所使用

对于硬件部分和系统软件部分的交互,我们前面提到了,操作系统是做管理的,何为管理呢?对于程序员而言,管理通过计算机语言的表示方法就是数据结构,大家不妨想一想,我们平常生活所遇到的有关于管理的问题,是不是都可以转化为数据结构的方式来解决呢?我是一个学生,我来举一个有关于学生管理例子:一个学校有十个学院,每个学院有一位院长一百位学生,假设我们的学校就这么单调,没有其他类似辅导员这样的职位,校长是不直接管理我们的,校长吩咐院长来管理学生,院长就要亲力亲为,亲自来管理这些学生,学生的属性都是不同的,但是学生属性的类型都是相同的,他们都有名字、性别、年龄、家庭住址,把学生这个群体定义成一个struct结构体,然后不同的学生填不同的数值,然后按照学号前后以单链表的方式连接起来,这样就把每个学院学生连接起来了,对学生的管理就是对链表的增删查改,校长想要对某个学生进行管理就可以通过院长执行,这里的校长就是操作系统,院长就是驱动程序,而学生就是硬件资源,一个事件可以拆分为决策+执行,操作系统负责决策,驱动程序负责执行,我们刚才的例子对于学生也就是硬件资源就是一个先描述再组织的过程,先将个体描述出来,再将个体组织起来

三、操作系统进程管理

1、概念

进程是正在执行的程序的实例,是操作系统进行资源分配和调度的基本单位,它包含了程序计数器、寄存器、内存空间、打开的文件描述符等运行上下文信息,这些信息共同构成了进程执行的环境

进程是正在执行的程序的实例,程序本身只是存储在磁盘等介质上的一组指令和数据的集合,是静态的,只有当程序被加载到内存中,并由操作系统为其分配资源、创建相应的数据结构来管理其执行时,它才成为一个进程,即变成了一个动态的执行实体

进程是操作系统进行资源分配的基本单位,操作系统需要为每个进程分配独立的资源,包括但不限于内存空间、CPU 时间、文件描述符、网络端口等,每个进程都有自己独立的地址空间,进程在自己的地址空间内可以自由地访问和操作数据,而不会干扰其他进程的地址空间

进程包含了程序执行时的运行上下文信息,运行上下文是指进程在执行过程中所涉及的各种状态和数据,主要包括程序计数器、寄存器状态、堆栈信息、内存管理信息等,程序计数器指示了进程下一条要执行的指令地址,寄存器用于临时存储数据和指令操作数等,堆栈用于保存函数调用的相关信息和局部变量等,这些运行上下文信息完整地描述了进程当前的执行状态,当进程被调度暂停或恢复执行时,操作系统需要保存和恢复这些上下文信息,以确保进程能够正确地继续执行

进程是构成操作系统中并发执行环境的基本单元,操作系统通过管理和调度多个进程,实现了多个任务的并发执行,从而提高了系统资源的利用率和系统的整体性能,多个进程之间可以通过各种进程间通信机制进行数据交换和协作,共同完成复杂的系统任务

下图是我们Windows中的进程
在这里插入图片描述
进程粗略来讲就是内核PCB数据结构对象+你自己的代码和数据
记住上面所说的先描述后组织,通过结构体描述进程的属性,然后通过链表组织多个进程

2、PCB和task_struct

进程的所有信息被存放在一个叫做进程控制块的数据结构中,它是进程属性的集合,被称为PCB

Linux操作系统下的PCB就是task_struct,它是一个结构体,被装载到RAM里

以下是task_struct的内容分类,除了这些,还有一些其他信息

内容意义
标示符每个进程的标识符不同
状态任务状态
优先级相对于其他进程的优先级
程序计数器程序中即将被执行的下一条指令的地址
内存指针包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据进程执行时处理器的寄存器中的数据
IO状态显示的IO请求,分配给进程的IO设备和被进程使用的文件列表
记账信息处理器时间总和或使用的时钟数总和或时间限制、记账号等

所有运行在系统里的进程都以task_struct(双向)链表的形式存在内核里

3、查看进程

写一个死循环的程序,方便我们查看进程

在这里插入图片描述
在这里插入图片描述

ps aux | grep process | grep -v grep 查看进程指令

ps aux 会列出系统中所有用户的所有进程的详细信息,grep process 会在 ps aux 输出的所有行中查找包含 process 的行,并将这些行输出,grep 是要排除的模式,由于在执行 grep process 时,这个 grep 命令本身也会作为一个进程被 ps aux 列出,并且会匹配 process,为了避免将 grep process 这个进程本身显示出来,我们使用 grep -v grep 来过滤掉包含 grep 的行

在程序执行过程中会生成一个进程,我们通过查看进程指令,其中第二列就是进程唯一标识PID
在这里插入图片描述

进程重启对应的PID会发生变化,是由于内存重新给它分配的原因
在这里插入图片描述

这里解答一下为什么我们在进行./process的时候会启动可执行文件process:在进程中有一个目录叫做cwd,意味着当前的工作目录,你可以把它想象为一个指针(其实它是一个软链接),指向这个文件所在的目录,所以一个进程在属性中就有一个是当前的工作目录
亦可以看到exe这里指向的是这里的我们正在执行的可执行程序process
在这里插入图片描述

4、通过系统调用fork创建进程

(1)简述

上面的进程是在执行可执行程序的时候程序自动构建的进程,这节我们要通过系统调用fork创建进程

写一个fork创建进程的程序如下test.c,在我们现有的知识体系里,在fork函数自身不出现问题的情况下给到的id值是大于等于0的值,属于双分支结构,即id值要不然就等于0要不然就大于0,不会出现即等于0又大于0的情况,本身两种情况同时出现就是错误的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
看到结果,两个分支的程序都会执行,就是因为fork这里的原因,生成了子进程,改变了我们对该程序固有的看法,现在我们来研究fork是如何做到的

(2)系统调用生成子进程的过程

〇提出问题

该过程我们可以简化为一个问题:为什么id在等于0的同时又大于0?
id值是从fork函数来的,那么进一步提出问题:fork为什么能产生两个返回值? id为什么能承载两个返回值?

最终我们将目光移动到fork函数身上

①fork函数

fork系统调用用于从一个现有的进程创建一个新的进程,新创建的进程被称为子进程,而原来的进程被称为父进程,子进程是父进程的一个副本,它几乎继承了父进程的所有资源,包括代码段、数据段、堆、栈等,但拥有自己独立的进程控制块(PCB)和进程 ID(PID)

在父进程中,fork返回子进程的 PID,因为父进程可能需要对多个子进程进行管理和控制,所以通过返回的 PID 来标识每个子进程
在子进程中,fork返回 0,这是因为子进程不需要知道父进程的 PID 来进行后续操作,它可以通过getppid函数来获取父进程的 PID
如果fork调用失败,将返回 - 1,并设置errno变量来表示错误原因

②父子进程关系

进程可以粗略表示为代码+数据
当父进程调用fork时,内核会为子进程分配新的 PCB,并复制父进程的大部分资源到子进程中,这包括进程的代码部分
虽然子进程最初复制了父进程的地址空间,但在实际运行中,父子进程的地址空间是相互独立的,如果其中一个进程修改了某些数据,不会影响到另一个进程中的相应区域,这是通过写时复制技术来实现的,即只有当进程试图修改某个数据时,才会真正复制该数据,以节省内存资源,就是说在不修改某些数据的情况下它们指向的是同一块位置,如果子进程或者父进程某些数据要修改,它们会重新开辟一块空间存放该进程的特有数据
fork调用完成后,父进程和子进程就开始并发执行,它们可以各自独立地执行不同的代码路径,也可以通过各种进程间通信机制进行通信和同步,这里就是从fork函数出现之后的代码我们可以把它当做两份,两份代码同时跑,但是id不同,后面执行的效果可能就不同

并且我们可以发现上面的截图父子进程谁先运行是不确定的,这个是由调度器决定的

③解答问题

问:id为什么能承载两个返回值?
答:id变量并不是同时承载两个返回值,而是在不同的执行流(父进程和子进程)中被赋予不同的值,fork函数通过这种方式让父进程和子进程能够区分彼此,并根据返回值执行不同的操作

问:fork为什么能产生两个返回值?
答:父子进程并发执行,每个执行流从fork函数的返回处继续执行,并且根据自身的角色(父进程或子进程)返回不同的值,这样就实现了一个函数调用在两个进程中产生不同返回结果的效果


今日分享就到这里了~
在这里插入图片描述

相关文章:

【Linux】从硬件到软件了解进程

个人主页~ 从硬件到软件了解进程 一、冯诺依曼体系结构二、操作系统三、操作系统进程管理1、概念2、PCB和task_struct3、查看进程4、通过系统调用fork创建进程(1)简述(2)系统调用生成子进程的过程〇提出问题①fork函数②父子进程关…...

2024-我的学习成长之路

因为热爱,无畏山海...

机试题——到邻国目标城市的最短距离

题目描述 A国与B国是相邻的两个国家,每个国家都有很多城市。国家内部有很多连接城市的公路,国家之间也有很多跨国公路,连接两个国家的边界城市。两个国家一共有N个城市,编号从1到N,一共有M条公路,包括国内…...

连续预测、

一、连续预测 调用模型遍历需要预测文件夹中的图片: image_ids open(‘VOCdevkit/VOC2007/ImageSets/Main/test.txt’).read().strip().split() for image_id in tqdm(image_ids): # 遍历测试图像 image_path “./VOCdevkit/VOC2007/JPEGImages/” image_id …...

Kamailio 不通过 dmq 实现注册复制功能

春节期间找到一篇文章,需要 fg 才能看到: https://medium.com/tumalevich/kamailio-registration-replication-without-dmq-65e225f9a8a7 kamailio1 192.168.56.115 kamailio2 192.168.56.116 kamailio3 192.168.56.117 route[HANDLE_REPLICATION] {i…...

002 mapper代理开发方式-xml方式

文章目录 代理xml方式UserMapper.javaUser.javadb.propertiesSqlMapConfig.xmlUserMapper.xmlUserMapperTest.javapom.xml 代理 此处使用的是JDK的动态代理方式,延迟加载使用的cglib动态代理方式 代理分为静态代理和动态代理。此处先不说静态代理,因为…...

大模型系列21-AI聊天机器人

聊天机器人 背景机器学习基础监督学习(Supervised Learning)概念应用场景主要问题 无监督学习(Unsupervised Learning)概念常见方法应用场景 强化学习(Reinforcement Learning)概念关键要素应用场景 模型优…...

Apache Iceberg数据湖技术在海量实时数据处理、实时特征工程和模型训练的应用技术方案和具体实施步骤及代码

Apache Iceberg在处理海量实时数据、支持实时特征工程和模型训练方面的强大能力。Iceberg支持实时特征工程和模型训练,特别适用于需要处理海量实时数据的机器学习工作流。 Iceberg作为数据湖,以支持其机器学习平台中的特征存储。Iceberg的分层结构、快照…...

25.2.3 【洛谷】作为栈的复习不错(学习记录)

今天学习的东西不算多,放了一个星期假,感觉不少东西都没那么清楚,得复习一下才行。今天搞个栈题写,把栈复习一下,明天进入正轨,边复习边学习新东西,应该会有二叉树的学习等等... 【洛谷】P1449 …...

Windows 中的 WSL:开启你的 Linux 之旅

今天在安装windows上安装Docker Desktop的时候,遇到了WSL。下面咱们就学习下。 欢迎来到涛涛聊AI 一、什么是 WSL? WSL,全称为 Windows Subsystem for Linux,是微软为 Windows 系统开发的一个兼容层,它允许用户在 Win…...

二维前缀和:高效求解矩阵区域和问题

在处理二维矩阵时,频繁计算某一子矩阵的和是一个常见的操作。传统的做法是直接遍历该子矩阵,时间复杂度较高。当矩阵非常大且有大量的查询时,直接计算将变得低效。为了提高效率,我们可以通过 二维前缀和 技巧在常数时间内解决这个…...

音视频入门基础:RTP专题(5)——FFmpeg源码中,解析SDP的实现

一、引言 FFmpeg源码中通过ff_sdp_parse函数解析SDP。该函数定义在libavformat/rtsp.c中: int ff_sdp_parse(AVFormatContext *s, const char *content) {const char *p;int letter, i;char buf[SDP_MAX_SIZE], *q;SDPParseState sdp_parse_state { { 0 } }, *s1…...

Android开发工作经历整理

一.无人机应用软件开发 集成大疆官网的DJIMobileSDK到AS中编写软件,操控无人机执行多个航点任务。集成OpenCV库进行图像识别,通过获取参数,根据算法执行sdk,使无人机降落到机库,并执行后续的换电操作。待无人机就绪后…...

C++中常用的十大排序方法之4——希尔排序

成长路上不孤单😊😊😊😊😊😊 【😊///计算机爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C中常用的排序方法之4——希尔排序的相…...

解决注入线程池的栈溢出问题

文章目录 1.问题产生2.问题解决 1.问题产生 在使用sleuth的时候,需要注入线程池,他才会自动包装,实现traceId的传递,但是突然启动时出现了栈溢出的问题 2.问题解决 根据报错,发现是Gson序列化相关的问题&#xff0c…...

自动驾驶---两轮自行车的自主导航

1 背景 无人驾驶汽车最早出现在DARPA的比赛中,从那个时刻开始,逐渐引起全球学者的注意,于是从上个世纪开始各大高校院所开始了无人汽车的研发。直到这两年,无人驾驶汽车才开始走进寻常百姓家,虽然目前市面上的乘用车还…...

哈夫曼树并查集

(1)哈夫曼树 特殊概念: 1.结点的权:表示结点树的重要性 2.带权路径长度:从树的根到该节点的路径长度(经过的边数)与该节点上权值的乘积 2.树的带权路径长度:该树的所有叶子节点的…...

PyTorch数据建模

回归分析 import torch import numpy as np import pandas as pd from torch.utils.data import DataLoader,TensorDataset import time strat = time.perf_counter()...

在 Ubuntu 上安装 Node.js 23.x

在 Ubuntu 上安装 Node.js 23.x 前提条件安装步骤1. 下载设置脚本2. 运行设置脚本3. 安装 Node.js4. 验证安装 参考链接总结 在现代 web 开发中,Node.js 是一个不可或缺的工具。它提供了一个强大的 JavaScript 运行时环境,使得开发人员可以在服务器端使用…...

SQL范式与反范式_优化数据库性能

1. 引言 什么是SQL范式 SQL范式是指数据库设计中的一系列规则和标准,旨在减少数据冗余、提高数据完整性和一致性。常见的范式包括第一范式(1NF)、第二范式(2NF)、第三范式(3NF)和BCNF(Boyce-Codd范式)。 什么是SQL反范式 SQL反范式是指在满足范式要求的基础上,有…...

hunyuan 混元学习

使用了5个subset,也是用了text-image和text-video进行训练的 也是进行了复杂的视频选择。同movie gen. 也进行了模型切断,用拉普拉斯算子找到最清晰的一帧作为训练的起始 训练了不同的模型去选择数据,比如用Dover去选择美观度比较好的数据&#xff0c…...

四、GPIO中断实现按键功能

4.1 GPIO简介 输入输出(I/O)是一个非常重要的概念。I/O泛指所有类型的输入输出端口,包括单向的端口如逻辑门电路的输入输出管脚和双向的GPIO端口。而GPIO(General-Purpose Input/Output)则是一个常见的术语&#xff0c…...

.Net / C# 繁体中文 与 简体中文 互相转换, 支持地方特色词汇

版本号 Nuget 搜索 “OpenCCNET”, 注意别找错, 好多库的名字都差不多 支持 “繁,简” 的互相转换, 支持多个地区常用词汇的转换, 还支持 日文的新旧转换. OpenCC 在 .Net 中的实现 https://github.com/CosineG/OpenCC.NET <PackageReference Include"OpenCCNET"…...

一元函数微积分的几何应用:二维平面光滑曲线的曲率公式

文章目录 前言曲率和曲率半径的定义曲率计算公式参数方程形式直角坐标显式方程形式极坐标形式向量形式 前言 本文将介绍二维平面光滑曲线的曲率定义以及不同形式的曲率及曲率半径公式的推导。 曲率和曲率半径的定义 &#xff08;关于二维平面光滑曲线的定义以及弧长公式请参…...

数据结构与算法之异步: LeetCode 1114. 按序打印 (Ts版)

按序打印 https://leetcode.cn/problems/print-in-order/description/ 描述 给你一个类&#xff1a; public class Foo {public void first() { print("first"); }public void second() { print("second"); }public void third() { print("third&qu…...

python:求解爱因斯坦场方程

在物理学中&#xff0c;爱因斯坦的广义相对论&#xff08;General Relativity&#xff09;是描述引力如何作用于时空的理论。广义相对论由爱因斯坦在1915年提出&#xff0c;并被阿尔伯特爱因斯坦、纳森罗森和纳尔逊曼德尔斯塔姆共同发展。广义相对论的核心方程是爱因斯坦场方程…...

PostgreSQL 数据备份与恢复:掌握 pg_dump 和 pg_restore 的最佳实践

title: PostgreSQL 数据备份与恢复:掌握 pg_dump 和 pg_restore 的最佳实践 date: 2025/1/28 updated: 2025/1/28 author: cmdragon excerpt: 在数据库管理中,备份与恢复是确保数据安全和业务连续性的关键措施。PostgreSQL 提供了一系列工具,以便于数据库管理员对数据进行…...

位运算的概念

文章目录 整数在计算机中的表示二进制表示有符号类型和无符号类型机器数和真值原码、反码和补码原码、反码和补码的表示方法计算机中的表示 位运算与、或、异或和取反移位运算移位运算与乘除法的关系位运算的性质 目录 整数在计算机中的表示 二进制表示 程序中的所有数在计算…...

自主Shell命令行解释器

什么是命令行 我们一直使用的"ls","cd","pwd","mkdir"等命令&#xff0c;都是在命令行上输入的&#xff0c;我们之前对于命令行的理解&#xff1a; 命令行是干啥的&#xff1f;是为我们做命令行解释的。 命令行这个东西实际上是我们…...

Vue.js 的介绍与组件开发初步

Vue.js 的介绍与组件开发初步 Vue.js 的介绍与组件开发初步引言第一部分&#xff1a;Vue.js 基础入门1.1 什么是 Vue.js&#xff1f;1.2 搭建 Vue.js 开发环境安装 Node.js 和 npm安装 Vue CLI创建新项目运行示例 1.3 第一个 Vue.js 示例 第二部分&#xff1a;Vue.js 组件开发基…...