当前位置: 首页 > news >正文

【Linux】从硬件到软件了解进程

在这里插入图片描述
个人主页~


从硬件到软件了解进程

  • 一、冯诺依曼体系结构
  • 二、操作系统
  • 三、操作系统进程管理
    • 1、概念
    • 2、PCB和task_struct
    • 3、查看进程
    • 4、通过系统调用fork创建进程
      • (1)简述
      • (2)系统调用生成子进程的过程
        • 〇提出问题
        • ①fork函数
        • ②父子进程关系
        • ③解答问题

一、冯诺依曼体系结构

我们常见的嵌入式结构,包括哈佛结构冯诺依曼体系结构,我们所使用的计算机电脑就是冯诺依曼体系结构,下图就是该体系的直观图
在这里插入图片描述
在这里的存储器指的是内存,如果不考虑缓存的情况,这里的CPU能且只能对内存进行读写,不能访问输入输出设备,输入输出设备要输入输出数据也只能写入内存或者从内存中读取,就是说,虽然CPU是中央处理器,但对于冯诺依曼结构来说,内存才是中心的部件,所有数据必须先经过内存然后再流向别处

冯诺依曼体系结构是计算机设备得以普及的重大突破,我们知道计算机的存储速度如下图,寄存器是最快的存储也是最贵的,机械硬盘HDD是最慢的存储也是最便宜的,如果没有冯诺依曼结构,我们的计算机要不然就是便宜速度慢,要不就是昂贵速度快,冯诺依曼结构的原理是,在CPU进行计算的时候,内存已经接收外部输入设备输入的数据并存储,然后在CPU进行完计算后将结果取出,然后将结果放到输出设备,再把输入的数据交给CPU进行计算,这样,低速的输入输出设备、中速的内存以及高速的CPU有机整合,形成了现代计算机雏形

在这里插入图片描述

二、操作系统

任何计算机系统都包含一个基本的程序集合,它就被称为操作系统,我们前面说过,操作系统就是操作系统内核+命令行解释器(shell),设计操作系统的目的就是更好地与硬件交互管理软件资源,为应用程序提供一个良好的执行环境
在这里插入图片描述
如上图所示,我们可以清楚看到对于用户和系统软件部分的交互,我们是不能直接调用操作系统的,操作系统像一只小蜗牛,它缩在壳里伸出触角与你交流,除了触角以外,你是碰不到蜗牛的身体的,你只能碰到壳,这里的触角就是系统调用接口,而操作系统也有壳,除了调用系统调用接口,其他的方式都没法间接使用操作系统,因为系统调用在使用上操作比较基础,对用户的要求比较高,所以开发者就对部分系统调用进行适度封装,从而形成了库,有了库我们程序员就可以更好的进行开发软件,然后开发出来的软件再被普通人所使用

对于硬件部分和系统软件部分的交互,我们前面提到了,操作系统是做管理的,何为管理呢?对于程序员而言,管理通过计算机语言的表示方法就是数据结构,大家不妨想一想,我们平常生活所遇到的有关于管理的问题,是不是都可以转化为数据结构的方式来解决呢?我是一个学生,我来举一个有关于学生管理例子:一个学校有十个学院,每个学院有一位院长一百位学生,假设我们的学校就这么单调,没有其他类似辅导员这样的职位,校长是不直接管理我们的,校长吩咐院长来管理学生,院长就要亲力亲为,亲自来管理这些学生,学生的属性都是不同的,但是学生属性的类型都是相同的,他们都有名字、性别、年龄、家庭住址,把学生这个群体定义成一个struct结构体,然后不同的学生填不同的数值,然后按照学号前后以单链表的方式连接起来,这样就把每个学院学生连接起来了,对学生的管理就是对链表的增删查改,校长想要对某个学生进行管理就可以通过院长执行,这里的校长就是操作系统,院长就是驱动程序,而学生就是硬件资源,一个事件可以拆分为决策+执行,操作系统负责决策,驱动程序负责执行,我们刚才的例子对于学生也就是硬件资源就是一个先描述再组织的过程,先将个体描述出来,再将个体组织起来

三、操作系统进程管理

1、概念

进程是正在执行的程序的实例,是操作系统进行资源分配和调度的基本单位,它包含了程序计数器、寄存器、内存空间、打开的文件描述符等运行上下文信息,这些信息共同构成了进程执行的环境

进程是正在执行的程序的实例,程序本身只是存储在磁盘等介质上的一组指令和数据的集合,是静态的,只有当程序被加载到内存中,并由操作系统为其分配资源、创建相应的数据结构来管理其执行时,它才成为一个进程,即变成了一个动态的执行实体

进程是操作系统进行资源分配的基本单位,操作系统需要为每个进程分配独立的资源,包括但不限于内存空间、CPU 时间、文件描述符、网络端口等,每个进程都有自己独立的地址空间,进程在自己的地址空间内可以自由地访问和操作数据,而不会干扰其他进程的地址空间

进程包含了程序执行时的运行上下文信息,运行上下文是指进程在执行过程中所涉及的各种状态和数据,主要包括程序计数器、寄存器状态、堆栈信息、内存管理信息等,程序计数器指示了进程下一条要执行的指令地址,寄存器用于临时存储数据和指令操作数等,堆栈用于保存函数调用的相关信息和局部变量等,这些运行上下文信息完整地描述了进程当前的执行状态,当进程被调度暂停或恢复执行时,操作系统需要保存和恢复这些上下文信息,以确保进程能够正确地继续执行

进程是构成操作系统中并发执行环境的基本单元,操作系统通过管理和调度多个进程,实现了多个任务的并发执行,从而提高了系统资源的利用率和系统的整体性能,多个进程之间可以通过各种进程间通信机制进行数据交换和协作,共同完成复杂的系统任务

下图是我们Windows中的进程
在这里插入图片描述
进程粗略来讲就是内核PCB数据结构对象+你自己的代码和数据
记住上面所说的先描述后组织,通过结构体描述进程的属性,然后通过链表组织多个进程

2、PCB和task_struct

进程的所有信息被存放在一个叫做进程控制块的数据结构中,它是进程属性的集合,被称为PCB

Linux操作系统下的PCB就是task_struct,它是一个结构体,被装载到RAM里

以下是task_struct的内容分类,除了这些,还有一些其他信息

内容意义
标示符每个进程的标识符不同
状态任务状态
优先级相对于其他进程的优先级
程序计数器程序中即将被执行的下一条指令的地址
内存指针包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据进程执行时处理器的寄存器中的数据
IO状态显示的IO请求,分配给进程的IO设备和被进程使用的文件列表
记账信息处理器时间总和或使用的时钟数总和或时间限制、记账号等

所有运行在系统里的进程都以task_struct(双向)链表的形式存在内核里

3、查看进程

写一个死循环的程序,方便我们查看进程

在这里插入图片描述
在这里插入图片描述

ps aux | grep process | grep -v grep 查看进程指令

ps aux 会列出系统中所有用户的所有进程的详细信息,grep process 会在 ps aux 输出的所有行中查找包含 process 的行,并将这些行输出,grep 是要排除的模式,由于在执行 grep process 时,这个 grep 命令本身也会作为一个进程被 ps aux 列出,并且会匹配 process,为了避免将 grep process 这个进程本身显示出来,我们使用 grep -v grep 来过滤掉包含 grep 的行

在程序执行过程中会生成一个进程,我们通过查看进程指令,其中第二列就是进程唯一标识PID
在这里插入图片描述

进程重启对应的PID会发生变化,是由于内存重新给它分配的原因
在这里插入图片描述

这里解答一下为什么我们在进行./process的时候会启动可执行文件process:在进程中有一个目录叫做cwd,意味着当前的工作目录,你可以把它想象为一个指针(其实它是一个软链接),指向这个文件所在的目录,所以一个进程在属性中就有一个是当前的工作目录
亦可以看到exe这里指向的是这里的我们正在执行的可执行程序process
在这里插入图片描述

4、通过系统调用fork创建进程

(1)简述

上面的进程是在执行可执行程序的时候程序自动构建的进程,这节我们要通过系统调用fork创建进程

写一个fork创建进程的程序如下test.c,在我们现有的知识体系里,在fork函数自身不出现问题的情况下给到的id值是大于等于0的值,属于双分支结构,即id值要不然就等于0要不然就大于0,不会出现即等于0又大于0的情况,本身两种情况同时出现就是错误的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
看到结果,两个分支的程序都会执行,就是因为fork这里的原因,生成了子进程,改变了我们对该程序固有的看法,现在我们来研究fork是如何做到的

(2)系统调用生成子进程的过程

〇提出问题

该过程我们可以简化为一个问题:为什么id在等于0的同时又大于0?
id值是从fork函数来的,那么进一步提出问题:fork为什么能产生两个返回值? id为什么能承载两个返回值?

最终我们将目光移动到fork函数身上

①fork函数

fork系统调用用于从一个现有的进程创建一个新的进程,新创建的进程被称为子进程,而原来的进程被称为父进程,子进程是父进程的一个副本,它几乎继承了父进程的所有资源,包括代码段、数据段、堆、栈等,但拥有自己独立的进程控制块(PCB)和进程 ID(PID)

在父进程中,fork返回子进程的 PID,因为父进程可能需要对多个子进程进行管理和控制,所以通过返回的 PID 来标识每个子进程
在子进程中,fork返回 0,这是因为子进程不需要知道父进程的 PID 来进行后续操作,它可以通过getppid函数来获取父进程的 PID
如果fork调用失败,将返回 - 1,并设置errno变量来表示错误原因

②父子进程关系

进程可以粗略表示为代码+数据
当父进程调用fork时,内核会为子进程分配新的 PCB,并复制父进程的大部分资源到子进程中,这包括进程的代码部分
虽然子进程最初复制了父进程的地址空间,但在实际运行中,父子进程的地址空间是相互独立的,如果其中一个进程修改了某些数据,不会影响到另一个进程中的相应区域,这是通过写时复制技术来实现的,即只有当进程试图修改某个数据时,才会真正复制该数据,以节省内存资源,就是说在不修改某些数据的情况下它们指向的是同一块位置,如果子进程或者父进程某些数据要修改,它们会重新开辟一块空间存放该进程的特有数据
fork调用完成后,父进程和子进程就开始并发执行,它们可以各自独立地执行不同的代码路径,也可以通过各种进程间通信机制进行通信和同步,这里就是从fork函数出现之后的代码我们可以把它当做两份,两份代码同时跑,但是id不同,后面执行的效果可能就不同

并且我们可以发现上面的截图父子进程谁先运行是不确定的,这个是由调度器决定的

③解答问题

问:id为什么能承载两个返回值?
答:id变量并不是同时承载两个返回值,而是在不同的执行流(父进程和子进程)中被赋予不同的值,fork函数通过这种方式让父进程和子进程能够区分彼此,并根据返回值执行不同的操作

问:fork为什么能产生两个返回值?
答:父子进程并发执行,每个执行流从fork函数的返回处继续执行,并且根据自身的角色(父进程或子进程)返回不同的值,这样就实现了一个函数调用在两个进程中产生不同返回结果的效果


今日分享就到这里了~
在这里插入图片描述

相关文章:

【Linux】从硬件到软件了解进程

个人主页~ 从硬件到软件了解进程 一、冯诺依曼体系结构二、操作系统三、操作系统进程管理1、概念2、PCB和task_struct3、查看进程4、通过系统调用fork创建进程(1)简述(2)系统调用生成子进程的过程〇提出问题①fork函数②父子进程关…...

HTB:Alert[WriteUP]

目录 连接至HTB服务器并启动靶机 信息收集 使用rustscan对靶机TCP端口进行开放扫描 使用nmap对靶机TCP开放端口进行脚本、服务扫描 使用nmap对靶机TCP开放端口进行漏洞、系统扫描 使用nmap对靶机常用UDP端口进行开放扫描 使用ffuf对alert.htb域名进行子域名FUZZ 使用go…...

ARM嵌入式学习--第十天(UART)

--UART介绍 UART(Universal Asynchonous Receiver and Transmitter)通用异步接收器,是一种通用串行数据总线,用于异步通信。该总线双向通信,可以实现全双工传输和接收。在嵌入式设计中,UART用来与PC进行通信,包括与监控…...

玉米苗和杂草识别分割数据集labelme格式1997张3类别

数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):1997 标注数量(json文件个数):1997 标注类别数:3 标注类别名称:["corn","weed","Bean…...

哈夫曼树

哈夫曼树(Huffman Tree)是一种最优的二叉树,常用于数据压缩,如在 Huffman 编码中使用。它是根据字符出现的频率来构造的,频率越高的字符越靠近树的根,频率低的字符则在较深的节点上。其核心思想是通过构建一…...

wax到底是什么意思

在很久很久以前,人类还没有诞生文字之前,人类就产生了语言;在诞生文字之前,人类就已经使用了语言很久很久。 没有文字之前,人们的语言其实是相对比较简单的,因为人类的生产和生活水平非常低下,…...

笔记:使用ST-LINK烧录STM32程序怎么样最方便?

一般板子在插件上, 8脚 3.3V;9脚 CLK;10脚 DIO;4脚GND ST_Link 19脚 3.3V;9脚 CLK;7脚 DIO;20脚 GND 烧录软件:ST-LINK Utility,Keil_5; ST_Link 接口针脚定义: 按定义连接ST_Link与电路板; 打开STM32 ST-LINK Uti…...

数据分析系列--[11] RapidMiner,K-Means聚类分析(含数据集)

一、数据集 二、导入数据 三、K-Means聚类 数据说明:提供一组数据,含体重、胆固醇、性别。 分析目标:找到这组数据中需要治疗的群体供后续使用。 一、数据集 点击下载数据集 二、导入数据 三、K-Means聚类 Ending, congratulations, youre done....

Python在数据科学领域的深度应用:从数据处理到机器学习模型构建

Python在数据科学领域的深度应用:从数据处理到机器学习模型构建 在当今大数据与人工智能蓬勃发展的时代,Python凭借其简洁的语法、强大的库支持和活跃的社区,已成为数据科学家和工程师的首选编程语言。本文将深入探讨Python在数据科学领域的应用,从数据预处理、探索性分析…...

海外问卷调查渠道查,具体运营的秘密

相信只要持之以恒并逐渐掌握技巧,每一位调查人在踏上征徐之时都会非常顺利的。并在日后的职业生涯中拥有捉刀厮杀的基本技能!本文会告诉你如何做好一个优秀的海外问卷调查人。 在市场经济高速发展的今天,众多的企业为了自身的生存和发展而在…...

穷举vs暴搜vs深搜vs回溯vs剪枝系列一>单词搜索

题解如下 题目:解析决策树:代码设计: 代码: 题目: 解析 决策树: 代码设计: 代码: class Solution {private boolean[][] visit;//标记使用过的数据int m,n;//行,列char…...

万字长文深入浅出负载均衡器

前言 本篇博客主要分享Load Balancing(负载均衡),将从以下方面循序渐进地全面展开阐述: 介绍什么是负载均衡介绍常见的负载均衡算法 负载均衡简介 初识负载均衡 负载均衡是系统设计中的一个关键组成部分,它有助于…...

基于SpringBoot的青年公寓服务平台的设计与实现(源码+SQL脚本+LW+部署讲解等)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...

经典游戏红色警戒2之英语

1. New construction options 部署新的建筑物(一般是部署基地车时说的)。 2. Loading 等待。(正在进行) 3. Construction complete 建筑完成。 4. On hold 等待。(暂停进行) 5. Canceled 取消。 6. Ca…...

IM 即时通讯系统-50-[特殊字符]cim(cross IM) 适用于开发者的分布式即时通讯系统

IM 开源系列 IM 即时通讯系统-41-开源 野火IM 专注于即时通讯实时音视频技术,提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…...

QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI?

问题提出 QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI? ABI(Application Binary Interface)介绍 ABI(Application Binary Interface,应用二进制接口)是指应用程序与操作系统或其他程序…...

处理 **5万字(约7.5万-10万token,中文1字≈1.5-2token)** 的上下文

处理 5万字(约7.5万-10万token,中文1字≈1.5-2token) 的上下文,对模型的长文本处理能力和显存要求较高。以下是不同规模模型的适用性分析及推荐: 一、模型规模与上下文能力的关系 模型类型参数量最大上下文长度&#…...

【狂热算法篇】探秘图论之Dijkstra 算法:穿越图的迷宫的最短路径力量(通俗易懂版)

羑悻的小杀马特.-CSDN博客羑悻的小杀马特.擅长C/C题海汇总,AI学习,c的不归之路,等方面的知识,羑悻的小杀马特.关注算法,c,c语言,青少年编程领域.https://blog.csdn.net/2401_82648291?typebbshttps://blog.csdn.net/2401_82648291?typebbshttps://blog.csdn.net/2401_8264829…...

springboot 启动原理

目标: SpringBootApplication注解认识了解SpringBoot的启动流程 了解SpringFactoriesLoader对META-INF/spring.factories的反射加载认识AutoConfigurationImportSelector这个ImportSelector starter的认识和使用 目录 SpringBoot 启动原理SpringBootApplication 注…...

浅析DDOS攻击及防御策略

DDoS(分布式拒绝服务)攻击是一种通过大量计算机或网络僵尸主机对目标服务器发起大量无效或高流量请求,耗尽其资源,从而导致服务中断的网络攻击方式。这种攻击方式利用了分布式系统的特性,使攻击规模更大、影响范围更广…...

Linux网络 HTTPS 协议原理

概念 HTTPS 也是一个应用层协议,不过 是在 HTTP 协议的基础上引入了一个加密层。因为 HTTP的内容是明文传输的,明文数据会经过路由器、wifi 热点、通信服务运营商、代理服务器等多个物理节点,如果信息在传输过程中被劫持,传输的…...

Idea插件开发

相关操作 执行插件 导出插件 然后到 /build/distributions 目录下面去找...

Java 有很多常用的库

1. 常用工具类库 Apache Commons:提供了大量常用的工具类,如: commons-lang3:字符串、数字、日期等常用工具类。commons-io:IO 操作,文件读写、流处理等。commons-collections4:集合类扩展。 G…...

pytorch实现文本摘要

人工智能例子汇总:AI常见的算法和例子-CSDN博客 import numpy as npfrom modelscope.hub.snapshot_download import snapshot_download from transformers import BertTokenizer, BertModel import torch# 下载模型到本地目录 model_dir snapshot_download(tians…...

C++基础day1

前言:谢谢阿秀,指路阿秀的学习笔记 一、基础语法 1.构造和析构: 类的构造函数是一种特殊的函数,在创建一个新的对象时调用。类的析构函数也是一种特殊的函数,在删除所创建的对象时调用。 构造顺序:父类->子类 析…...

从TinyZero的数据与源码来理解DeepSeek-R1-Zero的强化学习训练过程

1. 引入 TinyZero(参考1)是伯克利的博士生复现DeepSeek-R1-Zero的代码参仓库,他使用veRL来运行RL强化学习方法,对qwen2.5的0.5B、1.5B、3B等模型进行训练,在一个数字游戏数据集上,达到了较好的推理效果。 …...

爬虫基础(四)线程 和 进程 及相关知识点

目录 一、线程和进程 (1)进程 (2)线程 (3)区别 二、串行、并发、并行 (1)串行 (2)并行 (3)并发 三、爬虫中的线程和进程 &am…...

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具01

1、开发背景 大家都很熟悉,Oracle提供了Impdp和ExpDp工具,功能很强大,可以进行db的导入导出的处理。但是对于Sqlserver数据库只是提供了简单的图形化的导出导入工具,在实际的开发和生产环境不太可能让用户在图形化的界面选择移行…...

队列—学习

1. 手写队列的实现 使用数组实现队列是一种常见的方法。队列的基本操作包括入队(enqueue)和出队(dequeue)。队列的头部和尾部分别用 head 和 tail 指针表示。 代码实现 const int N 10000; // 定义队列容量,确保够…...

SpringBoot的配置(配置文件、加载顺序、配置原理)

文章目录 SpringBoot的配置(配置文件、加载顺序、配置原理)一、引言二、配置文件1、配置文件的类型1.1、配置文件的使用 2、多环境配置 三、加载顺序四、配置原理五、使用示例1、配置文件2、配置类3、控制器 六、总结 SpringBoot的配置(配置文件、加载顺序、配置原理) 一、引言…...