当前位置: 首页 > news >正文

【Linux取经路】探寻shell的实现原理

在这里插入图片描述

文章目录

  • 一、打印命令行提示符
  • 二、读取键盘输入的指令
  • 三、指令切割
  • 四、普通命令的执行
  • 五、内建指令执行
    • 5.1 cd指令
    • 5.2 export指令
    • 5.3 echo指令
  • 六、结语

一、打印命令行提示符

const char* getusername() // 获取用户名
{return getenv("USER");
}const char* gethostname() // 获取主机名
{return getenv("HOSTNAME");
}const char* getpwd() // 获取当前所处的目录
{char* pos = strrchr(getenv("PWD"), '/'); // 查找最后一个 ‘/’ if(*(pos+1) != '\0') return pos+1; // 说明不是根目录,返回最后一个文件夹return pos;
}void tooltip() // 打印命令行提示框
{printf(LEFT "%s@%s %s" RIGHT PROMPT" ", getusername(), gethostname(), getpwd());
}

在这里插入图片描述
代码分析:获取基础信息本质上是通过调用 getenv 接口来获取对应环境变量的值。借助 strrchr 函数来查找当前路径中的最后一个文件分隔符 /,它有可能是文件分隔符也有可能是根目录因此要单独判断。

二、读取键盘输入的指令

char command[1024]; // 存储键盘输入的指令int getcommand(char* command, int size) // 读取指令
{memset(command, '\0', size);char* ret = fgets(command, size, stdin); // 这里 ret 一定不为空,因为至少会输入一个回车,fgets 可以读取回车assert(ret != NULL);(void)ret;// “假装使用一下ret,防止有些编译器警告”// aaabc\n\0command[strlen(command)-1] = '\0'; // 去掉结尾的 \nreturn 1;
}int interact(char* command, int size) // 交互
{tooltip();while(getcommand(command, size) && (strlen(command) == 0)){tooltip();}
}int main()
{interact(command, sizeof(command)); // 交互printf("echo: %s\n", command);return 0;
}

在这里插入图片描述
代码分析:键盘输入的指令本质上就是一串字符串,这里不能用 scanf 来获取字符串,因为 scanf 是不会读取空格和回车的(遇到空格和回车就停止读取),而我们一般的指令都是带选项的,指令和选项之间一般会用空格隔开,用 scanf 会导致我们指令读不全。这里使用 fgets 函数来读取键盘输入,其第一参数是存储指令的空间的首地址;第二个参数是空间的大小;第三个参数是从哪个文件流中读取,一个 C/C++ 程序默认会打开三个文件流 stdinstdoutstderr,这里选择从 stdin 中读取,也就是从标准输入中读取。gets 函数会在结尾自动帮我们添加 \0,并且当读取的字符个数大于存储容量时,该函数会自动在结尾放 \0,因此我们可以不用考虑为 \0 预留空间或者认为的在字符串结尾加 \0。其次该函数读取成功返回 command 的首地址,否则返回 NULL,在当前场景下,除非读取错误,否则至少都会读入一个 \n,一般我们输入完指令就是敲回车,什么指令不输也敲回车,因此正常情况下 ret 不可能为 NULL。这里还要考虑删除掉读取到的 \n,因为我们不需要它,我们只要完整的指令。

三、指令切割

#define SEPARATOR " " // 指令分隔符
char* argv[ARGC_LONG] = {NULL}; // 存储指令和选项的起始地址void commandcut(char* command, char** argv, int argvsize) // 指令切割
{memset(argv, 0, argvsize); // 清空char cop_command[COMMAND_LONG] = {'\0'}; // 保证 command 串不被改变for(int i = 0; command[i] != '\0'; i++){cop_command[i] = command[i];}// 开始切割子串char* ret = strtok(cop_command, SEPARATOR);int i = 0;while(ret != NULL){argv[i++] = ret;ret = strtok(NULL, " ");}
}int main()
{while(1){// 1、交互获取命令行参数interact(command, sizeof(command)); // 交互// 到这里说明指令已经获取到了,接下来将指令打散// 2、指令切割commandcut(command, argv, sizeof(argv));for(int i = 0; argv[i]; i++){printf("[%d]: %s\n", i, argv[i]);}printf("echo: %s\n", command);}return 0;
}

在这里插入图片描述

代码分析:这一步主要是借助 strtok 函数将获取到的指令切割成一个一个的子串,将所有子串的起始地址存储在 argv 里面。注意 strtok 函数会改变原空间的内容,因此创建了一段临时的空间 cop_command

四、普通命令的执行

void normalcommandexecution(char** _argv, int* _lastcode) // 普通命令的执行
{pid_t id = fork();if(id < 0){perror("fork");}else if(id == 0){// childint ret = execvp(_argv[0], _argv);if(ret == -1){perror("exeecp");exit(EXIT_CODE);}}else{// fatherint status;pid_t ret = waitpid(id, &status, 0); // 阻塞等待if(ret == id){*_lastcode = WEXITSTATUS(status);}}
}int main()
{while(1){// 1、交互获取命令行参数interact(command, sizeof(command)); // 交互// 到这里说明指令已经获取到了,接下来将指令打散// 2、指令切割commandcut(command, argv, sizeof(argv));// 3、普通命令执行normalcommandexecution(argv, &lastcode);}return 0;
}

在这里插入图片描述
代码分析:对于 ls 这种普通指令(非内建指令),先通过 fork 创建子进程,然后再调用 execvp 接口进行程序替换,去执行输入的指令。

五、内建指令执行

5.1 cd指令

bool isnormalcommand(char **_argv) // 指令判断
{if (strcmp(_argv[0], "cd") == 0)return false;return true;
}void changpwd(char** _argv) // 更改当前工作目录
{chdir(_argv[1]); // 更改当前工作目录// getpwd(pwd, sizeof(pwd));sprintf(getenv("PWD"), "%s", getcwd(pwd, sizeof(pwd))); // 修改环境变量
}void builtincommand(char **_argv) // 内建命令执行
{if (strcmp(_argv[0], "cd") == 0){changpwd(_argv);}
}int main()
{while (1){// 1、交互获取命令行参数interact(command, sizeof(command)); // 交互// 到这里说明指令已经获取到了,接下来将指令打散// 2、指令切割commandcut(command, argv, sizeof(argv));// 3、指令判断// 3、普通命令执行if (isnormalcommand(argv)) // 普通指令normalcommandexecution(argv, &lastcode);else // 内建指令builtincommand(argv);}return 0;
}

在这里插入图片描述

代码分析:要考虑内建指令,那在指令切割之后要先对指令进行判断。内建指令不需要创建子进程去执行,而是直接由当前的 bash 进程去执行。比如说 cd 指令,执行完 cd 指令后,我们要让当前的 bash 更改工作目录,而不是让其创建子进程去执行 cd 指令,那样改变的就是子进程的工作目录。可以发现,一个指令执行完后,如果会对 bash 产生影响,那么它就必须是内建指令。其次关于 cd 指令,它改变了当前的工作目录,这一点该如何理解呢?我 myshell 就是一个可执行程序,我的源代码和编译得到的可执行文件始终都放在 /home/wcy/linux-s/2023-10-28a/myshell 目录下,你 cd 命令凭什么能改变我的工作目录?其实并不然,这里改变工作目录是:一个可执行程序在变成进程产生 PCB 对象后,PCB 里面维护了一个属性就叫做当前可执行程序的工作目录,cd 指令改变的其实就是这一属性,并不是改变 myshell 程序的存储位置,我们通过调用 chdir 系统调用来修改这一属性。最后,因为我们前面是通过环境变量来获取当前工作目录,而环境变量在被当前 myshell 进程从父进程继承下来后是不会自动发生改变的,因此在执行完 cd 指令后,我们要对 PWD 环境变量进行修改,环境变量本质上就是存储在内存中的一段字符串信息,因此我们可以采用 sprintf 函数对该字符串信息进行修改。

在这里插入图片描述

5.2 export指令

#define USER_ENV_SIZE 100  // 允许用户添加的环境变量个数
#define USER_ENV_LONG 1024 // 用户一个环境变量的最大长度char userenv[USER_ENV_SIZE][USER_ENV_LONG]; // 保存用户添加的环境变量
int userenvnum = 0;                         // 当前用户输入的环境变量个数void exportcommand(char** _argv, char(*_userenv)[USER_ENV_LONG], int* _userenvnum)
{// 将用户输入的环境变量存储起来strcpy(_userenv[*_userenvnum], _argv[1]);int ret = putenv(_userenv[(*_userenvnum)++]);if (ret == 0)perror("putenv");
}

在这里插入图片描述
代码分析:只要 bash 不退出,我们每次添加的环境变量都应该被保存起来,我们输入的环境变量是被当做指令保存在 command 里面,当下一次输入指令,上一次输入的内容就会被清空。putenv 添加环境变量,并不是把对应的字符串拷贝到系统的表当中,而是把该字符串的地址保存在系统的表中,因此我们要确保保存环境变量字符串的那个地址里的环境变量不会被修改,所以我们需要为用户输入的环境变量,也就是那一串字符串单独开辟一块空间进行存储,保证在内次重新输入指令的时候,不会影响到之前用户添加的环境变量。因为环境变量本质就是一个字符串,所以这里我们定义了一个字符二维数组来存储用户输入的环境变量,先把用户输入的环境变量存入我们定义的这个数组,然后再调用 putenv 函数将数组中的内容添加到当前的环境变量。这样就可以保证只要当前 bash 不退出,用户历史上添加的环境变量都在。这里涉及到二维数组传参的问题,再来回顾一下,数组名表示首元素地址,二维数组的首元素是一个一维数组,所以函数形参的类型是一个字符一维数组的地址,也就是 char(*)[USER_ENV_LONG]

5.3 echo指令

void echocommand(char **_argv, int _argc)
{if (_argv[1][0] == '$'){char *ptr = _argv[1] + 1;printf("%s\n", getenv(ptr));}else{int i = 1;while (i < _argc){char *ret = strtok(_argv[i], "\"");while (ret != NULL){printf("%s", ret);ret = strtok(NULL, "\"");}printf("%c", ' ');i++;}printf("\n");}
}

在这里插入图片描述
代码分析echo 指令需要考虑将输入的 " 去掉,其次可能连续输入多个字符串,还要考虑 echo$ 配合使用是去打印环境变量的值。

小结:当我们登陆的时候,系统就是要启动一个 shell 进程,我们 shell 本身的环境变量是在用户登录的时候,shell 会读取用户目录下的 .bash_profile 文件,里面保存了导入环境变量的方式。

在这里插入图片描述
在这里插入图片描述

六、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

在这里插入图片描述

相关文章:

【Linux取经路】探寻shell的实现原理

文章目录 一、打印命令行提示符二、读取键盘输入的指令三、指令切割四、普通命令的执行五、内建指令执行5.1 cd指令5.2 export指令5.3 echo指令 六、结语 一、打印命令行提示符 const char* getusername() // 获取用户名 {return getenv("USER"); }const char* geth…...

【MATLAB】使用随机森林在回归预测任务中进行特征选择(深度学习的数据集处理)

1.随机森林在神经网络的应用 当使用随机森林进行特征选择时&#xff0c;算法能够为每个特征提供一个重要性得分&#xff0c;从而帮助识别对目标变量预测最具影响力的特征。这有助于简化模型并提高其泛化能力&#xff0c;减少过拟合的风险&#xff0c;并且可以加快模型训练和推理…...

2024Node.js零基础教程(小白友好型),nodejs新手到高手,(六)NodeJS入门——http模块

047_http模块_获取请求行和请求头 hello&#xff0c;大家好&#xff0c;那第二节我们来介绍一下如何在这个服务当中来提取 HTT 请求报文的相关内容。首先先说一下关于报文的提取的方法&#xff0c;我在这个文档当中都已经记录好了&#xff0c;方便大家后续做一个快速的查阅。 …...

【数据结构与算法】(5)基础数据结构之队列 链表实现、环形数组实现详细代码示例讲解

目录 2.4 队列1) 概述2) 链表实现3) 环形数组实现 2.4 队列 1) 概述 计算机科学中&#xff0c;queue 是以顺序的方式维护的一组数据集合&#xff0c;在一端添加数据&#xff0c;从另一端移除数据。习惯来说&#xff0c;添加的一端称为尾&#xff0c;移除的一端称为头&#xf…...

(注解配置AOP)学习Spring的第十七天

基于注解配置的AOP 来看注解式开发 : 先把目标与通知放到Spring里管理 : Service("userService") public class UserServiceImpl implements UserService {Overridepublic void show1() {System.out.println("show1......");}Overridepublic void show2…...

[C++] opencv + qt 创建带滚动条的图像显示窗口代替imshow

在OpenCV中&#xff0c;imshow函数默认情况下是不支持滚动条的。如果想要显示滚动条&#xff0c;可以考虑使用其他库或方法来进行实现。 一种方法是使用Qt库&#xff0c;使用该库可以创建一个带有滚动条的窗口&#xff0c;并在其中显示图像。具体步骤如下&#xff1a; 1&…...

C#用Array类的Reverse方法反转数组中元素

目录 一、Array.Reverse 方法 1.重载 2.Reverse(Array, Int32, Int32) 3. Reverse(Array) 4.Reverse(T[]) 5. Reverse(T[], Int32, Int32) 二、实例 1.Array.Reverse 方法4种重载方法综合实例 2.Reverse(Array)方法的实例 一、Array.Reverse 方法 反转一维 Array 或部…...

iOS AlDente 1.0自动防过充, 拯救电池健康度

经常玩iOS的朋友可能遇到过长时间过充导致的电池鼓包及健康度下降问题。MacOS上同样会出现该问题&#xff0c;笔者用了4年的MBP上周刚拿去修了&#xff0c;就是因为长期不拔电源的充电&#xff0c;开始还是电量一半的时候不接电源会黑屏无法开机&#xff0c;最后连着电源都无法…...

春晚刘谦魔术——约瑟夫环

昨晚&#xff0c;刘谦在春晚上表演了一个魔术&#xff0c;通过对四张撕成两半的纸牌连续操作&#xff0c;最终实现了纸牌的配对。 这个魔术虽然原理不是很难&#xff0c;但是通过刘谦精湛的表演还是让这个魔术产生了不错的效果&#xff08;虽然我感觉小尼的效果更不错&#xff…...

itextpdf使用:使用PdfReader添加图片水印

gitee参考代码地址&#xff1a;https://gitee.com/wangtianwen1996/cento-practice/tree/master/src/test/java/com/xiaobai/itextpdf 参考文章&#xff1a;https://www.cnblogs.com/wuxu/p/17371780.html 1、生成带有文字的图片 使用java.awt包的相关类生成带文字的图片&…...

如何为Kafka加上账号密码(二)

认证策略SASL/PLAIN 上篇文章中我们讲解了Kafka认证方式和基础概念&#xff0c;并比较了不同方式的使用场景。 我们在《2024年了&#xff0c;如何更好的搭建Kafka集群&#xff1f;》中集群统一使用PLAINTEXT通信。Kafka通常是在内网使用&#xff0c;但也有特殊的使用场景需要…...

【大数据】Flink on YARN,如何确定 TaskManager 数

Flink on YARN&#xff0c;如何确定 TaskManager 数 1.问题2.并行度&#xff08;Parallelism&#xff09;3.任务槽&#xff08;Task Slot&#xff09;4.确定 TaskManager 数 1.问题 在 Flink 1.5 Release Notes 中&#xff0c;有这样一段话&#xff0c;直接上截图。 这说明从 …...

ES节点故障的容错方案

ES节点故障的容错方案 1. es启动加载逻辑1.1 segment和translg组成和分析1.2 es节点启动流程1.3 es集群的初始化和启动过程 2. master高可用2.1 选主逻辑2.1.1 过滤选主的节点列表2.1.2 Bully算法2.1.2 类Raft协议2.1.3 元数据合并 2.2 HA切换 3. 分片高可用3.1 集群分片汇报3.…...

【Flink】FlinkSQL实现数据从Kafka到MySQL

简介 未来Flink通用化,代码可能就会转换为sql进行执行,大数据开发工程师研发Flink会基于各个公司的大数据平台或者通用的大数据平台,去提交FlinkSQL实现任务,学习Flinksql势在必行。 本博客在sql-client中模拟大数据平台的sql编辑器执行FlinkSQL,使用Flink实现数据从Kafka传…...

Unity GC

本文由 简悦 SimpRead 转码&#xff0c; 原文地址 mp.weixin.qq.com 简略版本 在 Unity 中&#xff0c;垃圾回收&#xff08;Garbage Collection&#xff0c;GC&#xff09;采用的是基于标记-清除&#xff08;Mark and Sweep&#xff09;算法的自动内存管理机制。 基于标记-清…...

Vue源码系列讲解——变化侦测篇【下】(Array的变化侦测)

目录 1. 前言 2. 在哪里收集依赖 3. 使Array型数据可观测 3.1 思路分析 3.2 数组方法拦截器 3.3 使用拦截器 4. 再谈依赖收集 4.1 把依赖收集到哪里 4.2 如何收集依赖 4.3 如何通知依赖 5. 深度侦测 6. 数组新增元素的侦测 7. 不足之处 8. 总结 1. 前言 上一篇文…...

【机器学习笔记】贝叶斯学习

贝叶斯学习 文章目录 贝叶斯学习1 贝叶斯学习背景2 贝叶斯定理3 最大后验假设MAP(Max A Posterior)4 极大似然假设ML(Maximum Likelihood)5 朴素贝叶斯NB6 最小描述长度MDL 1 贝叶斯学习背景 试图发现两件事情的关系&#xff08;因果关系&#xff0c;先决条件&结论&#x…...

ElasticSearch之倒排索引

写在前面 本文看下es的倒排索引相关内容。 1&#xff1a;正排索引和倒排索引 正排索引就是通过文档id找文档内容&#xff0c;而倒排索引就是通过文档内容找文档id&#xff0c;如下图&#xff1a; 2&#xff1a;倒排索引原理 假定我们有如下的数据&#xff1a; 为了建立倒…...

win11安装mysql8.3.0压缩包版 240206

mysql社区版安装包版windows安装包下载地址 在系统环境变量path无点.的情况下 powershell 可以 .\ 或 ./ 开头表示当前文件夹cmd 可以直接命令或.\开头, 不能./开头 所以 .\ 在cmd和powershell中通用 步骤 在解压目录 .\mysqld --initialize-insecure root无密码初始化.\m…...

数据库索引与优化:深入了解索引的种类、使用与优化

数据库索引与优化&#xff1a;深入了解索引的种类、使用与优化 索引的种类 数据库索引是提高查询速度的重要手段之一&#xff0c;主要分为以下几种类型&#xff1a; 主键索引&#xff08;Primary Key Index&#xff09;&#xff1a; 唯一标识表中的每一行数据&#xff0c;保…...

零配置部署!VoxCPM-1.5-WEBUI让语音合成变得像上网一样简单

零配置部署&#xff01;VoxCPM-1.5-WEBUI让语音合成变得像上网一样简单 你是否曾为视频配音找不到合适的声音而烦恼&#xff1f;是否想过制作有声读物却苦于录音设备和时间成本&#xff1f;或者&#xff0c;你只是想体验一下&#xff0c;让AI用你喜欢的音色为你朗读一段文字&a…...

Kook Zimage真实幻想Turbo快速调试:找到属于你的幻想风格黄金参数组合

Kook Zimage真实幻想Turbo快速调试&#xff1a;找到属于你的幻想风格黄金参数组合 1. 认识Kook Zimage真实幻想Turbo Kook Zimage真实幻想Turbo是一款专为个人GPU设计的轻量化幻想风格图像生成系统。它基于Z-Image-Turbo极速文生图底座&#xff0c;通过独特的权重融合技术&am…...

Nanbeige 4.1-3B专属UI实战:一键部署沉浸式游戏风格聊天应用

Nanbeige 4.1-3B专属UI实战&#xff1a;一键部署沉浸式游戏风格聊天应用 1. 项目概述与核心价值 南北阁&#xff08;Nanbeige&#xff09;4.1-3B是一款性能优异的中英双语大语言模型&#xff0c;而今天我们要介绍的是为其量身打造的专属Web交互界面。这个界面最特别之处在于&…...

告别Electron臃肿!用Tauri 2.0 + Rust打造你的第一个轻量级桌面应用(附完整项目结构解析)

从Electron到Tauri 2.0&#xff1a;用Rust重构现代桌面应用开发范式 当Electron应用体积膨胀到200MB起步时&#xff0c;我们不得不重新思考桌面开发的未来。Tauri 2.0的出现绝非偶然——这是前端开发者对性能与体验的集体觉醒。本文将带你深入这个基于Rust的轻量级框架&#xf…...

Android Perfetto 系列 6:为什么是 120Hz?高刷新率的优势与挑战

Android Perfetto 系列 6&#xff1a;为什么是 120Hz&#xff1f;高刷新率的优势与挑战本文是 Android Perfetto 系列的第六篇&#xff0c;主要介绍 Android 设备上 120Hz 刷新率的相关知识。如今&#xff0c;120Hz 已成为 Android 旗舰手机的标配&#xff0c;本文将讨论高刷新…...

OpenClaw技能扩展指南:为百川2-13B添加公众号发布模块

OpenClaw技能扩展指南&#xff1a;为百川2-13B添加公众号发布模块 1. 为什么需要公众号发布技能 上周我正忙着准备一篇技术分享文章&#xff0c;突然意识到一个痛点&#xff1a;每次写完Markdown文档后&#xff0c;手动复制到公众号编辑器、调整格式、上传封面、设置摘要的过…...

【概率统计】从直方图到核密度估计:数据分布可视化的进阶之路

1. 直方图&#xff1a;数据可视化的第一课 第一次接触数据分布可视化时&#xff0c;大多数人都是从直方图开始的。记得我刚学数据分析时&#xff0c;导师扔给我一组销售数据说&#xff1a;"先画个直方图看看分布情况。"当时我盯着matplotlib的hist函数参数一脸茫然—…...

从SuperGlue到LoFTR:无检测器特征匹配是如何“卷”出来的?技术演进深度解读

从SuperGlue到LoFTR&#xff1a;无检测器特征匹配的技术革命与范式迁移 在计算机视觉领域&#xff0c;特征匹配一直是三维重建、SLAM、图像配准等任务的核心基础。传统方法如SIFT、ORB等基于手工设计的特征检测与描述算法&#xff0c;在过去二十年里主导了这一领域。然而&#…...

深度学习中的优化器:原理与实践

深度学习中的优化器&#xff1a;原理与实践 一、背景与动机 在深度学习中&#xff0c;优化器是模型训练的核心组件&#xff0c;它决定了模型参数如何根据损失函数的梯度进行更新。选择合适的优化器对于模型的训练速度和最终性能至关重要。本文将深入探讨各种优化器的核心原理、…...

C++的std--ranges算法自定义比较器与等价关系在集合操作中的运用

C20引入的std::ranges库为算法操作带来了革命性改进&#xff0c;其中自定义比较器与等价关系的灵活运用&#xff0c;显著提升了集合操作的表达能力。通过精确控制元素间的比较逻辑&#xff0c;开发者能够实现更复杂的业务需求&#xff0c;例如处理自定义对象集合或实现非标准排…...