当前位置: 首页 > news >正文

Linux shell编程学习笔记73:sed命令——沧海横流任我行(上)


0 前言


在大数据时代,我们要面对大量数据,有时需要对数据进行替换、删除、新增、选取等特定工作。

在Linux中提供很多数据处理命令,如果我们要以行为单位进行数据处理,可以使用sed。

1 sed 的帮助信息,功能,格式,选项和参数说明,退出状态

1.1 sed 的帮助信息

我们可以使用命令sed--help来获取帮助信息。

1.1.1 CSDN程序员研究院bash中的sed 的帮助信息

[purpleendurer @ bash ~] sed --help
Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...-n, --quiet, --silentsuppress automatic printing of pattern space-e script, --expression=scriptadd the script to the commands to be executed-f script-file, --file=script-fileadd the contents of script-file to the commands to be executed--follow-symlinksfollow symlinks when processing in place-i[SUFFIX], --in-place[=SUFFIX]edit files in place (makes backup if SUFFIX supplied)-c, --copyuse copy instead of rename when shuffling files in -i mode-b, --binarydoes nothing; for compatibility with WIN32/CYGWIN/MSDOS/EMX (open files in binary mode (CR+LFs are not treated specially))-l N, --line-length=Nspecify the desired line-wrap length for the `l' command--posixdisable all GNU extensions.-r, --regexp-extendeduse extended regular expressions in the script.-s, --separateconsider files as separate rather than as a single continuouslong stream.-u, --unbufferedload minimal amounts of data from the input files and flushthe output buffers more often-z, --null-dataseparate lines by NUL characters--helpdisplay this help and exit--versionoutput version information and exitIf no -e, --expression, -f, or --file option is given, then the first
non-option argument is taken as the sed script to interpret.  All
remaining arguments are names of input files; if no input files are
specified, then the standard input is read.GNU sed home page: <http://www.gnu.org/software/sed/>.
General help using GNU software: <http://www.gnu.org/gethelp/>.
E-mail bug reports to: <bug-sed@gnu.org>.
Be sure to include the word ``sed'' somewhere in the ``Subject:'' field.
[purpleendurer @ bash ~]

1.1.2 银河麒麟(kylin)系统中的sed帮助信息

[purpleendurer @kylin-bash ~] sed --help
用法: sed [选项]... {脚本(如果没有其他脚本)} [输入文件]...-n, --quiet, --silent取消自动打印模式空间-e 脚本, --expression=脚本添加“脚本”到程序的运行列表-f 脚本文件, --file=脚本文件添加“脚本文件”到程序的运行列表--follow-symlinks直接修改文件时跟随软链接-i[SUFFIX], --in-place[=SUFFIX]edit files in place (makes backup if SUFFIX supplied)-l N, --line-length=N指定“l”命令的换行期望长度--posix关闭所有 GNU 扩展-r, --regexp-extended在脚本中使用扩展正则表达式-s, --separate将输入文件视为各个独立的文件而不是一个长的连续输入-u, --unbuffered从输入文件读取最少的数据,更频繁的刷新输出-z, --null-dataseparate lines by NUL characters--help     打印帮助并退出--version  输出版本信息并退出如果没有 -e, --expression, -f 或 --file 选项,那么第一个非选项参数被视为
sed脚本。其他非选项参数被视为输入文件,如果没有输入文件,那么程序将从标准
输入读取数据。GNU版sed主页: <http://www.gnu.org/software/sed/>。
使用GNU软件所需帮助文档: <http://www.gnu.org/gethelp/>。
将错误报告通过电子邮件发送到:<bug-sed@gnu.org>.
请务必将单词“sed”放在标题的某处。
[purpleendurer @kylin-bash ~] 

1.2 sed的功能

sed命令源于stream editor(流编辑器),是一个非交互式命令行文本编辑器。

sed命令的功能主要是对文本进行过滤,例如,接受文本输入,对文本执行一些操作(或一组操作),并输出修改后的文本。

sed命令在处理文本时,会先把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾

sed命令的强大之处在于能够处理大文件,并使用正则表达式进行模式匹配和替换,这使其成为脚本编写和数据整理的必备工具。

sed命令通常用于使用模式匹配提取文件的一部分,或替换文件中多次出现的字符串。

当您需要在文件或流上高效地执行文本转换时,可以使用 sed。

1.3 sed的格式

sed [选项]... {脚本(如果没有其他脚本)} [输入文件]...

1.4 sed的选项说明 

选项说明
-n, --quiet, --silent取消自动打印模式空间
-e 脚本, --expression=脚本

将脚本添加到要执行的命令中。

即:直接在命令行模式上进行sed动作编辑,此为默认选项

-f 脚本文件, --file=脚本文件

将指定脚本文件的内容添加到要执行的命令中。

即:将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作

--follow-symlinks直接修改文件时跟随软链接
-i[SUFFIX], --in-place[=SUFFIX]

就地编辑文件(如果提供了 SUFFIX,则进行备份)

当使用-i选项时,要注意它可能对文件进行不可逆的修改。

在处理重要数据时,务必确保进行备份。

-c, --copy在 -i 模式下随机播放文件时,使用复制而不是重命名
-b, --binary什么都不做;与 WIN32/CYGWIN/MSDOS/EMX 兼容(以二进制模式打开文件(CR+LF 未得到特殊处理))
-l N, --line-length=N为 'l' 命令指定所期望的换行长度
--posix关闭所有 GNU 扩展
-r, --regexp-extended在脚本中使用扩展正则表达式
-s, --separate将输入文件视为各个独立的文件而不是一个长的连续输入
-u, --unbuffered从输入文件加载最少的数据量,并更频繁地刷新输出缓冲区
-z, --null-data用 NUL 字符来分隔行
--help打印帮助并退出
--version输出版本信息并退出

1.5 sed的参数

如果没有给出 -e、--expression、-f 或 --file 选项,则第一个非选项 参数作为要解释的 sed 脚本。 

如果在处理上述操作后仍有任何命令行参数,则这些参数将被解释为要处理的输入文件的名称。

文件名“-”是指标准输入流。如果未指定文件名,则将处理标准输入。

1.6 sed的退出状态

退出状态为零表示成功,非零值表示失败。

GNU sed 返回以下退出状态值:

退出码说明
0成功完成。
1无效的命令、无效的语法、无效的正则表达式或与 --posix 一起使用的 GNU sed 扩展命令。
2

无法打开命令行上指定的一个或多个输入文件(例如,如果找不到文件,或读取权限被拒绝)。

继续处理其他文件。

4如果出现 I/O 错误,或者在运行时出现严重的处理错误,GNU sed 会立即中止。

此外,命令 q 和 Q 可用于使用自定义退出代码值终止 sed(这是一个 GNU sed 扩展),详见2.1。

2 sed的脚本

sed 脚本程序由一个或多个 sed 命令组成,这些命令由 -e、-f、--expression 和 --file 选项中的一个或多个传入,如果不存在以上这些选项,则由第一个非选项参数传入。

sed命令的脚本命令格式如下:

[地址]X[选项]


其中:

1.X :是一个单字母的 sed 文本处理命令。

2.[地址] :是可选的行地址。如果指定了 [地址],则命令 X 将仅在匹配的行上执行。[地址] 可以是单行号、正则表达式或一系列行。

3. [选项]: 用于某些 sed 命令。

3 sed命令

3.1 sed命令说明

命令说明
a\在当前行下面插入文本
i\在当前行上面插入文本
c\把选定的行改为新的文本
d删除,删除选择的行
D删除模板块的第一行
s替换指定字符
h拷贝模板块的内容到内存中的缓冲区
H追加模板块的内容到内存中的缓冲区
g获得内存缓冲区的内容,并替代当前模板块中的文本
G获得内存缓冲区的内容,并追加到当前模板块文本的后面
l列表不能打印字符的清单
n读取下一个输入行,用下一个命令处理新的行而不是用第一个命令
N追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码
p打印模板块的行
P打印模板块的第一行
q[exit-code] 退出 sed,而不处理任何其他命令或输入。
Q[exit-code]

此命令与 q 相同,但不会打印模式空间的内容。

与 q 一样,它提供了向调用者返回退出代码的功能。

b lable分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾
r file从file中读行
t labelif分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾
T label错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾
w file写并追加模板块到file末尾
W file写并追加模板块的第一行到file末尾
!表示后面的命令对所有没有被选定的行发生作用
=打印当前行号
#把注释扩展到下一个换行符以前;

3.2 替换标记

替换标记说明
g表示行内全面替换
p表示打印行
w表示把行写入一个文件
x表示互换模板块中的文本和缓冲区中的文本
y表示把一个字符翻译为另外的字符(但是不用于正则表达式)
\1子串匹配标记
&已匹配字符串标记

3.3 元字符 

元字符说明
^匹配行开始,如:/^sed/匹配所有以sed开头的行
$匹配行结束,如:/sed$/匹配所有以sed结尾的行
.匹配一个非换行符的任意字符,如:/s.d/匹配s后接一个任意字符,最后是d
*匹配0个或多个字符,如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行
[]匹配一个指定范围内的字符,如/[ss]ed/匹配sed和Sed
[^]匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行
\(..\)匹配子串,保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers
&保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**
\<匹配单词的开始,如:/\
\>匹配单词的结束,如/love\>/匹配包含以love结尾的单词的行
x\{m\}重复字符x,m次,如:/0\{5\}/匹配包含5个0的行
x\{m,\}重复字符x,至少m次,如:/0\{5,\}/匹配至少有5个0的行
x\{m,n\}重复字符x,至少m次,不多于n次,如:/0\{5,10\}/匹配5~10个0的行

4 sed命令中的地址

sed命令中的地址用于决定对流入模式空间的哪些行进行编辑。

如果没有指定地址,sed将处理流入模式空间的所有行。

地址可以使用以下方式指定。

4.1 数字

sed 脚本中的地址可以采用以下任何形式:

表达式说明
行号

指定行号将仅匹配输入中的该行。

请注意,除非指定了 -i 或 -s 选项,否则 sed 会连续计算所有输入文件的行数。

$此地址与最后一个输入文件的最后一行匹配,或者在指定 -i 或 -s 选项时匹配每个文件的最后一行。
第一步~步长

这个 GNU 扩展匹配从第一行开始的每一步行。特别是,当存在非负 n 时,将选择行,使得当前行号等于第一个 + (n * 步长)。

因此,我们可以使用 1~2 来选择奇数行,使用 0~2 来选择偶数行;

要选择从第二行开始的每三行,将使用“2~3”;

要选择从第十行开始的每五行,请使用“10~5”;

而“50~0”只是50的一种晦涩难懂的说法。

4.2 文本匹配(正则表达式)

sed 支持以下正则表达式地址。默认正则表达式为基本正则表达式 (BRE)。

如果使用 -E 或 -r 选项,则正则表达式应采用扩展正则表达式 (ERE) 语法。

表达式说明
/正则表达式/

这将选择与正则表达式正则表达式匹配的任何行。

如果正则表达式本身包含任何 / 字符,则每个字符都必须通过反斜杠 (\) 进行转义。  

空正则表达式 '//' 重复上次正则表达式匹配(如果将空正则表达式传递给 s 命令,则同样适用)。请注意,正则表达式的修饰符是在编译正则表达式时计算的,因此将它们与空正则表达式一起指定是无效的。

\%regexp%

% 可以替换为任何其他单个字符。

这也与正则表达式正则表达式匹配,但允许使用与 / 不同的分隔符。

如果正则表达式本身包含大量斜杠,这将特别有用,因为它避免了每个 / 的繁琐转义。

如果正则表达式本身包含任何分隔符,则每个分隔符都必须用反斜杠 (\) 进行转义。

/regexp/I

\%regexp%I

正则表达式匹配的 I 修饰符是一个 GNU 扩展,它使正则表达式以不区分大小写的方式进行匹配。

在许多其他编程语言中,小写字母 i 用于不区分大小写的正则表达式匹配。但是,在 sed 中,i 用于插入命令

/regexp/M

\%regexp%M

正则表达式匹配的 M 修饰符是一个 GNU sed 扩展,它指示 GNU sed 在多行模式下匹配正则表达式。修饰符使 ^ 和 $ 分别匹配(除了正常行为)换行符之后的空字符串和换行符之前的空字符串。有一些特殊字符序列(\' 和 \')始终与缓冲区的开头或结尾匹配。此外,在多行模式下,句点字符与换行符不匹配。

0,/regexp/

可以在地址规范中使用 0 的行号,例如 0,/regexp/,以便 sed 也将尝试匹配第一输入行中的正则表达式。换句话说,0,/regexp/ 类似于 1,/regexp/,不同之处在于,如果 addr2 匹配输入的第一行,则 0,/regexp/ 形式将认为它结束范围,而 1,/regexp/ 形式将匹配其范围的开头,从而使范围跨度直到正则表达式的第二次出现。

请注意,这是 0 地址唯一有意义的地方;没有第 0 行,以任何其他方式给出 0 地址的命令都会产生错误。

addr1,+N

匹配 addr1 和 addr1 后面的 N 行。

addr1,~N

匹配 addr1 和 addr1 后面的行,直到输入行号是 N 的倍数的下一行。

正则表达式地址对当前模式空间的内容进行操作。如果模式空间发生变化(例如,使用 s/// 命令),则正则表达式匹配将对更改的文本进行操作。      

4.3 范围地址

可以通过指定两个用逗号 (,) 分隔的地址来指定地址范围。

5 参考资料

sed, a stream editorsed, a stream editoricon-default.png?t=N7T8https://www.gnu.org/software/sed/manual/sed.html

相关文章:

Linux shell编程学习笔记73:sed命令——沧海横流任我行(上)

0 前言 在大数据时代&#xff0c;我们要面对大量数据&#xff0c;有时需要对数据进行替换、删除、新增、选取等特定工作。 在Linux中提供很多数据处理命令&#xff0c;如果我们要以行为单位进行数据处理&#xff0c;可以使用sed。 1 sed 的帮助信息&#xff0c;功能&#xff…...

内网渗透之icmp隧道传输

原理 # 为什么要建立隧道 在实际的网络中&#xff0c;通常会通过各种边界设备软/硬件防火墙、入侵检测系统来检查对外连接的情况&#xff0c;如果发现异常&#xff0c;会对通信进行阻断。 ​ # 什么是隧道 就是一种绕过端口屏蔽的方式&#xff0c;防火墙两端的数据包通过防火墙…...

【C++ 第十五章】map 和 set 的封装(封装红黑树)

1. map 和 set 的介绍 ⭐map 与 set 分别是STL中的两种序列式容器; 它们是一种树形数据结构的容器&#xff0c;且其的底层构造为一棵红黑树; 而在上一篇文章中提到,其实红黑树本身就是一棵二叉搜索树,是基于二叉搜索树的性质对其增加了平衡的属性来提高其综合性能 ⭐当然也…...

LIN通讯

目录 1 PLinApi.h 2 TLINFrameEntry 结构体 3 自定义函数getTLINFrameEntry 4 TLINScheduleSlot 结构体 5 自定义函数 getTLINScheduleSlot 6 自定义LIN_SetScheduleInit函数 7 自定义 LIN_StartSchedule 8 发送函数 9 线程接收函数 1 PLinApi.h 这是官方头文件 ///…...

zabbix常见架构及组件

Zabbix作为一个开源的、功能全面的监控解决方案&#xff0c;广泛应用于各类组织中&#xff0c;以实现对网络、服务器、云服务及应用程序性能的全方位监控。部署架构灵活性高&#xff0c;可支持从小型单一服务器环境到大型分布式系统的多种场景。基本架构通常包括监控端&#xf…...

plsql表格怎么显示中文 plsql如何导入表格数据

在Oracle数据库开发中&#xff0c;PL/SQL Developer是一款广泛使用的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它提供了丰富的功能来帮助开发人员高效地进行数据库开发和管理。在使用PL/SQL Developer时&#xff0c;许多用户会遇到表格显示中文的问题&#xff0c;以…...

chromedriver下载地址大全(包括124.*后)以及替换exe后仍显示版本不匹配的问题

Chrome for Testing availability CNPM Binaries Mirror 若已经更新了系统环境变量里的chromdriver路径下的exe&#xff0c;仍显示版本不匹配&#xff1a; 则在cmd界面输入 chromedriver 会跳出version verison与刚刚下载好的exe不匹配&#xff0c;则再输入&#xff1a; w…...

拦截器实现 Mybatis Plus 打印含参数的 SQL 语句

1.实现拦截器 package com.sample.common.interceptor;import com.baomidou.mybatisplus.extension.plugins.inner.InnerInterceptor; import lombok.extern.slf4j.Slf4j; import org.apache.ibatis.executor.Executor; import org.apache.ibatis.mapping.BoundSql; import or…...

Oracle Subprogram即Oracle子程序

Oracle Subprogram&#xff0c;即Oracle子程序&#xff0c;是Oracle数据库中存储的过程&#xff08;Procedures&#xff09;和函数&#xff08;Functions&#xff09;的统称。这些子程序是存储在数据库中的PL/SQL代码块&#xff0c;用于执行特定的任务或操作。下面详细介绍Orac…...

自然语言处理实战项目30-基于RoBERTa模型的高精度的评论文本分类实战,详细代码复现可直接运行

大家好,我是微学AI,今天给大家介绍一下自然语言处理实战项目30-基于RoBERTa模型的高精度的评论文本分类实战,详细代码复现可直接运行。RoBERTa模型是由 Facebook AI Research 和 FAIR 的研究人员提出的一种改进版的 BERT 模型。RoBERTa 通过采用更大的训练数据集、动态掩码机…...

RK3588J正式发布Ubuntu桌面系统,丝滑又便捷!

本文主要介绍瑞芯微RK3588J的Ubuntu系统桌面演示&#xff0c;开发环境如下&#xff1a; U-Boot&#xff1a;U-Boot-2017.09 Kernel&#xff1a;Linux-5.10.160 Ubuntu&#xff1a;Ubuntu20.04.6 LinuxSDK&#xff1a; rk3588-linux5.10-sdk-[版本号] &#xff08;基于rk3…...

基于GPT-SoVITS的API实现批量克隆声音

目标是将每一段声音通过GPT-SoVITS的API的API进行克隆,因为拼在一起的整个片段处理会造成内存或者缓存溢出。 将目录下的音频文件生成到指定目录下,然后再进行拼接。 通过AI工具箱生成的数据文件是这样的结构,temp目录下是没个片段生成的部分,connect_是正常拼接的音频文件…...

详解华为项目管理,附华为高级项目管理内训材料

&#xff08;一&#xff09;华为在项目管理中通过有效的沟通、灵活的组织结构、坚持不懈的努力、细致的管理和科学的考核体系&#xff0c;实现了持续的创新和发展。通过引进先进的管理模式&#xff0c;强调以客户需求为导向&#xff0c;华为不仅优化了技术管理和项目研发流程&a…...

Perl(Practical Extraction and Reporting Language)脚本

Perl&#xff08;Practical Extraction and Reporting Language&#xff09;是一种非常灵活的脚本语言&#xff0c;主要用于文本处理、系统管理以及快速原型开发等领域。Perl 脚本可以用来执行一系列任务&#xff0c;包括文件操作、网络通信、数据处理等。 下面是一些关于编写…...

单例模式详细

文章目录 单例模式介绍八种方式1、饿汉式&#xff08;静态常量&#xff09;2、饿汉式&#xff08;静态代码块&#xff09;3、懒汉式&#xff08;线程不安全&#xff09;4、懒汉式&#xff08;线程安全&#xff0c;同步方法&#xff09;5、懒汉式&#xff08;线程不安全&#xf…...

Unity3D 自定义窗口

Unity3D 自定义窗口的实现。 自定义窗口 Unity3D 可以通过编写代码&#xff0c;扩展编辑器的菜单栏和窗口。 简单的功能可以直接一个菜单按钮实现&#xff0c;复杂的功能就需要绘制一个窗口展示更多的信息。 编辑器扩展的脚本&#xff0c;需要放在 Editor 文件夹中。 菜单栏…...

dubbo:dubbo整合nacos实现服务注册中心、配置中心(二)

文章目录 0. 引言1. nacos简介及安装2. 注册中心实现3. 配置中心实现4. 源码5. 总结 0. 引言 之前我们讲解的是dubbozookeeper体系来实现微服务框架&#xff0c;但相对zookeeper很多企业在使用nacos, 并且nacos和dubbo都是阿里出品&#xff0c;所以具备一些天生的契合性&#…...

个人博客指路

Pudding 个人博客 比较懒&#xff0c;直接 github page 了&#xff0c;没国内代理加速。 欢迎大佬们&#xff0c;踩一踩 没做留言&#xff0c;觉得很鸡肋。有问题可以在本文底下评论、或者直接邮件...

【STM32 HAL】多串口printf重定向

【STM32 HAL】多串口printf重定向 前言单串口printf重定向原理实现CubeMX配置Keil5配置 多串口printf重定向 前言 在近期项目中&#xff0c;作者需要 STM32 同时向上位机和手机发送数据&#xff0c;传统的 printf 重定向只能输出到一个串口。本文介绍如何实现 printf 同时输出…...

帆软报表,达梦数据库驱动上传失败

1、按照正常操作新建数据库连接&#xff0c;上传准备好的达梦驱动时&#xff0c;提示如图一需要修改SystemConfig.driverUpload为true才可以。 2、FineDB存储了数据决策系统中除平台属性配置以外的所有信息。详情请参见&#xff1a; FineDB 数据库简介。 3、因此管理员可通过…...

CSS选择器的优先级是如何确定的?有哪些方法可以提高选择器的效率?

CSS选择器的优先级是如何确定的&#xff1f; CSS选择器的优先级决定了当多个选择器同时应用于一个元素时&#xff0c;哪个选择器将最终生效。CSS选择器的优先级由多个因素决定&#xff0c;主要包括以下几个方面&#xff1a; 特殊性&#xff08;Specificity&#xff09; 特殊性…...

【MySQL】基础入门(第二篇)

1.MySQL基本数据类型 数值类型 MySQL 支持所有标准 SQL 数值数据类型。 这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL 和 NUMERIC)&#xff0c;以及近似数值数据类型(FLOAT、REAL 和 DOUBLE PRECISION)。 关键字INT是INTEGER的同义词&#xff0c;关键字DEC是D…...

勇闯机器学习(第二关-数据集使用)

以下内容&#xff0c;皆为原创&#xff0c;重在无私分享高质量知识&#xff0c;制作实属不易&#xff0c;请点点关注。 好戏开场了~~~(这关涉及到了加载数据集的代码&#xff0c;下一关&#xff0c;教你们安装机器学习库) 一.数据集 这一关的目标 知道数据集被分为训练集和测…...

数据库学习(进阶)

数据库学习&#xff08;进阶&#xff09; Mysql结构:连接层&#xff1a;服务层&#xff08;核心层&#xff09;&#xff1a;存储引擎层&#xff1a;系统文件层&#xff1a; 存储引擎&#xff08;概述&#xff09;:存储引擎特点&#xff1a;InnoDB存储引擎&#xff1a;(为并发条…...

redis的数据结构——跳表(Skiplist)

跳表(Skiplist)是一种用于有序数据存储的高效数据结构,它在Redis中用于实现有序集合(Sorted Set,zset)的底层存储。当有序集合中的数据较多时,Redis会选择使用跳表来存储元素,以便在保持数据有序的同时提供高效的插入、删除、查找操作。 跳表的基本结构 跳表是一种多…...

Docker服务迁移

1 备份当前服务器上的 Docker 数据 1.1 停止 Docker 服务 为了确保数据一致性&#xff0c;在备份之前先停止 Docker 服务&#xff1a; sudo systemctl stop docker1.2 备份 Docker 数据 Docker 的数据通常位于 /var/lib/docker 目录。你可以使用 tar 命令将该目录压缩成一个…...

机器学习:逻辑回归实现下采样和过采样

1、概述 逻辑回归本身是一种分类算法&#xff0c;它并不涉及下采样或过采样操作。然而&#xff0c;在处理不平衡数据集时&#xff0c;这些技术经常被用来改善模型的性能。下采样和过采样是两种常用的处理不平衡数据集的方法。 2、下采样 1、概念 下采样是通过减少数量较多的类…...

React原理之Fiber双缓冲

前置文章&#xff1a; React原理之 React 整体架构解读React原理之整体渲染流程React原理之Fiber详解 -----读懂这一篇需要对 React 整体架构和渲染流程有大致的概念 &#x1f60a;----- 在前面的文章中&#xff0c;简单介绍了 Fiber 架构&#xff0c;也了解了 Fiber 节点的…...

机器学习笔记三-检测异常值

检测异常值是数据预处理中非常重要的一步&#xff0c;因为异常值可能会影响模型的训练效果&#xff0c;甚至导致错误的结论。以下是几种常见的检测异常值的方法&#xff1a; 1. 箱线图&#xff08;Box Plot&#xff09;&#xff1a; 箱线图是一种简单的统计图形&#xff0c;可…...

如何评估Redis的性能

导语 Redis是一款高性能的内存数据库&#xff0c;被广泛用于缓存、持久化、消息队列等各种场景。为了确保Redis的高性能运行&#xff0c;评估Redis的性能是非常重要的。本文将介绍如何评估Redis的性能&#xff0c;并从问题解决的角度探讨如何优化Redis的性能。 1. 性能评估指…...