当前位置: 首页 > news >正文

【Linux系统】Ubuntu 缓冲区机制

在Ubuntu中,和其他操作系统有个不一样的机制:缓冲区。这篇文章是对与缓冲区的详细介绍。

在 Ubuntu 中(以及其他基于 Linux 的操作系统),缓冲区(Buffer)是内核用于优化 I/O 操作的重要机制。它通过在内存中暂存数据,减少对磁盘等慢速设备的直接访问,从而提升系统性能。缓冲区机制主要涉及 缓存(Cache)缓冲(Buffer) 两个核心概念。以下是 Ubuntu 缓冲区机制的详细介绍,包括其原理、分类和工作机制。

缓冲与缓存的区别

在 Linux 系统中,缓冲区和缓存是两个相关但不同的概念:

  1. 缓冲(Buffer)
    缓冲是指内核用于 写入操作 的数据暂存区。当数据从内存写入到磁盘或其他外设时,系统会先将数据存储到缓冲区中,然后批量写入到磁盘,以减少磁盘 I/O 操作的频率。

这么做可以优化写入性能。减少磁盘的物理写入次数,延长磁盘寿命。
缓冲主要用于 写操作。数据通常是即将写入磁盘或外设的数据。

  1. 缓存(Cache)
    缓存是指内核用于 读取操作 的数据暂存区。当数据从磁盘读取到内存时,系统会将数据存储到缓存中,以便后续访问时可以直接从内存读取,而不必再次访问磁盘。

这么做能够提高读取性能。减少磁盘的读取次数,提高系统响应速度。
缓存主要用于 读操作。数据通常是最近读取的数据。

特性缓冲(Buffer)缓存(Cache)
主要用途写操作优化读操作优化
数据来源用户空间即将写入磁盘的数据从磁盘读取到内存的数据
目标设备磁盘或其他外设内存
生命周期数据写入磁盘后清除数据可能会保留一段时间,直到被替换
Ubuntu 缓冲区的工作机制

Ubuntu 和其他 Linux 系统的缓冲区机制由内核管理,主要通过以下机制实现:

页缓存(Page Cache)
页缓存是 Linux 文件系统中的核心组件,用于在内存中缓存磁盘上的文件数据。当文件被读取时,数据会被加载到页缓存中。如果后续访问相同的数据,则直接从页缓存中读取,而无需再次访问磁盘。

页缓存的工作流程:

  1. 用户请求读取文件。
  2. 内核检查页缓存中是否已有该文件的数据。
    • 如果存在,直接从页缓存读取(称为 缓存命中)。
    • 如果不存在,从磁盘加载文件数据到页缓存,然后返回给用户(称为 缓存未命中)。
  3. 页缓存中的数据会根据内存压力和访问频率被替换。

页缓存的优点:① 提升文件读取性能。② 减少磁盘读取次数。

写缓冲(Write Buffering)
写缓冲用于暂存用户写入的数据。数据先写入到缓冲区中,稍后再批量写入磁盘(称为 “延迟写入”)。写缓冲通过减少频繁的小写操作来优化磁盘性能。

写缓冲的工作流程:

  1. 用户请求写入文件。
  2. 数据首先写入到内核缓冲区(内存中)。
  3. 内核根据调度策略(如延迟写入或同步写入),将缓冲区数据刷入磁盘。
    • 延迟写入:数据在缓冲区中保留一段时间,等待批量写入磁盘。
    • 同步写入:立即将缓冲区中的数据写入磁盘。

写缓冲的优点:① 减少磁盘写入次数,提高写入性能。② 延长磁盘寿命。

缓冲区机制的关键技术
  1. 内存管理中的缓冲与缓存
  • Linux 内存分为 内核空间用户空间,缓冲区和缓存主要由内核空间管理。
  • 缓冲区和缓存动态占用内存,内核会根据内存压力调整缓冲区和缓存的大小。
  1. 脏页(Dirty Pages)
  • 当缓存中的数据被修改而尚未写入磁盘时,这些数据被称为 脏页
  • 内核通过 脏页回写机制 将脏页中的数据写入磁盘:
    • pdflush 线程(旧版本 Linux)或 writeback 子系统管理脏页回写。
    • 回写触发条件:
      • 缓冲区达到一定比例。
      • 超过预设的延迟写入时间。
  1. 文件系统缓冲区
  • 文件系统(如 ext4xfs)在底层实现了块缓冲区,用于管理对磁盘块的访问。
  • 块缓冲区和页缓存协作工作,进一步优化 I/O 性能。
查看和管理缓冲区

在 Ubuntu 中,可以通过以下工具查看和管理缓冲区的使用情况:
1. 查看内存中的缓冲和缓存
使用 free 命令:

free -h

输出:

total        used        free      shared   buff/cache   available
Mem:         7.8G        3.2G       2.1G       200M        2.5G         4.0G
Swap:        2.0G          0B       2.0G
  • buff/cache:表示缓冲区和缓存占用的内存。
  • available:表示可用内存,包括未使用的内存和可回收的缓冲区/缓存。

2. 查看页缓存和脏页
使用 vmstat 命令:

vmstat -a

输出:

procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa1  0      0  2156M   105M  2432M    0    0    10    15   45   60  2  1 97  0
  • buff:缓冲区使用的内存。
  • cache:缓存使用的内存。

3. 手动释放缓冲区和缓存
在某些情况下(如内存压力过大),可以手动清理缓冲区和缓存:

sudo sync          # 同步数据到磁盘
sudo echo 3 > /proc/sys/vm/drop_caches
  • /proc/sys/vm/drop_caches 的值:
    • 1:释放页缓存。
    • 2:释放 目录树inode 缓存
    • 3:同时释放 页缓存目录树/inode 缓存
缓冲区的性能优化

1. 文件系统优化

  • 使用支持日志功能的文件系统(如 ext4xfs)提高写入可靠性。
  • 调整文件系统挂载选项:
    • noatime:禁用访问时间更新,减少 I/O。
    • data=writeback:加速写入操作。

2. 调整内核参数
通过调整内核参数优化缓冲区性能:

sudo sysctl -w vm.dirty_background_ratio=10    # 设置后台回写的阈值
sudo sysctl -w vm.dirty_ratio=20               # 设置脏页占内存的最大比例
sudo sysctl -w vm.dirty_writeback_centisecs=500 # 设置脏页回写间隔

3. 使用异步 I/O
在高性能场景中,使用异步 I/O(如 aio)减少阻塞,提高 I/O 并发能力。

缓冲区中的常见问题与解决方案

缓冲区占用内存过多:
缓冲区和缓存占用了大量内存,导致用户态程序可用内存减少。

  • 解决方案:
    • 手动释放缓存(echo 3 > /proc/sys/vm/drop_caches)。
    • 调整内核缓冲区参数(如 vm.dirty_ratio)。

缓冲区写入延迟:
延迟写入机制导致数据未及时同步到磁盘,可能引发数据丢失。

  • 解决方案:
    • 使用同步写入(fsync 或挂载 sync 选项)。
    • 增加 vm.dirty_background_ratio 的值,提前触发回写。

综上。Ubuntu 的缓冲区机制(缓冲和缓存)在 Linux 内核中发挥了重要作用,为系统提供了优化磁盘 I/O 性能的手段:

  1. 缓冲区(Buffer):优化写入操作。
  2. 缓存(Cache):优化读取操作。
  3. 动态管理:缓冲区和缓存根据实际内存使用情况动态调整,提升系统性能。

理解缓冲区的价值:通过了解缓冲区的工作原理、配置参数和性能优化方法,可以更好地管理 Ubuntu 系统的内存和存储资源。

以上。仅供学习与分享交流,请勿用于商业用途!转载需提前说明。

我是一个十分热爱技术的程序员,希望这篇文章能够对您有帮助,也希望认识更多热爱程序开发的小伙伴。
感谢!

相关文章:

【Linux系统】Ubuntu 缓冲区机制

在Ubuntu中,和其他操作系统有个不一样的机制:缓冲区。这篇文章是对与缓冲区的详细介绍。 在 Ubuntu 中(以及其他基于 Linux 的操作系统),缓冲区(Buffer)是内核用于优化 I/O 操作的重要机制。它…...

ChatGPT 最新推出的 Pro 订阅计划,具备哪些能力 ?

OpenAI 最近推出了 ChatGPT Pro,这是一个每月收费 200 美元的高级订阅计划,旨在为用户提供对 OpenAI 最先进模型和功能的高级访问。 以下是 ChatGPT Pro 的主要功能和能力: 高级模型访问: o1 模型:包括 o1 和 o1 Pro…...

数据结构理论

内容来源青岛大学数据结构与算法课程,链接:数据结构与算法基础(青岛大学-王卓)_哔哩哔哩_bilibili 绪论 数据结构概述 数据结构和算法的定义:我们如何把现实中大量而复杂的问题以特定的数据类型和特定的存储结构保存…...

es 3期 第14节-全文文本分词查询

#### 1.Elasticsearch是数据库,不是普通的Java应用程序,传统数据库需要的硬件资源同样需要,提升性能最有效的就是升级硬件。 #### 2.Elasticsearch是文档型数据库,不是关系型数据库,不具备严格的ACID事务特性&#xff…...

六安市第二届网络安全大赛复现

misc 听说你也喜欢俄罗斯方块? ppt拼接之后 缺三个角补上 flag{qfnh_wergh_wqef} 流量分析 流量包分离出来一个压缩包 出来一张图片 黑色代表0白色代表1 101010 1000 rab 反的压缩包 转一下 密码:拾叁拾陆叁拾贰陆拾肆 密文:4p4n5758…...

Sarcomere仿人灵巧手ARTUS,20个自由度拓宽机器人作业边界

Sarcomere Dynamics 是一家深度技术先驱,通过开发和商业化仿人机械来改变机器人行业。专注于为科研人员,系统集成商和制造商提供更实惠、更轻便且更灵活的末端执行器替代品。凭借创新的致动器技术,创造了一款紧凑、轻便且非常坚固的机械手Art…...

Django drf 基于serializers 快速使用

1. 安装: pip install djangorestframework 2. 添加rest_framework到您的INSTALLED_APPS设置。 settings.pyINSTALLED_APPS [...rest_framework, ] 3. 定义模型 models.pyfrom django.db import modelsclass BookModel(models.Model):name models.CharField(max_length64)…...

pycharm集成环境中关于安装sklearn库报错问题分析及解决

在输入pip install sklearn后,出现如下提示: pip install sklearn Collecting sklearn Using cached sklearn-0.0.post12.tar.gz (2.6 kB) Installing build dependencies ... done Getting requirements to build wheel ... error error: subprocess-…...

AI - 浅聊一下基于LangChain的AI Agent

AI - 浅聊一下基于LangChain的AI Agent 大家好,今天我们来聊聊一个很有意思的主题: AI Agent ,就是目前非常流行的所谓的AI智能体。AI的发展日新月异,都2024年末了,如果此时小伙伴们对这个非常火的概念还不清楚的话&a…...

《【Linux】深入理解进程管理与 fork 系统调用的实现原理》

一、引言 在 Linux 操作系统中,进程管理是核心功能之一。进程是操作系统进行资源分配和调度的基本单位。理解进程管理的原理以及 fork 系统调用的实现对于深入掌握 Linux 系统的运行机制至关重要。本文将深入探讨 Linux 中的进程管理以及 fork 系统调用的实现原理&a…...

docker-compose部署skywalking 8.1.0

一、下载镜像 #注意 skywalking-oap-server和skywalking java agent版本强关联,版本需要保持一致性 docker pull elasticsearch:7.9.0 docker pull apache/skywalking-oap-server:8.1.0-es7 docker pull apache/skywalking-ui:8.1.0二、部署文件docker-compose.yam…...

AI 总结的的 AI 学习路线

一、入门阶段:数学基础与编程语言 数学基础 线性代数 当年白纸黑字推演, 都是泪啊,草稿本都用了一卷。 学习向量、矩阵的基本概念,包括向量的加法、减法、点积和叉积,矩阵的乘法、转置等运算。例如,在计算…...

离散傅里叶级数(DFS)详解

1. 引言 离散傅里叶级数(Discrete Fourier Series, DFS)是信号处理领域中一项基础且重要的数学工具,用于分析和处理周期性的离散信号。它通过将离散时间信号表示为一组正弦和余弦的和,从而使得信号在频域上得到更清晰的描述。与连…...

Java 类加载机制详解

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…...

1.1 Beginner Level学习之“编写简单的发布服务器和订阅服务器”(第十一节)

学习大纲: 1. 编写发布服务器节点 在 ROS 中,节点是连接到 ROS 网络的可执行文件。我创建了一个名为 talker 的发布者节点,它会向一个主题 chatter 不断发送消息。 首先,进入你的工作包 beginner_tutorials(假设你已…...

AIQuora:开启论文写作新篇章

在这个信息爆炸的时代,学术写作已成为研究者不可或缺的技能。然而,面对繁重的写作任务,许多学者和学生常常感到力不从心。AIQuora,一个专业的文理工科论文智能写作助手,以其免费开题报告生成功能,为学术写作…...

【C语言】库函数常见的陷阱与缺陷(1):字符串处理函数

目录 一、 strcpy 函数 1.1. 功能与常见用法 1.2. 陷阱与缺陷 1.3. 安全替代 1.4. 代码示例 二、strcat 函数 2.1. 功能与常见用法 2.2. 陷阱与缺陷 2.3. 安全替代 2.4. 代码示例 三、strcmp 函数 3.1. 功能与常见用法 3.2. 陷阱与缺陷 3.3. 安全替代 3.4. 代…...

Mysql索引原理及优化——岁月云实战笔记

根据Mysql索引原理及优化这个博主的视频学习,对现在的岁月云项目中mysql进行优化,我要向这个博主致敬,之前应用居多,理论所知甚少,于是将学习到东西,应用下来,看看是否有好的改观。 1 索引原理…...

AGCRN论文解读

一、创新点 传统GCN只能基于静态预定义图建模全局共享模式,而AGCRN通过两种GCN的增强模块(NAPL、DAGG)实现了更精细的节点特性学习和图结构生成。 1 节点自适应参数学习模块(NAPL) 传统GCN通过共享参数(权重…...

Python机器学习笔记(五、决策树集成)

集成(ensemble)是合并多个机器学习模型来构建更强大模型的方法。这里主要学习两种集成模型:一是随机森林(random forest);二是梯度提升决策树(gradient boosted decision tree)。 1…...

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向: 逆向设计 通过神经网络快速预测微纳结构的光学响应,替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...

docker详细操作--未完待续

docker介绍 docker官网: Docker:加速容器应用程序开发 harbor官网:Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台,用于将应用程序及其依赖项(如库、运行时环…...

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版​分享

平时用 iPhone 的时候&#xff0c;难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵&#xff0c;或者买了二手 iPhone 却被原来的 iCloud 账号锁住&#xff0c;这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义,在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容,其实不管是方块还是方块实体,都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器,用于动态创…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上&#xff0c;看到基于小智 AI DIY 玩具的演示&#xff0c;感觉有点意思&#xff0c;想着自己也来试试。 如果只是想烧录现成的固件&#xff0c;乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外&#xff0c;还提供了基于网页版的 ESP LA…...

Linux离线(zip方式)安装docker

目录 基础信息操作系统信息docker信息 安装实例安装步骤示例 遇到的问题问题1&#xff1a;修改默认工作路径启动失败问题2 找不到对应组 基础信息 操作系统信息 OS版本&#xff1a;CentOS 7 64位 内核版本&#xff1a;3.10.0 相关命令&#xff1a; uname -rcat /etc/os-rele…...

HybridVLA——让单一LLM同时具备扩散和自回归动作预测能力:训练时既扩散也回归,但推理时则扩散

前言 如上一篇文章《dexcap升级版之DexWild》中的前言部分所说&#xff0c;在叠衣服的过程中&#xff0c;我会带着团队对比各种模型、方法、策略&#xff0c;毕竟针对各个场景始终寻找更优的解决方案&#xff0c;是我个人和我司「七月在线」的职责之一 且个人认为&#xff0c…...

Sklearn 机器学习 缺失值处理 获取填充失值的统计值

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 使用 Scikit-learn 处理缺失值并提取填充统计信息的完整指南 在机器学习项目中,数据清…...

软件工程 期末复习

瀑布模型&#xff1a;计划 螺旋模型&#xff1a;风险低 原型模型: 用户反馈 喷泉模型:代码复用 高内聚 低耦合&#xff1a;模块内部功能紧密 模块之间依赖程度小 高内聚&#xff1a;指的是一个模块内部的功能应该紧密相关。换句话说&#xff0c;一个模块应当只实现单一的功能…...