LuaJIT Garbage Collector Algorithms
Explain
本篇文章是对Make Pall发表wili内容《LuaJIT 3.0 new Garbage Collector》的翻译和扩展,因为原文是对LuaJIT 2.x GC重要功能的简介和对LuaJIT 3.0 new GC的工作计划,所以它并不是系统性介绍GC的文章。希望以后能有精力系统性的对LuaJIT 2.x GC做个总结。
到目前(2025-1-17)为止,LuaJIT 3.0尚未发布。看Make列的3.0 plan,其中优化了很多功能,非常值得期待。但他也说了,3.0有可能永远不会发布,这将是非常遗憾的一件事情。
一、Two-Color Mark & Sweep
Two-Color Mark & Sweep 是标记-清除算法的简化版本,使用两种颜色(白色和黑色)来表示对象的状态:
- 白色对象:表示未被访问的对象,默认情况下所有新分配的对象都是白色。如果一个对象在垃圾回收周期中结束时仍然是白色,说明它是不可达的,可以被回收。
- 黑色对象:表示已被标记为可达的对象。黑色对象不会被清除,并会在清除阶段颜色翻转为白色以便参与下一个 GC 周期。
1.1 GC流程
标记阶段(Mark Phase)从 GC 根(例如,主线程,全局变量等)开始,迭代遍历所有可达(live)对象,并将它们标记为黑色。待标记完成,没有被标记为黑色的对象都被视为无法访问,即死对象。
清除阶段(Sweep Phase)遍历所有内存中的对象:如果对象为白色,则认为其是死对象,将其释放;如果对象为黑色,则认为其可达,将颜色翻转为白色,准备参与下一次GC。

1.2 主要缺点
该算法的主要缺点是非增量式(non-incremental),整个垃圾回收过程必须一次性完成,程序代码(mutator,指运行中的程序)无法与垃圾回收器并行执行。即回收操作是原子性的,需要完全暂停程序运行,这种暂停称为 Stop-the-world(STW),会导致程序响应延迟,特别是当内存中有大量对象时,暂停时间可能很长。
这种回收方式不适合实时系统或对响应时间要求高的场景,例如游戏或用户界面。
1.3 优化思路
为了提升效率和降低开销,算法中可以引入一些优化,例如:
- 交换颜色的意义:在每次垃圾回收结束后,反转白色和黑色的定义。例如,将“黑色”定义为“未访问”,将“白色”定义为“可达”。这样可以避免在清除阶段对黑色对象的颜色翻转操作,减少额外的步骤。
- 增量式改进:尽管基础算法是非增量式的,但可以通过引入写屏障(Write Barrier)等机制改进为增量式标记。
1.4 应用实例
Lua 5.0 使用了 Two-Color Mark & Sweep 算法,具有以下特点:
- 对象存储结构:所有对象都存储在一个链表中。这种设计的优点是方便遍历内存中的所有对象,缺点是访问速度较慢。
- 标记列表(Mark List):在标记阶段,将需要遍历的对象放入一个独立的标记列表。这样可以加速标记阶段中对对象的处理,同时避免重复标记。
- 内存回收效率:Lua 5.0 的 GC 虽然简单,但由于设计目标是轻量级脚本语言,这种算法在小型脚本的场景中表现较好。
二、Tri-Color Incremental Mark & Sweep
Two-Color Mark & Sweep是 全停顿(Stop-the-world,STW) 的算法,会导致程序在垃圾回收时暂停。为了减少暂停时间,增量式垃圾回收 (Incremental GC)被提出, Tri-Color Marking则是其一种常用的技术。
Tri-Color Incremental是 Lua 5.1/5.2 和 LuaJIT 1.x/2.x 使用的 GC 算法,它是 Lua 5.0 链表算法的增强版。
Tri-Color Incremental Mark & Sweep 用三种颜色(白色、灰色、黑色)来区分对象的状态,三种颜色的定义如下:
- 白色(White):表示未访问的对象。在标记阶段开始时,所有的对象都被标记为白色。如果某个对象在整个标记阶段结束后仍然是白色,则说明该对象是不可达的垃圾,可以被回收。
- 灰色(Gray):表示已被标记,但未处理其引用对象的对象。意味着当前对象是可达的,但它可能引用其他未处理的对象。
- 黑色(Black):表示已被标记并且其引用对象也被处理完毕的对象。意味着该对象和它的引用对象都是可达的,无需再次处理。
2.1 GC流程
任何时刻新分配的对象都被标记为白色。
标记阶段,垃圾回收器从GC根(GCroots)开始,遇到一个可达的对象,将其颜色从白色变为灰色,并将其加入灰色栈(graystack,或重新链入灰色列表)。灰色栈中的对象会被逐一迭代处理,每次从栈中移除一个灰色对象,遍历灰色对象的所有引用,将其引用的对象标记为灰色,并将灰色对象加入灰色栈中。一个对象的所有引用遍历完成后,将其颜色会灰色变为黑色。
清除阶段与前面提到的Two-Color算法类似。遍历所有内存中的对象:如果对象为白色,则认为其是死对象,将其释放;如果对象为黑色,则认为其可达,将颜色翻转为白色,准备参与下一次GC。

2.2 增量式(Incremental)
为了避免一次性完成垃圾回收而导致程序长时间暂停,Tri-Color 标记算法可以增量执行。垃圾回收器采用分段标记,一次只处理少量灰色对象,然后将控制权交还给应用程序(mutator)。
这种方式将垃圾回收暂停分散为许多短间隔,特别适合对交互性要求高的场景(例如游戏或互联网服务器)。
增量式GC存在黑色对象引用白色对象的问题。在增量过程中,mutator可能在回收器工作时,创建一个新的标记为白色的对象,并将白色对象(未处理)存储到一个黑色对象(已处理)中。如果发生这种情况,这个白色对象不会被标记为可达对象,而是在清除阶段被错误地回收,即使它实际上可以从一个可达对象中访问到。
对于此问题的解决方法,是维护三色不变性(Tri-ColorInvariant),GC必须满足以下两个不变性之一:
- 强三色不变性(Strong Tri-Color Invariant):黑色对象不能直接引用白色对象。如果存在这种情况,白色对象可能会被错误地认为是不可达的,从而被误回收。
- 弱三色不变性(Weak Tri-Color Invariant):黑色对象可以直接引用白色对象,但要求该白色对象必须存在其他灰色对象对它的引用,或者它的可达链路上游存在灰色对象。
通过插入屏障(Insertion Barrier)机制来实现。当对象A引用对象B时,如果对象B是白色,则将其标记为灰色,从而避免黑色对象直接引用白色对象。
2.3 写屏障(Write Barrier)
如果mutator在增量执行中破坏了三色不变性(如添加了新的引用),需要通过写屏障(Write Barrier)来修复。
写屏障(Write Barrier)在每次写操作后检查是否违反了三色不变性,如果发现不变性被破坏,需要采取修复操作。有两种修复方式:
- 后向屏障(Backward Barrier):将黑色对象重新变为灰色,并将其重新加入灰色栈中,以便稍后重新处理。优点:对于需频繁写入(例如容器对象)的对象,可以减少对相同对象的后续屏障检查。
- 前向屏障(Forward Barrier):立即将白色对象标记为灰色,并将其加入灰色栈中。优点:可以推动垃圾回收向前运行,适用于只进行孤立写操作的对象。
Lua 5.1/5.2 和 LuaJIT 1.x/2.x对Tables使用后向屏障,所有其他可遍历对象使用前向屏障。
LuaJIT 2.x 通过只检查标记黑色的table(忽略存储对象的颜色)进一步优化了table的写屏障。这样检查速度更快,而且仍然安全:写屏障可能会更频繁地触发,但这没有坏处。而且这在实践中并不重要,因为 GC 周期进展非常快,中间有较长的暂停,所以对象很少是黑色的。而且,存储的对象通常都是白色的。
以下是Mike Pall对LuaJIT中写屏障的一些介绍:
写屏障只需检查存储到其中的对象的灰色位(gray bit)。这是一个非常快速的测试,并且只有在未设置灰色位时才会触发(这种情况很少见)。
如果触发了写屏障,白色对象将变为浅灰色(light-gray),黑色对象将变为深灰色(dark-gray),深灰色对象还会被推送到快速顺序存储缓冲区 (sequential store buffer,SSB) 上。
浅灰色对象不需要推送到 SSB,但这需要检查标记位。如果触发屏障的性能成为问题,则可以避免这种情况。可以改为对 SSB 溢出进行检查。当收集器暂停时,可以完全避免检查标记位,因为不可能有任何黑色对象。
2.4 重要优化
程序堆栈(Stacks)始终保持为灰色,并在清除阶段之前重新遍历。这样可以避免对堆栈插槽的写入使用写屏障(堆栈插槽是写入操作最频繁的地方)。
没有对子对象的引用的对象可以立即从白色变为黑色,而不需要经过灰色堆栈。
可以通过使用两个白色并在进入清除阶段之前在它们之间翻转来使清除阶段成为增量。需要保留具有“current”白色的对象。只有具有“other”白色的对象才应该被释放。
三、Quad-Color Optimized Incremental Mark & Sweep

四、Generational GC
相关文章:
LuaJIT Garbage Collector Algorithms
Explain 本篇文章是对Make Pall发表wili内容《LuaJIT 3.0 new Garbage Collector》的翻译和扩展,因为原文是对LuaJIT 2.x GC重要功能的简介和对LuaJIT 3.0 new GC的工作计划,所以它并不是系统性介绍GC的文章。希望以后能有精力系统性的对LuaJIT 2.x GC做…...
go采集注册表
package mainimport ("fmt""golang.org/x/sys/windows/registry""log""os""strconv""strings" )func USBSTOR_Enum() {// 打开注册表键keyPath : SYSTEM\CurrentControlSet\Services\USBSTOR\Enumk, err : regist…...
软件工程师欧以宁:引领无人机导航与物联网安全的技术革新
在科技日新月异的今天,软件工程师欧以宁凭借卓越的技术能力和前瞻性的创新思维,成为了无人机自主导航和物联网安全领域的佼佼者。作为一名深耕技术前沿的专家,欧以宁不仅推动了无人机导航技术的突破性进展,还为智能家居和物联网的安全架构提供了全新的解决方案。她的研究成果,以…...
从零开始:Gitee 仓库创建与 Git 配置指南
引言 Git 是一款广泛使用的版本控制工具,它能够帮助开发者在开发过程中高效地管理代码的版本。而 Gitee(码云)是国内知名的 Git 托管平台,它提供了强大的代码托管、团队协作和项目管理功能。如果你是 Git 和 Gitee 的新手&#x…...
浅谈计算机网络02 | SDN控制平面
计算机网络控制平面 一、现代计算机网络控制平面概述1.1 与数据平面、管理平面的关系1.2 控制平面的发展历程 二、控制平面的关键技术剖析2.1 网络层协议2.1.1 OSPF协议2.1.2 BGP协议 2.2 SDN控制平面技术2.2.1 SDN架构与原理2.2.2 OpenFlow协议2.2.3 SDN控制器 一、现代计算机…...
在 QNAP NAS中使用 Container Station 运行 Docker 的完整指南
QNAP 为用户提供了一个名为 Container Station 的应用,它在 QNAP NAS 上将 Docker 和 LXC 结合在一起,通过图形化界面,让用户更轻松地在 NAS 上管理容器。本文将带你一步步了解如何在 QNAP NAS 上安装和使用 Container Station,以…...
XML在线格式化 - 加菲工具
XML在线格式化 打开网站 加菲工具 选择“XML 在线格式化” 输入XML,点击左上角的“格式化”按钮 得到格式化后的结果...
大数据学习(34)-mapreduce详解
&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦ᾑ…...
代码合并冲突解决push不上去的问题
环境:【IntelliJ IDEA】 【Gerrit】 1、错误信息 代码合并,迭代1合并到迭代2,解决冲突后,依然push不上去,报错信息如下: remote: Processing changes: refs: 1 remote: Processing changes: refs…...
万字长文介绍ARINC 653,以及在综合模块化航空电子设备(IMA)中的作用
文章目录 一、引言二、ARINC 653背景三、整体系统架构四、应用/执行(APEX)接口五、ARINC 653 RTOS内部机制六、健康监测功能七、软件应用八、ARINC 653现状九、总结 一、引言 在现代航空领域,综合模块化航空电子设备(IMA…...
MySQL 与 Redis 数据一致性 2
1. 强一致还是最终一致?2. 先写 MySQL 还是先写Redis?case 1 3. 缓存(Redis)更新还是清除?更新策略更新策略会有数据不一致问题?数据不一致的概率与影响如果使用监听binlog更新数据还会出现数据不一致问题?binlog的消费问题 使用消息队列行不行?其他方案总结: 数据不一致…...
MySQL程序之:使用类似URI的字符串或键值对连接到服务器
本节介绍使用类似URI的连接字符串或键值对来指定如何为MySQLShell等客户端建立到MySQL服务器的连接。 以下MySQL客户端支持使用类似URI的连接字符串或键值对连接到MySQL服务器: MySQL Shell实现X DevAPI的MySQL连接器 本节记录了所有有效的类似URI的字符串和键值…...
Docker私有仓库管理工具Registry
Docker私有仓库管理工具Registry 1 介绍 Registry是私有Docker仓库管理工具,Registry没有可视化管理页面和完备的管理策略。可借助Harbor、docker-registry-browser完成可视化和管理。Harbor是由VMware开发的企业级Docker registry服务。docker-registry-browser是…...
若依前后端分离项目部署(使用docker)
文章目录 一、搭建后端1.1 搭建流程:1.2 后端零件:1.2.1 mysql容器创建:1.2.2 redis容器创建:1.2.3 Dockerfile内容:1.2.4 构建项目镜像:1.2.5 创建后端容器: 二、前端搭建:2.1 搭建流程&#x…...
Unity2021.3.13崩溃的一种情况
如果出现如下的报错,可能是软件冲突的原因。自己的原因是使用f.lux这款软件似乎和Unity相互冲突,出现下面报错。 错误信息如上图...
Temp123
MapDB:的持久化机制,以及源码分析和摘取 1、spark streaming--struct streaming 基于 时间间隔 攒批 2、kafka-connect-hdfs 控制 flush.size 和 interval.ms控制 攒批 - 完全自研 攒批机制 - 使用 embeded 版 https://lxblog.com/qianwen/share?shar…...
春秋杯-WEB
SSTI 可以看到主页那里有个登录测试之后为ssti {{4*4}} fenjing梭哈即可得到payload {{((g.pop.__globals__.__builtins__.__import__(os)).popen(cat flag)).read()}}file_copy 看到题目名字为file_copy, 当输入路径时会返回目标文件的大小, 通…...
JavaEE:多线程初阶
JavaEE:多线程初阶 一、线程的原理和进程与线程之间的关系1. 线程的原理线程的基本概念线程的生命周期线程的调度线程的并发与并行 2. 进程与线程的关系进程(Process)线程与进程的关系进程和线程的对比线程的优势线程的缺点 3. 总结 二、多线…...
Linux之文件系统前世今生(一)
Linux在线1 Linux在线2 一、 基本概念 1.1 块(Block) 在计算机存储之图解机械硬盘这篇文章中我们提到过,磁盘读写的最小单位是扇区,也就是 512 Byte;很明显,每次读写的效率非常低。 为了提高IO效率&…...
当设置dialog中有el-table时,并设置el-table区域的滚动,看到el-table中多了一条横线
问题:当设置dialog中有el-table时,并设置el-table区域的滚动,看到el-table中多了一条横线; 原因:el-table有一个before的伪元素作为表格的下边框下,初始的时候已设置,在滚动的时候并没有重新设置…...
第19节 Node.js Express 框架
Express 是一个为Node.js设计的web开发框架,它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用,和丰富的HTTP工具。 使用Express可以快速地搭建一个完整功能的网站。 Expre…...
Appium+python自动化(十六)- ADB命令
简介 Android 调试桥(adb)是多种用途的工具,该工具可以帮助你你管理设备或模拟器 的状态。 adb ( Android Debug Bridge)是一个通用命令行工具,其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利,如安装和调试…...
MongoDB学习和应用(高效的非关系型数据库)
一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...
【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表
1、行为树节点分类 在 Nav2(Navigation2)的行为树框架中,行为树节点插件按照功能分为 Action(动作节点)、Condition(条件节点)、Control(控制节点) 和 Decorator(装饰节点) 四类。 1.1 动作节点 Action 执行具体的机器人操作或任务,直接与硬件、传感器或外部系统…...
postgresql|数据库|只读用户的创建和删除(备忘)
CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...
C++ 基础特性深度解析
目录 引言 一、命名空间(namespace) C 中的命名空间 与 C 语言的对比 二、缺省参数 C 中的缺省参数 与 C 语言的对比 三、引用(reference) C 中的引用 与 C 语言的对比 四、inline(内联函数…...
Matlab | matlab常用命令总结
常用命令 一、 基础操作与环境二、 矩阵与数组操作(核心)三、 绘图与可视化四、 编程与控制流五、 符号计算 (Symbolic Math Toolbox)六、 文件与数据 I/O七、 常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结,涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...
Pinocchio 库详解及其在足式机器人上的应用
Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...
视频行为标注工具BehaviLabel(源码+使用介绍+Windows.Exe版本)
前言: 最近在做行为检测相关的模型,用的是时空图卷积网络(STGCN),但原有kinetic-400数据集数据质量较低,需要进行细粒度的标注,同时粗略搜了下已有开源工具基本都集中于图像分割这块,…...
Yolov8 目标检测蒸馏学习记录
yolov8系列模型蒸馏基本流程,代码下载:这里本人提交了一个demo:djdll/Yolov8_Distillation: Yolov8轻量化_蒸馏代码实现 在轻量化模型设计中,**知识蒸馏(Knowledge Distillation)**被广泛应用,作为提升模型…...
