内存泄漏详解
文章目录
- 什么是内存泄漏
- 内存泄漏的原因
- 排查及解决内存泄漏
- 避免内存泄漏
- 及时释放资源
- 设置合理的变量作用域
- 及时清理不需要的对象
- 避免无限增长
- 避免内部类持有外部类引用
- 使用弱引用
什么是内存泄漏
内存泄漏是指不使用的对象持续占有内存使得内存得不到释放,从而造成内存空间的浪费。严格来说,只有对象不会再被程序用到了,但是GC又不能回收他们的情况,才叫内存泄漏。但实际情况很多时候一些不太好的实践会导致对象的生命周期变得很长,甚至导致00M,也可以叫做宽泛意义上的“内存泄漏”。
举个例子,创建的连接不再使用时,需要调用close方法关闭连接,只有连接被关闭后,GC才会回收对应的对象。忘记关闭这些资源会导致持续占有内存,无法被GC回收。这样就会导致内存泄露,最终导致内存溢出。
public class MemoryLeak {public static void main(String[] args) {try{Connection conn =null;Class.forName("com.mysql.jdbc.Driver");conn =DriverManager.getConnection("url","","");Statement stmt =conn.createStatement();ResultSet rs =stmt.executeQuery("....");} catch(Exception e){//异常日志} finally {// 1.关闭结果集 Statement// 2.关闭声明的对象 ResultSet// 3.关闭连接 Connection}}
}
内存泄漏最明显的问题是频繁GC,从而STW次数增加,导致用户体验变差。如果内存泄露问题严重,会导致OOM,直接导致程序不能正常运行。尽管内存泄漏并不会立刻引起程序崩溃,但是一旦发生内存泄漏,程序中的可用内存就会被逐步蚕食,直至耗尽所有内存,最终出现OutOfMemory异常,导致程序崩溃。
内存泄漏的原因
Java使用可达性分析算法来标记垃圾对象。在这个过程中,算法会标记那些仍然可以从根对象(如栈、静态变量等)直接访问到的对象为“可达”,而那些无法从根对象访问到的对象则标记为“不可达”。不可达的对象是候选垃圾,可以被回收。有时候即使某些对象不再使用,它们的引用链可能仍然存在,导致这些对象没有被标记为不可达,从而造成内存泄漏。在这种情况下,虽然这些对象已经不再被实际使用,但由于引用链未断开,它们仍然占用内存。
大多数内存泄露的原因是,长生命周期的对象引用了短生命周期的对象。例如,A对象引用B对象,A对象的生命周期(t1-t4)比B对象的生命周期(t2-t3)长的多。当B对象没有被应用程序使用之后,A对象仍然在引用着B对象。这样,垃圾回收器就没办法将B对象从内存中移除,从而导致内存泄露问题。
所以减少长生命周期对象持有短生命周期对象的强引用是解决内存泄漏的一个关键点。利用弱引用或者软引用可以让垃圾回收器更容易回收不再需要的对象。对于外部资源,如数据库连接、文件、网络连接,用完后应该及时关闭。try-with-resources语句是管理这些资源的有效工具,同时移除不再需要的事件监听器也能防止内存泄漏。管理集合时,设定大小限制并定期清理过期数据可以避免无限增长。使用有界数据结构能帮助控制缓存的大小。静态集合要特别留意,避免它们占用过多内存,通过定期清理来管理数据的存储。通过这些措施,可以减少内存泄漏的风险。
排查及解决内存泄漏
根据运维之前收集到的内存数据、GC日志尝试判断哪里出现了问题。结果发现老年代的内存使用就算是发生GC也一直居高不下,而且随着时间推移也越来越高。

使用jstat -gc <vmid> 查看GC垃圾回收统计信息,看Full GC后堆空间使用内存还持续增长,且有增长到Xmx设定值的趋势,基本可以肯定存在内存泄露。如果当前完全垃圾回收后内存增长到一个值之后,又能回落,总体上处于一个动态平衡,那么内存泄漏基本可以排除;也可以隔断时间抽取老年代占用内存情况,如果老年代占用情况持续上升也很有可能存在内存泄露的情况。
内存泄漏的主要表象就是内存不足,所以首先要看一下JVM启动参数中内存空间分配是否过小,如果是这种问题调整该参数即可。如果不是参数调的太小,那么应该确定是否新部署或有新变更。首先需要确认是否在最近进行了新的部署或有其他相关的变更,例如代码更新、配置修改等。这些变更可能导致应用出现性能问题,特别是在高负载情况下。
遇到内存泄漏问题,最经典的就是用MAT工具分析dump文件然后找到具体的代码。但如果dump文件巨大就不建议这样,可以使用其他方案,例如,重启、本地复现、jmap -histo:live <pid>在线进行分析等其他方案解决。使用MAT定位内存泄漏思路:
-
打开MAT中
histogram,找到堆内存中占用最大的对象,内存泄漏很有可能就是由大对象导致的;
-
由大对象找被哪些线程引用,查看内存占用最大的线程;


-
从线程中的堆栈信息找到项目中自定义的包和对象,从而可定位到具体的代码;


避免内存泄漏
内存泄漏是由代码中的问题导致的,这些问题通常源于编程错误、设计不良或对资源管理的忽视。那想要避免内存泄漏,就需要从代码层面入手。
及时释放资源
如数据库连接、网络连接和IO连接等,当不再使用时,需要调用close方法来释放连接。只有连接被关闭后,垃圾回收器才会回收对应的对象。否则如果在连接过程中,对一些对象不显性地关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。
在这个例子中,数据库连接conn在方法结束时没有被关闭。这导致了连接资源的泄漏,因为即使在出现异常时也没有释放连接,可能会导致数据库连接池资源被耗尽,影响系统的正常运行。
public class ResourceLeakExample {public void process() {Connection conn = null;try {conn = DriverManager.getConnection(url, user, password);// 使用连接} catch (SQLException e) {e.printStackTrace();}// 连接没有关闭,导致资源泄漏}
}
这里使用了try-with-resources语句来解决这个问题,这种方式可以自动管理资源的释放。连接conn会在try块结束时被自动关闭,即使发生了异常也不会有资源泄漏的问题。
public class ResourceLeakFixedExample {public void process() {try (Connection conn = DriverManager.getConnection(url, user, password)) {// 使用连接} catch (SQLException e) {e.printStackTrace();}// 连接自动关闭}
}
设置合理的变量作用域
一个变量的定义的作用范围大于其使用范围,很有可能会造成内存泄漏。静态变量cache持有所有添加对象的引用。由于这个集合是静态的,它会持续存在,导致对象不会被垃圾回收,可能导致内存使用逐渐增大,最终可能耗尽内存。
public class StaticCacheExample {private static List<Object> cache = new ArrayList<>();public static void addToCache(Object obj) {cache.add(obj); // 对象添加到静态列表}
}
可以将其作用域缩小,解决这个问题。在这个例子中,localCache是一个局部变量,存在于方法的作用域内。当方法执行完毕后,localCache变量会被垃圾回收器回收。通过调用clear方法清空缓存,可以进一步减少内存占用。
public class LocalCacheExample {public void process() {List<Object> localCache = new ArrayList<>();localCache.add(new Object());// 使用 localCachelocalCache.clear(); // 清理缓存}
}
及时清理不需要的对象
这个示例中,cache列表不断添加新对象,但没有进行清理。这样的话,随着时间的推移,cache列表的大小会不断增加,占用大量内存,可能导致系统性能问题。
public class MemoryLeakExample {private List<Object> cache = new ArrayList<>();public void process() {cache.add(new Object()); // 添加对象到缓存// 缓存不清理}
}
修改后的代码中process方法会定期检查cache大小。如果cache超过了设定的大小,就会调用clear方法来清空缓存。这可以帮助控制内存使用,避免列表无限增长。
public class MemoryLeakFixedExample {private List<Object> cache = new ArrayList<>();public void process() {cache.add(new Object());if (cache.size() > 100) {cache.clear(); // 定期清理缓存}}
}
避免无限增长
如果一个集合或缓存没有限制其大小且没有清理机制,它可能无限增加,导致不再需要的对象无法被垃圾回收,从而引发内存泄漏。这个示例中,data列表不断增加对象,没有进行任何限制或清理。这会导致data列表无限增长,逐渐消耗大量内存,最终可能导致内存不足。
public class InfiniteGrowthExample {private List<Object> data = new ArrayList<>();public void addData(Object obj) {data.add(obj); // 不断添加对象// 无限制增长}
}
这里使用LinkedList作为数据结构,并设置了最大大小限制。当列表的大小超过限制时,最旧的元素会被移除。这种做法可以控制内存的使用,避免数据结构无限增长。
public class BoundedGrowthExample {private List<Object> data = new LinkedList<>();public void addData(Object obj) {if (data.size() > 100) {data.remove(0); // 保持列表大小限制}data.add(obj);}
}
避免内部类持有外部类引用
匿名内部类Runnable持有对外部类实例的隐式引用。如果外部类的生命周期很长,可能导致外部类无法被垃圾回收,从而引发内存泄漏。
public class AnonymousInnerClassExample {public void process() {Runnable r = new Runnable() {public void run() {// 使用外部类的实例}};new Thread(r).start();}
}
在改进后的代码中,使用了lambda表达式,避免了匿名内部类带来的隐式引用。这样可以减少对外部类实例的持有,降低内存泄漏的风险。
public class AnonymousInnerClassFixedExample {public void process() {Runnable r = () -> {// 使用外部类的实例};new Thread(r).start();}
}
使用弱引用
弱引用是Java中的一种引用类型,用于在对象不再被强引用时允许垃圾回收器回收这些对象,它主要用于实现缓存和其他需要动态释放内存的场景。与强引用不同,弱引用在垃圾回收时不会阻止对象的回收。如果一个对象只有弱引用指向它,那么在垃圾回收时,这个对象会被回收。弱引用的设计目的是帮助避免内存泄漏。
public class WeakReferenceCache {private Map<String, WeakReference<Object>> cache = new HashMap<>();public void addToCache(String key, Object value) {cache.put(key, new WeakReference<>(value));}public Object getFromCache(String key) {WeakReference<Object> ref = cache.get(key);return (ref != null) ? ref.get() : null;}
}
尽管弱引用设计的目的是避免内存泄漏,但在以下情况下仍然可能出现问题:
- 缓存失控:如果使用弱引用实现缓存,并且缓存管理策略不当,可能会导致频繁的对象创建和回收,影响性能。
例如,缓存的对象如果不断被创建和清除,可能导致大量的对象创建压力,从而影响性能。 - 内存使用不均:弱引用对象的回收是非确定性的。垃圾回收器的回收行为可能不一致,这可能导致应用程序的内存使用行为不如预期。
在这个示例中,clearCache方法会清空缓存。在大多数情况下,缓存中的对象会在下一次垃圾回收时被回收,但如果缓存使用不当,频繁的缓存清空操作可能会影响系统性能。
public class CacheWithPotentialIssues {private Map<String, WeakReference<Object>> cache = new HashMap<>();public void addToCache(String key, Object value) {cache.put(key, new WeakReference<>(value));}public Object getFromCache(String key) {WeakReference<Object> ref = cache.get(key);return (ref != null) ? ref.get() : null;}// 可能引起问题的代码public void clearCache() {cache.clear(); // 清空缓存}
}
相关文章:
内存泄漏详解
文章目录 什么是内存泄漏内存泄漏的原因排查及解决内存泄漏避免内存泄漏及时释放资源设置合理的变量作用域及时清理不需要的对象避免无限增长避免内部类持有外部类引用使用弱引用 什么是内存泄漏 内存泄漏是指不使用的对象持续占有内存使得内存得不到释放,从而造成…...
多角度解析高防CDN防御DDOS及CC攻击
网络攻击的形式也日益多样化,其中DDoS(分布式拒绝服务)和CC(Challenge Collapsar)攻击尤为突出,给网站和企业带来了巨大的安全威胁。高防CDN(Content Delivery Network)作为一种专业…...
(7) cmake 编译C++程序(二)
文章目录 概要整体代码结构整体代码小结 概要 在ubuntu下,通过cmake编译一个稍微复杂的管理程序 整体代码结构 整体代码 boss.cpp #include "boss.h"Boss::Boss(int id, string name, int dId) {this->Id id;this->Name name;this->DeptId …...
C语言系统调用linux文件系统
在C语言中,open、write和read函数是系统调用(system calls),它们直接由操作系统提供,用于底层的文件操作。这些函数是UNIX和类UNIX系统(如Linux)中的标准接口,不同于C标准库中的文件…...
LeetCode142 环形链表 II
前言 题目: 142. 环形链表 II 文档: 代码随想录——环形链表 II 编程语言: C 解题状态: 思路错误,链表不允许被修改 思路 两步走,第一步,判断有没有环,第二步,判断入环口…...
逆向案例二十八——某高考志愿网异步请求头参数加密,以及webpack
网址:aHR0cDovL3d3dy54aW5nYW9rYW90Yi5jb20vY29sbGVnZXMvc2VhcmNo 抓包分析,发现请求头有参数u-sign是加密的,载荷没有进行加密,直接跟栈分析。 进入第二个栈,打上断点,分析有没有加密位置。 可以看到参数…...
WebKit的文本装饰艺术:CSS Text Decoration全解析
WebKit的文本装饰艺术:CSS Text Decoration全解析 CSS文本装饰(Text Decoration)是一组用于美化和增强网页文本表现的属性,它们可以为文本添加下划线、上划线、线删除和强调标记等效果。WebKit作为许多现代浏览器的渲染引擎&…...
【linux】Shell脚本三剑客之sed命令的详细用法攻略
✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全…...
解析class字节码文件获取魔数和版本号
写在前面 本文看下如何获取class字节码文件的魔数和版本号信息。 1:正文 需要对class字节码的结构有一定的了解,可以参考这篇文章 。 直接看代码: package org.example;import java.math.BigInteger;public class TTTT {//取部分字节码&…...
技术文档总结----思维导图
性能调优| ProcessOn免费在线作图,在线流程图,在线思维导图 mysql| ProcessOn免费在线作图,在线流程图,在线思维导图 kafka| ProcessOn免费在线作图,在线流程图,在线思维导图 mybatis缓存| ProcessOn免费在线作图,在线流程图,在线思维导图 java锁| ProcessOn免费在线作图,在…...
【iOS】—— retain\release实现原理和属性关键字
【iOS】—— retain\release实现原理和属性关键字 1. retain\reelase实现原理1.1 retain实现原理1.2 release实现原理 2. 属性关键字2.1 属性关键字的分类2.2 内存管理关键字2.2.1 weak2.2.2 assgin2.3.3 strong和copy 2.4 线程安全的关键字2.5 修饰变量的关键字2.5.1常量const…...
这一文,关于Java泛型的点点滴滴 一
作为一个 Java 程序员,用到泛型最多的,我估计应该就是这一行代码: List<String> list new ArrayList<>();这也是所有 Java 程序员的泛型之路开始的地方啊。 不过本文讲泛型,先不从这里开始讲,而是再往前…...
微信小程序之调查问卷
一、设计思路 1、界面 调查问卷又称调查表,是以问题的形式系统地记载调查内容的一种形式。微信小程序制作的调查问卷,可以在短时间内快速收集反馈信息。具体效果如下所示: 2、思路 此调查问卷采用服务器客户端的方式进行设计,服…...
基于Qt的视频剪辑
在Qt中进行视频剪辑可以通过多种方式实现,但通常需要使用一些额外的库来处理视频数据。以下是一些常见的方法和步骤: 使用FFmpeg FFmpeg是一个非常强大的多媒体框架,可以用来处理视频和音频数据。你可以使用FFmpeg的命令行工具或者其库来实现…...
electron 网页TodoList工具打包成win桌面应用exe
参考: electron安装(支持win、mac、linux桌面应用) https://blog.csdn.net/weixin_42357472/article/details/140643624 TodoList工具 https://blog.csdn.net/weixin_42357472/article/details/140618446 electron打包过程: 要将…...
数据结构之判断二叉树是否为搜索树(C/C++实现)
文章目录 判断二叉树是否为搜索树方法一:递归法方法二:中序遍历法总结 二叉树是一种非常常见的数据结构,它在计算机科学中有着广泛的应用。二叉搜索树(Binary Search Tree,简称BST)是二叉树的一种特殊形式&…...
golang长连接的误用
误用一:忘记读取响应的body 由于忘记读取响应的body导致创建大量处于TIME_WAIT状态的连接(同时产生大量处于transport.go的readLoop和writeLoop的协程) 在linux下运行下面的代码: package mainimport ("fmt""html"&qu…...
Springboot @Validate @Valid 基于复杂嵌套对象的参数校验示例
Springboot Validate Valid 基于复杂嵌套对象的参数校验示例 复杂对象 Data public class Object1 {Length(max 50,message "长度不能超过50位字符")NotBlank(message "名称不能为空")private String name;NotNull(message "不能为空")pri…...
算力共享下的,分级路由转发报文协议与通告
目录 网络双 SLA 约束 一、双SLA约束的定义与背景 二、双SLA约束的应用场景 三、双SLA约束的管理与实施 四、双SLA约束的优势与挑战 算力共享下的,分级路由转发报文协议与通告 基础设施即服务(IaaS)类 型算力资源 函数即服务(FaaS)类型算力服务 软件即服务(SaaS…...
滚动数组详解
滚动数组详解 何为滚动数组?滚动数组是如何优化空间的?交替滚动例题:来自某某轮廓线DP的题目 自我滚动(~~不如交替~~ 完结!!! ( 宇宙免责任书:我用的是C) 何为滚动数组? 什么是滚动…...
基础测试工具使用经验
背景 vtune,perf, nsight system等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下 perf 比较基础的用法: 先改这…...
Python爬虫(二):爬虫完整流程
爬虫完整流程详解(7大核心步骤实战技巧) 一、爬虫完整工作流程 以下是爬虫开发的完整流程,我将结合具体技术点和实战经验展开说明: 1. 目标分析与前期准备 网站技术分析: 使用浏览器开发者工具(F12&…...
Psychopy音频的使用
Psychopy音频的使用 本文主要解决以下问题: 指定音频引擎与设备;播放音频文件 本文所使用的环境: Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...
大模型多显卡多服务器并行计算方法与实践指南
一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...
HTML前端开发:JavaScript 常用事件详解
作为前端开发的核心,JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例: 1. onclick - 点击事件 当元素被单击时触发(左键点击) button.onclick function() {alert("按钮被点击了!&…...
自然语言处理——Transformer
自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,但是它有一个很大的缺陷——很难并行化。 我们可以考虑用CNN来替代RNN,但是…...
使用 SymPy 进行向量和矩阵的高级操作
在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...
服务器--宝塔命令
一、宝塔面板安装命令 ⚠️ 必须使用 root 用户 或 sudo 权限执行! sudo su - 1. CentOS 系统: yum install -y wget && wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh2. Ubuntu / Debian 系统…...
探索Selenium:自动化测试的神奇钥匙
目录 一、Selenium 是什么1.1 定义与概念1.2 发展历程1.3 功能概述 二、Selenium 工作原理剖析2.1 架构组成2.2 工作流程2.3 通信机制 三、Selenium 的优势3.1 跨浏览器与平台支持3.2 丰富的语言支持3.3 强大的社区支持 四、Selenium 的应用场景4.1 Web 应用自动化测试4.2 数据…...
掌握 HTTP 请求:理解 cURL GET 语法
cURL 是一个强大的命令行工具,用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中,cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...
