探秘JVM内部
在我们编写Java代码,点击运行后,会发生什么事呢?
首先,Java源代码会经过Java编译器将其编译成字节码,放在.class文件中
然后这些字节码文件就会被加载到jvm中,然后jvm会读取这些文件,调用相关解释器和编译器去执行字节码文件。
这是一个非常简略的过程,即使是简略的过程,我们也了解到了这个jvm的重要性。
接下来小编就会分享jvm相关知识。
比如jvm的内存区域划分、jvm的类加载过程、jvm的垃圾回收机制
那么首先来了解下,什么是jvm呢?
JVM(Java Virtual Machine)
意为Java虚拟机
那什么又是虚拟机呢?
虚拟机:是一种通过软件模拟,具有完整硬件系统功能的计算机系统,它允许在一个完全隔离的环境中。
对于虚拟机呢,它又分为两种
1.系统虚拟机
系统虚拟机 提供了一个完整的工作平台,使得多个操作系统示例可以在单个物理机器上运行。每个虚拟机实例都像一个独立的计算机一样工作,拥有自己的操作系统、CPU时间、内存空间资源等等
对于常见的系统虚拟机:
1.VMware Workstation
2.Oracle VirtualBox
3.Microsoft Hyper-v
这些虚拟机软件运行用户安装不同的类型的客户端操作系统。例如在Windows运行Linux或macOs环境,便于测试。
2.进程虚拟机
进程虚拟机则是更加专注于特定应用程序或编程语言代码环境。与系统虚拟机不同的是,它通常不模拟底层硬件环境,而是为特定的应用程序提供一个抽象层,使其能够在任何支持该虚拟机的平台上运行,最著名的例子就是Java虚拟机
除了这个还有像python的CP python解释器,Ruby的YARV虚拟机等。
所以总的来说,Java虚拟机就像是一个现实不存在的计算机。
那么接下来分享第一部分
JVM的内存区域划分
JVM在运行时会将内存划分为几个区域:
一:程序计数器
1.每个线程都有独立的程序计数器
2.作用就是记录当前线程执行到字节码哪个位置
3.如果线程正在执行的是Java方法,这个计数器记录的是正在执行的虚拟机字节码指令地址;
如果是执行的是本地方法(native方法),那么计数器就是为空
注意native方法是由c/c++语言写的
4.同时这个是Java虚拟机规范中,没有规定任何OutOfMemoryError情况的区域
二:JAVA虚拟机栈
1.同样的 ,每个线程也会私有一个栈
2.栈帧是用于支持虚拟机进行方法调用和执行的数据结构,每一个方法从被调用到执行完成的过程,就对应着一个栈帧在虚拟机中从入栈到出栈的过程.
调用方法即分配一个栈帧
栈帧中包含了局部变量 表、操作数栈、常量池引用和方法的返回地址
当方法体执行完毕,栈帧就会销毁
3.由于栈帧是一片连续的内存区域,因此栈的空间是有限的,过度的递归和调用可能会导致
“StackOverFlowError”
三:本地方法栈
1.本地方法栈是专门为执行本地方法而准备的栈。与虚拟机栈类似。
2.注意本地方法栈不是每个JVM都存在的
3.本地方法栈内容和虚拟机栈类似,但存储的是本地方法的参数、局部变量,返回值
4.本地方法栈也有大小,若溢出,也会抛出StackOverFlowError。
四:堆
1.是jvm中最大一块区域,用于存储Java程序中对象和数组,几乎所有的对象和数组都在堆中分配内存
2.堆是共享,所有线程可以访问堆中的对象
3.堆内存的管理由垃圾回收器负责,会定期清理不在使用的垃圾,释放内存
4.堆中也有几块区域,包括年轻代、老年代和持久代(jdk8之前j,dk8后是元数据区)。
年轻代:包含新创建的对象
老年代:包含生命周期较长的对象
五:方法区
这是一个JVM规范中通用概念。
方法区是用于存储类的结构信息,如类名、方法、字段、接口、常量等数据。这些数据在程序加载时由jvm加载。
1.方法区是各线程共享的
2.还存储常量池,静态变量等
对于常量池而言
它存储了类中常量。
比如字符串常量、数字常量等,这些常量在程序运行时是共享的。
值得注意的是,jdk8之前,HotSpot JVM使用永久代实现了方法区,jdk8后,使用了元数据区来实现这一方法区。
那么对于这个内存区域划分就分享到这,接下来分享下jvm的类加载过程
类加载
一:加载
在这个阶段中呢,jvm根据类权限定名(包名和类名)从字节码文件(.class文件)中,加载类的内容,形成一个class对象,此时,jvm将从字节码文件读入内存,并创建一个代表该类的class对象。
大概的过程如下
1.定位:jvm根据类名找到类的字节码文件,通常字节码文件在类路径中,jvm通过类加载器来定位和加载字节码
2.加载:类加载器将.class文件的字节流加载到内存中
3.返回:类加载器返回一个class对象,该对象用于表示类的结构。
而对于类加载这里,不得不提到一个模型:单亲委派模型
如图

这个单亲委派模型,有一个较为显著的作用就是
当你项目定义的一个类个原有JDK中的某个类,重合了,此时呢,执行单亲委派模型的时候,就会只会加载JDK中类,自己写的类,不会生效,从而不会对项目中造成负面破坏。
二:验证
验证从外部加载的类字节码是否合法,并符合JVM要求的,避免不安全的代码对程序的安全性和稳定性造成影响
大概过程如下
文件格式验证:检查.class文件的基本格式是否是符合Java字节码规范
元数据验证:检查类的元数据是否是合法的,如常量池、方法签名字段签名
字节码验证:确保字节码的指令符合JVM的执行要求,不包含非法指令和无效的跳转。
三:准备
在这个阶段,jvm为类的静态变量分配内存空间,并为其初始化为默认值
比如int 默认为0,Boolean 默认为false,引用类型的对象就是默认为null
四:解析
此时是将类中的符号引用转换为直接引用的过程。符号引用通常保存在常量池中,直接引用指向内存地址。
jvm会将类中的符号引用(比如方法名、字段名)解析为实际的内存地址或者对应的方法和字段
比如CLassName.methodName(),调用方法时,jvm会在解析过程把methodName()符号引用代替为实际的内存地址,确保可以找到方法并正确执行。
五:初始化
此时是类加载的最后一个阶段,类的静态变量和静态代码块会在此阶段被初始化。
大概过程如下
静态变量赋值,在这个准备阶段,类的静态变量被赋予默认值,在初始化阶段,类中的静态变量和
静态代码块会根据类中的声明进行初始化
静态代码块初始化,如若类有静态代码块,它会在类的初始化时执行。
父类初始化,在子类初始化之前,jvm会先对父类进行初始化先,只有当父类的初始化完成后,子类才能开始初始化。
那么对于类的加载,就分享到这里,接下来分享下垃圾回收机制
垃圾回收机制(Garbage Collection)
那么在jvm内存区域中,GC会对哪个地方进行“大动干戈”呢?
显然,堆是占用了一片连续的内存区域,存放的数据多,此时呢,GC主要回收的区域就是堆了。
那么对于垃圾回收而言,它是以对象为维度进行回收的
比如

那么好,既然讲到了回收,GC是如何回收的呢?
一:寻找垃圾
对于寻找垃圾而言,这里呢,分享下存在的几个方案
1.引用计数
即给每个对象分配一个计数器,
当指向这个对象的引用增加了,此时呢,计数器+1
指向这个对象的引用减少了,此时,计数器-1
当计数器减到0的时候,就可以认为当前对象,不使用了,可以进行回收。
如图:

但这个方案也是有坏处的,比如
循环引用,举个例子

所以,我们,还可以引入另一个方案
可达性分析
这个是一种核心算法,可以判断哪些对象是“存活”的,哪些对象是“垃圾”。
它通过构建一个从根节点(GCRoots)出发的引用链去追踪可以访问的所有对象,无法通过引用链 到达的对象就是认为不可达的,即是垃圾。
简单类比一下
就像是一棵树的根部视为起点,树枝和树叶则视为引用链,如若树叶无法通过树枝连接到根部,那么就可以视为垃圾。
对于GCRoots中,它可以包含很多类型
1.虚拟机栈中的局部变量表
2.本地方法栈的引用
3.方法区中的静态变量
4.活动线程
…………
对于可达性来说,它涉及到这几种状态
1.强可达
对象可以通过引用链从GCRoots直接访问
这些对象不会回收,比如日常必需品
2.软可达
对象通过软引用访问
内存不足的时候,进行回收,比如日常中有些不常用的东西,内存不足的时候被丢弃
3.弱可达
通过对象的弱引用访问
下一次垃圾回收的时候,就会被回收,比如有已经不需要的东西,随意可抛弃
4.虚可达
对象通过虚引用访问
用于追踪对象的回收状态,不能直接访问对象,就比如日常中,从头到尾不需要的东西,我们只关心它什么时候被清理
在JVM中,才有了第二种方案
但可达性分析也是有缺点的
进行可达性分析的时候,为了保证引用关系的一致性,通常需要用户暂停线程,可能会导致短暂的卡顿状态,这样的状态可以称为“Stop-The-World"
那么知道了哪些是垃圾,那么又该如何清理垃圾呢?
清理垃圾
这里也分享下,已有的方案
1.标记-清除
即对没有的使用的对象进行标记了,然后进行直接清除。
比如

但问题是,空闲的内存并没在次连接在一起,而此时直接清除对象,带有随机性的
所以会造成内存碎片的情况发生,最后导致我们下次去申请内存的时候,不能申请一块连续的内存。
2.复制算法
就是说,对一块申请到的内存而言,一分为二。
同一时刻,只会使用其中一半,当着一半中存在着垃圾,就会把它拷贝到另一半中,当全部对象都使用完了,那就整一块内存都进行释放。
优点就是解决了刚刚内存碎片问题
但是又引入了一个问题,即内存利用率不高,就是比较耗内存。
3.标记-整理
此时的这个方法呢,就是把要进行垃圾会受到时候,把所有正在使用的对象,挪到另一端,
然后直接清理端边界以外的内存。
当然此时呢,整块内存也用了,也没有一分为二使用内存了,但缺点还是有的
比如,当存活对象较多时,挪动的过程也是需要时间开销的。
所以,jvm中对以上的方案进行整合
使用了一种分代回收的方案
4.分代回收
它基于一个观察:大多数对象在创建后不久就会变得不可达,只有少数对象会存活较长时间。

它的大致流程是
1.先分配对象
默认情况下分配的对象,基本是放在了新生代中
但是对象内存占用较大的话,那么可能直接分配到老年代中
2.新生代垃圾回收
当伊甸区满了后,触发小范围的GC:
此时呢,就标记存活对象,
会从当前的伊甸区和S1中寻找存活对象
然后讲这些对象赋值到S2中,复制过程中,这些对象的年龄计数器+1
然后原来的伊甸区和S1中就会被清空,称为可使用状态
等到下一次伊甸区满了,进行GC的时候
那么就是轮换着来,比如,这次先使用S2作为标记区,S1作为存放区,然后进行复制
当这些存活对象中年龄计数器增加到一定程度的时候
那么此时,它们就会被移动到老年代。
当然除了这个计数器增长可以将对象上升到老年代
还有其它条件进行,判断,比如此时存活区中,所有对象大小超过一定比例,那么此时,不会等待某些对象进行年龄增长,而是让较大的年龄对象,直接晋升到老年代
还有一个情况,就是当某个对象,即使没有到达年龄上限,但此时,存活区容纳不下了,此时,也会将其对象晋升到老年代。
3.老年代垃圾回收
当老年代空间不足,或者堆中的元数据区空间不足,此时呢,就是进行对老年区垃圾回收
使用标记-清除 或者标记-整理的方式进行清理垃圾。
这个分代回收的垃圾回收机制而言
1.它使用了不同的类型的算法,针对不同区域清理垃圾,使得整体效率变得高效
2.减少停顿时间
因为在新生代中,不断快速清理短命的对象
现代的垃圾回收器中,也是支持了并发和并行的方式进行清理垃圾
3.降低了内存碎片的风险,毕竟是采用复制算法的方式。
那么到这里,小编对于JVM的某些知识,就分享到这。
相关文章:
探秘JVM内部
在我们编写Java代码,点击运行后,会发生什么事呢? 首先,Java源代码会经过Java编译器将其编译成字节码,放在.class文件中 然后这些字节码文件就会被加载到jvm中,然后jvm会读取这些文件,调用相关…...
在HarmonyOS NEXT 开发中,如何指定一个号码,拉起系统拨号页面
大家好,我是 V 哥。 《鸿蒙 HarmonyOS 开发之路 卷1 ArkTS篇》已经出版上市了哈,有需要的朋友可以关注一下,卷2应用开发篇也马上要出版了,V 哥正在紧锣密鼓的写鸿蒙开发实战卷3的教材,卷3主要以项目实战为主࿰…...
利用空间-运动-回波稀疏性进行5D图像重建,以实现自由呼吸状态下肝脏定量磁共振成像(MRI)的加速采集|文献速递--深度学习医疗AI最新文献
Title 题目 5D image reconstruction exploiting space-motion-echo sparsity foraccelerated free-breathing quantitative liver MRI 利用空间-运动-回波稀疏性进行5D图像重建,以实现自由呼吸状态下肝脏定量磁共振成像(MRI)的加速采集 …...
Qt5 Mac系统检查休眠
在开发跨平台应用程序时,有时候我们需要检测系统的状态,比如是否处于休眠或唤醒状态。Qt是一个强大的跨平台应用开发框架,支持多种操作系统,包括Windows、Linux、macOS等。在这个场景下,我们关注的是如何在Qt5.10中检测到系统是否休眠以及在Mac上实现这一功能。本文将深入…...
ZKmall开源商城B2B2C电商用户隐私信息保护策略:数据脱敏全链路实践
随着业务的不断拓展和用户规模的持续扩大,用户隐私信息的保护也面临着前所未有的挑战。下面将深入探讨ZKmall开源商城在数据脱敏方面的实践,以及针对B2B2C电商用户隐私信息的具体保护策略。 数据脱敏,又称数据去标识化或数据匿名化࿰…...
Media streaming mental map
Media streaming is a huge topic with a bunch of scattered technologies, protocols, and formats. You may feel like hearing fragments without seeing the big picture. Let’s build that mental map together — here’s a high-level overview that connects everyt…...
linux Gitkraken 破解
ubuntu 安装 Gitkraken 9.x Pro 版本_gitcracken.git-CSDN博客...
SSL证书颁发机构有哪些呢
证书颁发机构(Certificate Authority, CA)是负责签发和管理数字证书的权威机构,分为公共信任的 CA 和私有/内部 CA。以下是常见的公共信任的 CA 分类及代表机构: 1. 国际知名公共 CA(浏览器/操作系统默认信任ÿ…...
13_pandas可视化_seaborn
导入库 import numpy as np import pandas as pd # import matplotlib.pyplot as plt #交互环境中不需要导入 import seaborn as sns sns.set_context({figure.figsize:[8, 6]}) # 设置图大小 # 屏蔽警告 import warnings warnings.filterwarnings("ignore")关系图 …...
Pgvector的安装
Pgvector的安装 向量化数据的存储,可以为 PostgreSQL 安装 vector 扩展来存储向量化数据 注意:在安装vector扩展之前,请先安装Postgres数据库 vector 扩展的步骤 1、下载vs_BuildTools 下载地址: https://visualstudio.microso…...
如何在大型项目中组织和管理 Vue 3 Hooks?
众所周知,Vue Hooks(通常指 Composition API 中的功能)是 Vue 3 引入的一种代码组织方式,用于更灵活地组合和复用逻辑。但是在项目中大量使用这种写法该如何更好的搭建结构呢?以下是可供参考实践的案例。 一、Hooks 组织原则 单一职责每个 Hook 应专注于完成单一功能,避…...
Django接入 免费的 AI 大模型——讯飞星火(2025年4月最新!!!)
上文有介绍deepseek接入,但是需要 付费,虽然 sliconflow 可以白嫖 token,但是毕竟是有限的,本文将介绍一款完全免费的 API——讯飞星火 目录 接入讯飞星火(免费) 测试对话 接入Django 扩展建议 接入讯飞星火…...
路由器学习
路由器原理 可以理解成把不同的网络打通,实现通信的设备。比如家里的路由器,他就是把家里的内网和互联网(外网)打通。 分类 1.(按应用场景分类) 路由器分为家用的,企业级的,运营…...
Redis 连接:深入解析与优化实践
Redis 连接:深入解析与优化实践 引言 Redis 作为一款高性能的键值型数据库,广泛应用于缓存、会话存储、消息队列等领域。Redis 的连接管理是确保其性能和稳定性的关键。本文将深入探讨 Redis 连接的原理、配置、优化方法以及常见问题,帮助您更好地掌握 Redis 连接技术。 …...
UE5学习记录part14
第17节 enemy behavior 173 making enemies move: AI Pawn Navigation 按P查看体积 So its very important that our nav mesh bounds volume encompasses all of the area that wed like our 因此,我们的导航网格边界体积必须包含我们希望 AI to navigate in and …...
【中间件】使用ElasticSearch提供的RestClientAPI操作ES
一、简介 ElasticSearch提供了RestClient来操作ES,包括对数据的增删改查,可参照官方文档:Java High Level REST Client 二、使用步骤: 可参照官方文档操作 导包 <dependency><groupId>org.elasticsearch.client<…...
Docker的备份与恢复
一、两种基本方式 docker export / import 在服务器上导出容器docker export container_name > container_backup.tar这里使用 > 重定向时默认保存路径为当前运行命令的路径,可以自行指定绝对路径来保存,后续加载时也使用对应的路径即可。 恢复为…...
C++ string 对象的操作(三十五)
1. string 对象的常见操作 下面的表格列出了 string 类型最常用的一些操作以及它们的功能: 操作说明示例os << s将字符串对象 s 写入输出流 os,返回 os。std::cout << s;is >> s从输入流 is 中读取字符串赋给 s(以空白分…...
DAPP实战篇:规划下我们的开发线路
前言 在DApp实战篇:先用前端起个项目一文中我们起了一个前端项目,在后续开发中笔者将带领大家一步步完成这个DAPP,为了方便后续讲解,本篇将完整说明后续我们要进行的开发和思路。 主打前端 实际上一个完整的DAPP是由前端和智能…...
[leetcode] 面试经典 150 题——篇9:二叉树(番外:二叉树的遍历方式)
二叉树的遍历是指按照某种顺序访问二叉树中的每个节点。常见的遍历方式有四种:前序遍历(Pre-order Traversal)、中序遍历(In-order Traversal)、后序遍历(Post-order Traversal)以及层序遍历&am…...
【Elasticsearch】开启大数据分析的探索与预处理之旅
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…...
状态机思想编程练习
状态机实现LED流水灯 本次实验,我们将利用状态机的思想来进行Verilog编程实现一个LED流水灯,并通过Modelsim来进行模拟仿真,再到DE2-115开发板上进行验证。 首先进行主要代码的编写。 module led (input sys_clk,input sys_…...
C#:接口(interface)
目录 接口的核心是什么? 1. 什么是接口(Interface),为什么要用它? 2. 如何定义和使用接口? 3.什么是引用接口? 如何“引用接口”? “引用接口”的关键点 4. 接口与抽象类的区…...
前端新增数据,但数据库里没有新增的数据
先看情况: 1.前端,可以进行删查改,但是新增数据之后,显示保存成功,也增加了空白的一行,但是数据没有显示出来。 2.后端接收到了数据,但返回结果的列表里面是空的;同时数据库里面没…...
Go语言的测试框架
Go语言测试框架详解 Go语言(Golang)自发布以来,因其简洁、高效和并发支持而受到广泛欢迎。在软件开发过程中,测试是确保代码质量与稳定性的重要环节。Go语言内置的测试框架为开发者提供了灵活而强大的测试工具,使得编…...
堆结构——面试算法题高频汇总
目录 引言 堆创建&增删改 堆构造过程 举个例子 堆插入元素 删除元素 在数组中找第k大的元素 举例 堆排序原理 合并k个排序链表 数据流中位数问题 引言 堆是将一组数据按照完全二叉树的存储顺序,将数据存储在一个一维数组中的结构。堆有两种结构&…...
httpx模块的使用
在使用requests模块发起请求时,报以下错误,表示服务器有可能使用的是http2.0协议版本,导致requests无法爬取。 此时就可以使用httpx模块爬取。 先下载httpx模块: pip install httpx[http2]然后用httpx发起请求: impo…...
Linux的: /proc/sys/net/ipv6/conf/ 笔记250405
Linux的: /proc/sys/net/ipv6/conf/ /proc/sys/net/ipv6/conf/ 是 Linux 系统中用于 动态配置 IPv6 网络接口参数 的核心目录。它允许针对不同网络接口(如 eth0、wlan0)或全局设置(all)调整 IPv6 协议栈的行为。 它通过虚拟文件系…...
论文阅读10——解开碳排放与碳足迹之间的关系:文献回顾和可持续交通框架
原文地址: Unraveling the relation between carbon emission and carbon footprint: A literature review and framework for sustainable transportation | npj Sustainable Mobility and TransportTransportation decarbonization has drawn enormous attention globally,…...
新一代AI架构实践:数字大脑AI+智能调度MCP+领域执行APP的黄金金字塔体系
新一代AI架构实践:数字大脑智能调度领域执行的黄金金字塔体系 一、架构本质的三层穿透性认知 1.1 核心范式转变(CPS理论升级) 传统算法架构:数据驱动 → 特征工程 → 模型训练 → 业务应用 新一代AI架构:物理规律建…...
