ArrayList、LinkedList、HashMap、HashTable、HashSet、TreeSet
集合族谱
在这些集合中,仅有vector和hashtable是线程安全的,其内部方法基本都有synchronized修饰。

ArrayList
底层采用Object数组实现,实现了RandomAccess接口因此支持随机访问。插入删除操作效率慢。
ArrayList需要一份连续的内存空间。
ArrayList扩容机制
ArrayList添加元素时,若达到了内部数组指定的数量上限,会自动进行扩容:
- 计算新容量,一般是原容量的1.5倍(1.5 倍,是因为 1.5 可以充分利用移位操作,减少浮点数或者运算时间和运算次数)
- 根据新容量创建新数组
- 把原来的数据拷贝到新数组中
- 更新ArrayList内部指向原数组的引用,指向新数组
ArrayList哪里不安全
首先,对arraylist添加一个元素,分为3步
- 判断数组是否需要扩容,如果需要就调用grow方法扩容;
- 将数组的size位置设置值(因为数组的下标是从0开始的);
- 将当前集合的大小+1
多线程插入删除下,ArrayList会暴露三个问题:
- 出现null值:
假设arraylist容量为10,线程1检查当前size=4,不需要扩容,于是在index=4进行插入,但是还没有size++,线程2又来进行插入,检查不需要扩容且size=4,于是也在index=4执行插入,然后两个线程同时执行size++,就导致实际size=6,两次插入都在index=4,而index=5的地方并没有插入数据。- 索引越界异常
还是上述例子,假设线程1检查size=9,没有到10,无需扩容,于是在index=9的地方插入,但还没有size++,线程2来检查size=9,也在index=9的地方插入,然后两个线程同时++,导致size=11。- 集合的size()和实际add数量不符
size++不是原子操作,分为三步,获取size值、size+1、新size覆盖老size,如果两个线程拿到一样的size同时覆盖,那么就导致有一次没加上。

为什么需要DEFAULTCAPACITY_EMPTY_ELEMENTDATA标识未初始化的状态
- 确保第一次添加元素时数组的容量扩展:
ArrayList在没有明确指定容量时,会使用DEFAULTCAPACITY_EMPTY_ELEMENTDATA来标识该ArrayList尚未添加任何元素。这意味着,当创建一个空的ArrayList时,它的内部数组并不会立即分配实际的空间,而是会指向一个空的数组(DEFAULTCAPACITY_EMPTY_ELEMENTDATA)。这节省了内存开销。
当第一次往这个ArrayList中添加元素时,内部数组的大小就需要扩展。因为ArrayList的默认初始容量是 10,所以一旦添加元素,数组就会重新分配一个合适的大小(10)来存放这些元素。- 避免不必要的内存分配:
如果没有DEFAULTCAPACITY_EMPTY_ELEMENTDATA这种标识,ArrayList每次创建时都会为空的实例分配一个固定大小的数组(比如长度为 10)占用内存。
通过使用DEFAULTCAPACITY_EMPTY_ELEMENTDATA,ArrayList会在初始化时使用一个空数组来表示尚未使用的状态,只有在第一次添加元素时,才会根据需要分配和扩展内部数组。这样可以节省内存开销。- 区分“空的”实例和“已初始化但无元素”实例:
DEFAULTCAPACITY_EMPTY_ELEMENTDATA有一个特别的用途,就是帮助ArrayList区分两种不同的状态:
空实例:=
ArrayList没有被初始化为一个非空的数组,只是一个空的实例。ArrayList<Integer> list = new ArrayList<>();已初始化但无元素:
ArrayList已经分配了一个默认大小的数组,但当前还没有元素。ArrayList<Integer> list = new ArrayList<>(10);
LinkedList

HashMap
- HashMap可以存储null的key和value,但null作为键(key的哈希值为0)只能有一个,null作为值可以有多个。
- JDK1.8之前hashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突),如果多个键映射到同一个槽位,它们会以链表的形式存储在同一个槽位上,因为链表的查询时间是O(n),所以冲突很严重,一个索引上的链表非常长,效率就很低了。
- JDK1.8后的HashMap在解决哈希冲突时有了较大的变化,当链表长度大于等于8并且数组长度大于等于64时,将链表转化为红黑树,以减少搜索时间O(logn),但是在数量较少时,即数量小于6时,会将红黑树变回链表。
- HashMap默认的初始化大小为16。之后每次扩充,容量变为原来的2倍。并且HashMap总是使用2的幂作为哈希表的大小。
- 解决哈希冲突的方法:
- 链接法:使用链表或其他数据结构来存储冲突的键值对,将它们链接在同一个哈希桶中。
- 开放寻址法:在哈希表中找到另一个可用的位置来存储冲突的键值对,而不是存储在链表中。常见的开放寻址方法包括线性探测、二次探测和双重散列。
- 再哈希法:当发生冲突时,使用另一个哈希函数再次计算键的哈希值,直到找到一个空槽来存诸键值对。
- 哈希桶扩容:当哈希冲突过多时,可以动态地扩大哈希桶的数量,重新分配键值对,以减少冲突的概率。

HashMap哪里线程不安全
- JDK1.7 HashMap采用数组+链表的数据结构,多线程背景下,HashMap 使用头插法插入元素,可能出现环形链表造成Entry链死循环,多线程同时执行 put 操作,可能造成前一个 key 被后一个 key 覆盖,存在和数据丢失问题。
- JDK1.8 HashMap采用数组+链表+红黑二叉树的数据结构,优化了1.7中数组扩容的方案,解决了Entry链死循环和数据丢失问题。但是多线程背景下,put方法存在数据覆盖的问题。
- Entry死循环:扩容时存在在原数组和新数组之间的指针切换,如果没有正确地处理链表节点的
next指针,就可能导致某些节点指向自己,从而形成死循环。- 数据丢失:扩容时
HashMap的元素会被重新散列并放入新的数组桶中。如果在处理过程中存在指针的错误(例如链表next指针没有正确地更新),就可能发生丢失元素的情况,某些元素可能无法在新的数组中找到正确的位置,导致这些元素丢失。- 如果要保证线程安全,可以通过这些方法来保证:
多线程环境可以使用Collections.synchronizedMap( )同步加锁的方式,但是这种方法是全局锁synchronized,很影响性能,不如使用ConurrentHashMap的分段锁,更适合高并发场景使用。
HashMap的put流程(jdk8)
- 根据要添加的键的哈希码(hashcode方法)得出在数组中的位置,即找到桶
- 检查该位置是否为空(即没有键值对存在)
- 若该位置已经存在其他键值对,检查该位置的键值对的键(equals方法)是否与要添加的键值对相同,若相同则新值覆盖旧值。put结束
- 若和键值对的键不相同,则再遍历链表或红黑树(遍历桶)来查找是否有相同的键和值,若有,则新值覆盖旧值,若无,则新值加到链表或红黑树中。
- 检查链表长度是否达到8且HashMap的数组长度是否大于等于64,是则将链表转换为红黑树。
- 检查负载因子是否超过阈值(默认为0.75),若键值对的数量(size)与数组长度(初始16)的比值大于阈值,则需要进行扩容操作。
- 扩容操作:创建一个新的两倍大小的数组。将旧数组中的键值对重新计算哈希码并分配到新数组中的位置。更新HashMap的数组引用和阈值参数。
HashMap的get方法哪里不安全
- 空指针异常:在HashMap没有被初始化时如果尝试用null作为键调用get方法会抛出空指针异常。如果HashMap已经初始化,使用null作为键是允许的,因为HashMap支持null键。
- 线程安全:HashMap本身不是线程安全的。例如在一个线程中调用get方法而另一个线程同时增加或删除元素,可能会导致读取操作得到错误的结果或抛出ConcurrentModificationException。如果需要在多线程环境中使用类以HashMap的数据结构,可以考虑使用ConcurrentHashMap。
HashMap为啥用String作为key
String对象是不可变的,一旦创建就不能被修改,这确保了Key的稳定性。如果Key是可变的,可能会导致hashCode和equals方法的不一致,进而影响HashMap的正确性。
为什么HashMap要用红黑树而不是平衡二叉树
平衡二叉树追求的是一种“完全平衡”状态:任何结点的左右子树的高度差不会超过1,优势是树的结点是很平均分配的,导致每次进行插入/删除节点的时候,几乎都会破坏平衡树的第二个规则,进而需要通过左旋和右旋来进行调整,使之再次成为一颗符合要求的平衡树。
红黑树不追求这种完全平衡状态,而是追求一种“弱平衡”状态:整个树最长路径不会超过最短路径的2倍,不会像平衡二叉树一样频繁左右旋,也就是栖牲了一部分查找的性能效率来换取一部分维持树平衡状态的成本。
HashTable
内部方法基本都经过synchronized修饰,不可以有null的key和value。默认初始容量为11,每次扩容变为原来的2n+1。创建时给定了初始容量,会直接用给定的大小。底层数据结构为数组+链表。它基本被淘汰了,要保证线程安全可以用ConcurrentHashMap。
HashSet
底层由HashMap实现,key就是hashset的值,所有的key的value相同,是一个名为PRESENT的Object类型常量。
LinkedHashSet
底层由LinkedHashMap实现,继承了HashSet类,使用双向链表维护元素插入顺序。
TreeSet
底层由TreeMap实现(红黑树),添加元素到集合时按照比较规则将其插入合适的位置,保证插入后的集合仍然有序(自然顺序,比如插入1,3,2,输出出来是1,2,3)
相关文章:
ArrayList、LinkedList、HashMap、HashTable、HashSet、TreeSet
集合族谱 在这些集合中,仅有vector和hashtable是线程安全的,其内部方法基本都有synchronized修饰。 ArrayList 底层采用Object数组实现,实现了RandomAccess接口因此支持随机访问。插入删除操作效率慢。 ArrayList需要一份连续的内存空间。 A…...
手动配置IP
手动配置IP,需要考虑四个配置项: 四个配置项 IP地址、子网掩码、默认网关、DNS服务器 IP地址:格式表现为点分十进制,如192.168.254.1 子网掩码:用于区分网络位和主机位 【子网掩码的二进制表达式一定是连续的&#…...
idea如何使用AI编程提升效率-在IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤-卓伊凡
idea如何使用AI编程提升效率-在IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤-卓伊凡 问题 idea编译器 安装copilot AI工具 实际操作 在 IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤如下: 打开 IntelliJ IDEA: 打开你的 IntelliJ IDEA 应用…...
游戏引擎学习第101天
回顾当前情况 昨天的进度基本上完成了所有内容,但我们还没有进行调试。虽然我们在运行时做的事情大致上是对的,但还是存在一些可能或者确定的bug。正如昨天最后提到的,既然现在时间晚了,就不太适合开始调试,所以今天我…...
css块级元素和行内元素区别
在CSS中,元素可以分为两大类:块级元素(Block-level elements)和行内元素(Inline elements)。这两种元素在网页布局中起着不同的作用,主要体现在它们的显示方式、尺寸控制、以及与其他元素的交互…...
JAVA安全—Shiro反序列化DNS利用链CC利用链AES动态调试
前言 讲了FastJson反序列化的原理和利用链,今天讲一下Shiro的反序列化利用,这个也是目前比较热门的。 原生态反序列化 我们先来复习一下原生态的反序列化,之前也是讲过的,打开我们写过的serialization_demo。代码也很简单&…...
什么是信息熵
信息熵 公式 一个离散随机变量 X X X的可能取值为 X x 1 , x 2 , . . . , x n Xx_1,x_2,...,x_n Xx1,x2,...,xn,而对应的概率为 p i p ( X x i ) p_ip(Xx_i) pip(Xxi),如下 x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x 4 x_4 x4… x n x_n xnp( x …...
使用API有效率地管理Dynadot域名,清除某一文件夹中域名的默认DNS设置
关于Dynadot Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮…...
2.11 sqlite3数据库【数据库的相关操作指令、函数】
练习: 将 epoll 服务器 客户端拿来用 客户端:写一个界面,里面有注册登录 服务器:处理注册和登录逻辑,注册的话将注册的账号密码写入数据库,登录的话查询数据库中是否存在账号,并验证密码是否正确…...
当 LSTM 遇上 ARIMA!!
大家好,我是小青 ARIMA 和 LSTM 是两种常用于时间序列预测的模型,各有优劣。 ARIMA 擅长捕捉线性关系,而 LSTM 擅长处理非线性和长时间依赖的关系。将ARIMA 和 LSTM 融合,可以充分发挥它们各自的优势,构建更强大的时…...
kali连接xshell
1.先保证宿主机:以太网适配器 VMware Network Adapter VMnet8 和kali(net 模式)在同一个网段 windows VMnet8开启 查看是否是自动获取ip ipv4 和ipv6一样的 查看 windows VMnet8的IPv4的地址 查看 kali 的IP地址 window ping的结果…...
图像曲率滤波
看到这么一个非常有意思的东西,记录一下 https://www.zhihu.com/question/35499791 https://zhuanlan.zhihu.com/p/22971865 GCFilter_talk.pdf_免费高速下载|百度网盘-分享无限制 https://github.com/YuanhaoGong/CurvatureFilter?tabreadme-ov-file...
TCP 和 UDP 可以绑定相同的端口吗?
前言 当一个网络接口接收到一个数据报时,IP 模块首先检查目的地址是否为自己的 IP 地址,如果是的话,数据报交付给由 IPv4 头部的协议字段指定的协议模块。 TCP 和 UDP 在内核中是两个完全独立的模块,送给 TCP/UDP 模块的报文根据…...
【Python网络爬虫】爬取网站图片实战
【Python网络爬虫】爬取网站图片实战 Scrapying Images on Website in Action By Jackson@ML *声明:本文简要介绍如何利用Python爬取网站数据图片,仅供学习交流。如涉及敏感图片或者违禁事项,请注意规避;笔者不承担相关责任。 1. 创建Python项目 1) 获取和安装最新版…...
2024年博客之星年度评选—创作影响力评审+主题文章创作评审目前排名(2024博客之星陪跑小分队助力2024博客之星创作者成长)
2024年博客之星年度评选—创作影响力评审主题文章创作评审目前排名 2024年博客之星主题文章创作评审文章得分公布!2024年博客之星创作影响力评审2024年博客之星主题文章创作评审目前排名公布! 【2024博客之星】恭喜完成✅主题创作的226位博主࿰…...
【CLIP系列】4:目标检测(ViLD、GLIP)
目录 1 ViLD2 GLIP2.1 前言2.2 损失计算2.3 模型框架 1 ViLD OPEN-VOCABULARY OBJECT DETECTION VIA VISION AND LANGUAGE KNOWLEDGE DISTILLATION 从标题就能看出来,作者是把CLIP模型当成一个Teacher,去蒸馏他自己的网络,从而能Zero Shot去…...
Qt Designer菜鸟使用教程(实现一个本地英文翻译软件)
1 安装Qt Designer 安装这个包的时候会自带安装 Qt Designer, 安装目录为python的安装根目录的 Lib/site-packages/qt5_applications/Qt/bin 目录下。 pip install pyqt5-tools2 新建窗体 2.1 新建主窗体 创建之后如下图: 设置主窗口大小: 设置窗…...
【一文读懂】HTTP与Websocket协议
HTTP协议 概述 HTTP (Hypertext Transfer Protocol),即超文本传输协议,是一种用于在客户端和服务器之间传输超文本(例如网页、图片、音频、视频等)的通信协议。它是万维网(WWW)的基础,负责在浏…...
大语言模型入门
大语言模型入门 1 大语言模型步骤1.1 pre-training 预训练1.1.1 从网上爬数据1.1.2 tokenization1.1.2.1 tokenization using byte pair encoding 1.3 预训练1.3.1 context1.3.2 training1.3.3 输出 1.2 post-training1.2.1 token 1.2 SFT监督微调1.3 人类反馈强化学习1.3.1 人…...
SQL 大厂面试题目(由浅入深)
今天给大家带来一份大厂SQL面试覆盖:基础语法 → 复杂查询 → 性能优化 → 架构设计,大家需深入理解执行原理并熟悉实际业务场景的解决方案。 1. 基础查询与过滤 题目:查询 employees 表中所有薪资(salary)大于 10000…...
深度解析:3种高效的Windows依赖检测完整方案
深度解析:3种高效的Windows依赖检测完整方案 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist VisualCppRedist AIO项目是一个专业的Microsoft Visual …...
Efficient-KAN:突破传统神经网络瓶颈的Kolmogorov-Arnold网络实战指南
Efficient-KAN:突破传统神经网络瓶颈的Kolmogorov-Arnold网络实战指南 【免费下载链接】efficient-kan An efficient pure-PyTorch implementation of Kolmogorov-Arnold Network (KAN). 项目地址: https://gitcode.com/GitHub_Trending/ef/efficient-kan 深…...
R语言数据导入全指南:从CSV到SPSS的底层原理与工程实践
1. 项目概述:为什么数据导入是R语言真正的第一道门槛刚接触R的人,十有八九会在读取第一个文件时卡住。不是报错“cannot open the connection”,就是加载出来全是NA,再或者干脆卡死在进度条不动——这根本不是你手生,而…...
3个关键功能解锁B站缓存视频的永久保存方案
3个关键功能解锁B站缓存视频的永久保存方案 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经历过这样的场景:精心收藏的B站…...
到极限了吗?优化算法APP9.0,再加入228个车间调度案例!
我又来更新啦!这次在优化算法APP8.0的基础上再次大更新!加入了4大经典车间调度数据集,共228个实例开箱即用。这个案例的加入非常适合写论文哦!当你以为我黔驴技穷的时候,不好意思,我的表演才刚刚开始~ 哈哈…...
别再傻傻分不清!舵机、步进、无刷、永磁同步,这四种电机到底怎么选?
电机选型实战指南:舵机、步进、无刷与永磁同步的黄金法则 在机器人关节调试现场,一位工程师盯着反复抖动的机械臂摇头:"早知道该用无刷电机...";创客空间里,几个学生围着一台失控的3D打印机争论:…...
AI绘画工作流自动化:从NovelAI到Pixiv的Semi-Auto工具实战
1. 项目概述:从手动到自动,解放AI绘画生产力的桌面利器如果你和我一样,是个深度沉迷于AI绘画的创作者,那你一定经历过这样的痛苦:在NovelAI的WebUI里,吭哧吭哧地调好一组参数,生成一张图&#x…...
在「唯」与「阿」之间安放计算之道,老子这句话给 SAP HANA 开发的一层提醒
「唯之与阿,相去几何?美之与恶,相去若何?人之所畏,不可不畏。荒兮,其未央哉!」放在 SAP HANA 开发里看,不是把古文硬贴到技术上,而是在提醒我们,很多工程判断看起来差别很小,落到系统运行里却会拉开很大的距离。一个 JOIN 写在 application server,还是下推到 data…...
Java源码学习:深入剖析Java的concurrent包源码之`ReentrantLock` 的精妙设计与云原生演进
引言:从 synchronized 到可编程的锁 在 Java 并发编程的演进史上,synchronized 关键字曾是开发者控制线程同步的唯一选择。它简单、易用,并由 JVM 保证其正确性。然而,随着应用复杂度的提升,其固有的局限性——如无法中…...
告别炼丹玄学:用EfficientNet-B0到B7的缩放系数,在PyTorch里精准匹配你的算力
告别炼丹玄学:用EfficientNet-B0到B7的缩放系数,在PyTorch里精准匹配你的算力 当你在个人GPU或边缘设备上部署深度学习模型时,是否经常遇到这样的困境:模型要么太大导致显存溢出,要么太小无法达到预期精度?…...
