DOM解析XML:Java程序员的“乐高积木式“数据搭建
各位代码建筑师们!今天我们要玩一个把XML变成内存乐高城堡的游戏——DOM解析!和SAX那种"边看监控边破案"的刺激不同,DOM就像把整个乐高说明书一次性倒进大脑,然后慢慢拼装(内存:你不要过来啊!)
一、DOM原理:XML的"克隆人战争"
想象你要复制整个迪士尼乐园:
-
全量加载术
把XML文件整个吞进内存,变成一颗节点树(就像把城堡图纸转成3D模型) -
随机访问特权
可以随时瞬移到任意角落:“我要修改第三块砖的颜色!”(而SAX只能从头看到尾) -
修改超能力
支持增删改查,像玩《模拟人生》一样随意改造XML世界
二、实战演练:用DOM搭建"程序员主题乐园"
项目蓝图(programmer_park.xml):
<主题乐园 名称="996快乐谷"><区域 类型="代码深渊" geohash="wx4g0b1"><设施 id="1"><名称>无限续杯咖啡厅</名称><危险等级>★★★★☆</危险等级></设施><设施 id="2"><名称>需求变更过山车</名称><危险等级>★★★★★</危险等级></设施></区域>
</主题乐园>
建筑师工具包(DomArchitect.java):
import org.w3c.dom.*;
import javax.xml.parsers.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;public class DomArchitect {public static void main(String[] args) throws Exception {// 装载整个乐园到内存DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();DocumentBuilder builder = factory.newDocumentBuilder();Document park = builder.parse("programmer_park.xml");// 打印所有危险设施NodeList rides = park.getElementsByTagName("设施");System.out.println("⚠️ 高危设施列表:");for (int i=0; i<rides.getLength(); i++) {Element ride = (Element) rides.item(i);String name = ride.getElementsByTagName("名称").item(0).getTextContent();String level = ride.getElementsByTagName("危险等级").item(0).getTextContent();System.out.println(name + " | 危险指数:" + level);}// 新增一个夺命设施Element newRide = park.createElement("设施");newRide.setAttribute("id", "3");Element name = park.createElement("名称");name.appendChild(park.createTextNode("Deadline蹦极台"));Element level = park.createElement("危险等级");level.appendChild(park.createTextNode("★★★★★★")); // 突破五星!newRide.appendChild(name);newRide.appendChild(level);park.getDocumentElement().getFirstChild().appendChild(newRide);// 保存修改后的乐园(小心内存泄漏!)Transformer transformer = TransformerFactory.newInstance().newTransformer();transformer.transform(new DOMSource(park), new StreamResult("programmer_park_modified.xml"));}
}
运行结果:
⚠️ 高危设施列表:
无限续杯咖啡厅 | 危险指数:★★★★☆
需求变更过山车 | 危险指数:★★★★★
(生成的新XML会多出一个"Deadline蹦极台",危险指数突破天际!)
三、DOM vs SAX:建筑师与侦探的巅峰对决
| DOM建筑师 🏗️ | SAX侦探 🕵️♂️ | |
|---|---|---|
| 内存消耗 | 需要搬来整个建材市场(全量加载) | 只带侦探工具包(流式处理) |
| 操作方式 | 可以随意拆墙装修(随机修改) | 只能做现场记录(只读) |
| 响应速度 | 装修前要先运材料(初始化慢) | 到达现场立即开工(启动快) |
| 适用场景 | 需要改结构的精致小别墅 | 快速搜查犯罪现场的超大仓库 |
四、DOM操作三大"骚操作"
-
XPath闪电定位
用XPath直接空降到指定节点,像使用传送门:XPath xpath = XPathFactory.newInstance().newXPath(); Node node = (Node) xpath.evaluate("//设施[名称='需求变更过山车']", park, XPathConstants.NODE); -
属性隐身术
动态修改geohash坐标,让设施"瞬间移动":Element area = (Element) park.getElementsByTagName("区域").item(0); area.setAttribute("geohash", "wx4g0b9"); // 从深渊传送到厕所 -
节点克隆大法
复制过山车并改名,省时省力:Node clonedRide = rides.item(1).cloneNode(true); ((Element)clonedRide).setAttribute("id", "4"); clonedRide.getChildNodes().item(0).setTextContent("需求复活过山车");
五、DOM的致命陷阱
-
内存黑洞
加载1GB的XML文件 ≈ 在内存里造航空母舰(小心OOM空袭!) -
空白节点鬼打墙
XML中的换行符会被视为Text节点,遍历时可能踩坑:// 错误示范:直接取第一个子节点可能是空白文本节点! // Element name = (Element) ride.getFirstChild();// 正确姿势:过滤文本节点 NodeList children = ride.getChildNodes(); for (int i=0; i<children.getLength(); i++) {if (children.item(i).getNodeType() == Node.ELEMENT_NODE) {Element child = (Element) children.item(i);// 处理真实节点} } -
线程安全惊魂
Document对象不是线程安全的!多个线程同时装修会拆了你的乐高城堡。
六、DOM哲学:内存即世界
- 每个Element节点都是乐高积木
- 每个Text节点都是积木上的贴纸
- 每个Attribute都是积木的卡扣设计
- 而内存溢出…是你野心太大想造死星的下场
相关文章:
DOM解析XML:Java程序员的“乐高积木式“数据搭建
各位代码建筑师们!今天我们要玩一个把XML变成内存乐高城堡的游戏——DOM解析!和SAX那种"边看监控边破案"的刺激不同,DOM就像把整个乐高说明书一次性倒进大脑,然后慢慢拼装(内存:你不要过来啊&…...
C++ 入门六:多态 —— 同一接口的多种实现之道
在面向对象编程中,多态是最具魅力的特性之一。它允许我们通过统一的接口处理不同类型的对象,实现 “一个接口,多种实现”。本章将从基础概念到实战案例,逐步解析多态的核心原理与应用场景,帮助新手掌握这一关键技术。 …...
关于获取文件大小的方法总结
编程开发中,获取文件大小是一项常见的需求,无论是进行文件管理、数据传输还是资源监控等操作,都可能需要知道文件的具体大小。下面将介绍几种常见的获取文件大小的方式,并进行对比分析。 几种可行的文件大小获取方式 1. 使用 fs…...
从宇树摇操avp_teleoperate到unitree_IL_lerobot:如何基于宇树人形进行二次开发(含Open-TeleVision源码解析)
前言 如之前的文章所述,我司「七月在线」正在并行开发多个订单,目前正在全力做好每一个订单,因为保密协议的原因,暂时没法拿出太多细节出来分享 但可以持续解读我们所创新改造或二次开发的对象,即解读paper和开源库…...
告别 ifconfig:为什么现代 Linux 系统推荐使用 ip 命令
告别 ifconfig:为什么现代 Linux 系统推荐使用 ip 命令 ifconfig 指令已经被视为过时的工具,不再是查看和配置网络接口的推荐方式。 与 netstat 被 ss 替代类似。 本文简要介绍 ip addr 命令的使用 简介ip ifconfig 属于 net-tools 包,这个…...
MySQL——MVCC(多版本并发控制)
目录 1.MVCC多版本并发控制的一些基本概念 MVCC实现原理 记录中的隐藏字段 undo log undo log 版本链 ReadView 数据访问规则 具体实现逻辑 总结 1.MVCC多版本并发控制的一些基本概念 当前读:该取的是记录的最新版本,读取时还要保证其他并发事务…...
Gateway-网关-分布式服务部署
前言 什么是API⽹关 API⽹关(简称⽹关)也是⼀个服务, 通常是后端服务的唯⼀⼊⼝. 它的定义类似设计模式中的Facade模式(⻔⾯模式, 也称外观模式). 它就类似整个微服务架构的⻔⾯, 所有的外部客⼾端访问, 都需要经过它来进⾏调度和过滤. 常⻅⽹关实现 Spring Cloud Gateway&a…...
火影 遇上 python Baby_Brother_GGY
上视频先~ 66666 import pygame import random import sys import math from pygame.locals import *# 初始化pygame pygame.init() pygame.mixer.init()# 屏幕设置 WIDTH, HEIGHT 1480, 750 screen pygame.display.set_mode((WIDTH, HEIGHT)) py…...
Docker部署MySQL大小写不敏感配置与数据迁移实战20250409
Docker部署MySQL大小写不敏感配置与数据迁移实战 🧭 引言 在企业实际应用中,尤其是使用Java、Hibernate等框架开发的系统,MySQL默认的大小写敏感特性容易引发各种兼容性问题。特别是在Linux系统中部署Docker版MySQL时,默认行为可…...
面试题之网络相关
最近开始面试了,410面试了一家公司 问了我几个网络相关的问题,我都不会!!现在来恶补一下,整理到博客中,好难记啊,虽然整理下来了。在这里先祝愿大家在现有公司好好沉淀,定位好自己的…...
使用MPI-IO并行读写HDF5文件
使用MPI-IO并行读写HDF5文件 HDF5支持通过MPI-IO进行并行读写,这对于大规模科学计算应用非常重要。下面我将提供C和Fortran的示例程序,展示如何使用MPI-IO并行读写HDF5文件。 准备工作 在使用MPI-IO的HDF5之前,需要确保: HDF5库编译时启用…...
[春秋云镜] Tsclient仿真场景
文章目录 靶标介绍:外网mssql弱口令SweetPotato提权上线CSCS注入在线用户进程上线 内网chisel搭建代理密码喷洒攻击映像劫持 -- 放大镜提权krbrelayup提权Dcsync 参考文章 考点: mssql弱口令SweetPotato提权CS注入在线用户进程上线共享文件CS不出网转发上线密码喷洒…...
在人工智能与计算机技术融合的框架下探索高中教育数字化教学模式的创新路径
一、引言 1.1 研究背景 在数字中国战略与《中国教育现代化 2035》的政策导向下,人工智能与计算机技术的深度融合正深刻地重构着教育生态。随着科技的飞速发展,全球范围内的高中教育都面临着培养具备数字化素养人才的紧迫需求,传统的教学模式…...
数据集 handpose_x_plus 3D RGB 三维手势 - 手工绘画 场景 draw picture
数据集 handpose 相关项目地址:https://github.com/XIAN-HHappy/handpose_x_plus 样例数据下载地址:数据集handpose-x-plus3DRGB三维手势-手工绘画场景drawpicture资源-CSDN文库...
deskflow使用教程:一个可以让两台电脑鼠标键盘截图剪贴板共同使用的开源项目
首先去开源网站下载:Release v1.21.2 deskflow/deskflow 两台电脑都要下载这个文件 下载好后直接打开找到你想要的exe desflow.exe 然后你打开他,将两台电脑的TLS都关掉 下面步骤两台电脑都要完成: 电脑点开edit-》preferences 把这个取…...
详解MYSQL表空间
目录 表空间文件 表空间文件结构 行格式 Compact 行格式 变长字段列表 NULL值列表 记录头信息 列数据 溢出页 数据页 当我们使用MYSQL存储数据时,数据是如何被组织起来的?索引又是如何组织的?在本文我们将会解答这些问题。 表空间文…...
Next.js/Nuxt.js 服务端渲染优化
以下是关于 Next.js/Nuxt.js 服务端渲染优化 的系统梳理,涵盖核心概念、性能优化策略、进阶技巧及工具链使用,帮助我们构建高性能的现代 Web 应用: 一、服务端渲染(SSR)核心机制 1. 基础原理对比 框架核心机制优势Next.jsgetServerSideProps 动态渲染实时数据获取,适合动…...
[Windows] 音速启动 1.0.0.0
[Windows] 音速启动 链接:https://pan.xunlei.com/s/VONiGZhtsxpPzze0lDIH-mR9A1?pwdxu7f# [Windows] 音速启动 1.0.0.0 音速启动是一款桌面管理软件,以仿真QQ界面的形式结合桌面工具的特点,应用于软件文件夹网址的快捷操作。...
Hyper-V 虚拟机配置静态IP并且映射到局域网使用
环境 win11hyper-v麒麟v10 配置 编辑文件 vi /etc/sysconfig/network-scripts/ifcfg-eth0文件内容 GATEWAY 需要参考网络中配置的网关地址 TYPEEthernet PROXY_METHODnone BROWSER_ONLYno BOOTPROTOstatic DEFROUTEyes IPV4_FAILURE_FATALno IPV6INITyes IPV6_AUTOCONFyes …...
操作系统基础:06 操作系统历史
我们前面已经讲过了操作系统的基本轮廓、启动过程以及系统调用等相关内容,就如同揭开了钢琴的盖子,对操作系统有了初步的表面认识。从现在起,我们要更深入地剖析操作系统,就像分解钢琴一样,探究其各个部分的构成、原理…...
【大模型微调】如何解决llamaFactory微调效果与vllm部署效果不一致如何解决
以下个人没整理太全 一、生成式语言模型的对话模板介绍 使用Qwen/Qwen1.5-0.5B-Chat训练 对话模板不一样。回答的内容就会不一样。 我们可以看到例如qwen模型的tokenizer_config.json文件,就可以看到对话模板,一般同系列的模型,模板基本都…...
【2025最新】windows本地部署LightRAG,完成neo4j知识图谱保存
之前在服务器部署neo4j失败,无奈只能在本地部署,导致后期所有使用的知识图谱数据都存在本地,这里为了节省时间,先在本地安装LigthRAG完成整个实验流程,后续在学习各种服务器部署和端口调用。从基础和简单的部分先做起来…...
14、nRF52xx蓝牙学习(串口 UART 和 UARTE 外设应用)
一、UART 功能描述 串口 UART 也称为通用异步收发器。是各种处理器中常用了通信接口,在 nRF52 芯片中, UART 具有以下特点: ● 全双工操作 ● 自动流控 ● 奇偶校验产生第 9 位数据 串口 UART 的数据发送与接收流程 : ◆硬件配置…...
FlinkSQL的常用语言
FlinkSQL 常用语言指南 FlinkSQL 是 Apache Flink 提供的 SQL 接口,允许用户使用标准 SQL 或扩展的 SQL 语法来处理流式和批式数据。以下是 FlinkSQL 的常用语言元素和操作: 基本查询 -- 选择查询 SELECT * FROM table_name;-- 带条件的查询 SELECT c…...
DeepSeek轻松入门教程——从入门到精通
大家好,我是吾鳴。 今天吾鳴要给大家分享一份DeepSeek小白轻松入门指导手册——《DeepSeek 15天指导手册,从入门到精通》。指导手册分为基础入门对话篇、效率飞跃篇、场景实战篇、高手进化篇等,按照指导手册操作,DeepSeek从入门到…...
Vue2 老项目升级 Vue3 深度解析教程
Vue2 老项目升级 Vue3 深度解析教程 摘要 Vue3 带来了诸多改进和新特性,如性能提升、组合式 API、更好的 TypeScript 支持等,将 Vue2 老项目升级到 Vue3 可以让项目获得这些优势。本文将深入解析升级过程,涵盖升级前的准备工作、具体升级步骤…...
vue事假机制都有哪些
Vue 的事件机制主要包含以下几种类型和方式,可以分为组件内部事件、父子组件通信事件、原生 DOM 事件封装、修饰符增强等,下面详细分类介绍: 一、DOM 事件绑定(最基础的事件) 使用 v-on(或简写 ࿰…...
WXJ196微机小电流接地选线装置使用简单方便无需维护
WXJ196微机小电流接地选线装置,能在系统发生单相接地时,准确、迅速地选出接地线路母 线。使用简单方便,无需维护,可根据用户需要将相关信息通过通信接口传给上级监控系统, 适用于无人值守变电站。 2 功能及特点 全新的…...
Java第四节:idea在debug模式夏改变变量的值
作者往期文章 Java第一节:debug如何调试程序(附带源代码)-CSDN博客 Java第二节:debug如何调试栈帧链(附带源代码)-CSDN博客 Java第三节:新手如何用idea创建java项目-CSDN博客 步骤一 在需要修改…...
instructor 实现 reranker 功能
目录 代码代码解释1. 导入和初始化2. Label 类定义3. RerankedResults 类4. 重排序函数 示例类似例子例子中的jinjia模板语法变量2. 控制结构条件语句循环语句 代码 import instructor from openai import OpenAI from pydantic import BaseModel, Field, field_validator, Va…...
