Dom4j详细介绍
Dom4j
1.1 解析概览
将数据存储为XML格式后,程序化地访问这些数据变得至关重要。虽然Java基础的IO操作能够实现这一目标,但这一过程往往既复杂又繁琐,尤其是在处理大型文件或需要频繁读写操作的场景下。为了解决这些问题,开发者们引入了多种XML解析方式及其对应的解析器,旨在简化XML数据的处理过程。
1.2 解析方式与解析器详解
在Java开发中,三种主流的XML解析方式各自拥有其独特的优势和应用场景:
-
DOM(Document Object Model)解析
DOM解析方法将整个XML文档加载到内存中,并构建成一个树状结构的
Document对象。这种解析方式的主要优点在于,它允许开发者以直观的方式访问XML文档的各个部分,因为元素之间的结构关系在内存中得到了完整保留。因此,DOM非常适合需要进行复杂查询、修改或添加元素到XML文档的场景。然而,对于大型XML文件而言,DOM解析可能会消耗大量内存,甚至导致内存溢出问题。 -
SAX(Simple API for XML)解析
SAX解析器采用了一种更为高效且资源消耗较少的方法来处理XML数据。它不会将整个文档加载到内存中,而是逐行扫描XML文档,并在遇到特定元素或结构时触发相应的事件。这种基于事件的解析方式使得SAX在处理大型文件时具有显著的优势,因为它能够即时释放不再需要的资源。然而,SAX的一个主要限制是它仅支持读取操作,不支持对XML文档的修改。此外,由于其事件驱动的特性,SAX的解析逻辑可能相对复杂,需要开发者编写更多的处理代码。
-
PULL(Android特有)
PULL是Android平台内置的一种XML解析方式,它与SAX在原理上相似,但提供了更多的控制权和灵活性。PULL解析允许开发者从XML流中主动拉取(pull)解析事件,而不是像SAX那样被动接收(push)事件。这种机制使得开发者可以更精确地控制解析过程,特别是在处理复杂或嵌套的XML结构时。然而,需要注意的是,PULL解析方式并非Java标准库的一部分,它主要适用于Android开发环境。
解析器的作用:
解析器是根据不同的解析方式提供具体实现的工具。它们负责将XML文档转换为程序可以操作的格式(如Document对象、事件流等)。为了方便开发者的使用,许多第三方库提供了易于操作的解析开发包,这些包通常封装了底层的复杂逻辑,提供了更加简洁和直观的API接口。
2 Dom4j的基本使用
2.1 DOM解析原理及结构模型
解析原理
DOM(Document Object Model)解析的核心原理在于将整个XML文档一次性加载到内存中,构建成一个树状结构,即DOM树。这个过程中,XML文档中的每个元素、属性、文本内容等都被映射为内存中的一个对象,最终形成一个完整的Document对象。通过这个Document对象,开发者可以方便地遍历、查询、修改或添加XML文档的内容,因为DOM树在内存中完整地保留了XML文档的结构和关系。
以books.xml文档为例,当使用DOM解析器对其进行解析时,解析器会读取整个文档内容,并在内存中构建一个与之对应的DOM树。这个DOM树的根节点通常是一个Document对象,它包含了XML文档的所有信息。从Document对象出发,开发者可以逐级访问到XML文档中的各个元素节点、属性节点和文本节点,进而实现对XML文档的操作。
<?xml version="1.0" encoding="UTF-8"?>
<books><book id="0001"> <name>JavaWeb开发教程</name><author>张孝祥</author><sale>100.00元</sale></book><book id="0002"><name>三国演义</name><author>罗贯中</author><sale>100.00元</sale></book>
</books>
2.2 常用的方法


1. 创建SAXReader对象并加载XML文件
SAXReader sr = new SAXReader();
Document doc = sr.read("day15/xml/book.xml");
- SAXReader是Dom4j库中用于读取XML文件的类。这里创建了一个
SAXReader的实例。 - 使用
sr.read("day15/xml/book.xml")方法加载位于day15/xml/目录下的book.xml文件,并将其解析为一个Document对象。这个Document对象代表了整个XML文档的内存中结构。
2. 获取根元素
java复制代码Element rootElement = doc.getRootElement();
- 通过
Document对象的getRootElement()方法获取XML文档的根元素。在XML中,根元素是最高级别的元素,其他所有元素都是它的子元素或子元素的子元素。
3. 解析子元素
java复制代码List<Element> bookElements = rootElement.elements("book");
- 使用
Element对象的elements(String name)方法获取根元素下所有名为book的子元素。这个方法返回一个List<Element>,包含了所有找到的book元素。
4. 遍历book元素并解析其内容
for (Element bookElement : bookElements) { // ...
}
- 使用for-each循环遍历
bookElements列表中的每个book元素。
在循环体内:
- 使用
attributeValue(String name)方法获取book元素的id属性值。 - 使用
elementText(String name)方法获取book元素下名为name、author和sale的子元素的文本内容。这个方法简化了获取子元素文本内容的操作,因为它直接返回了子元素的文本内容,而不是子元素对象本身。
5. 输出结果
- 使用
System.out.println输出每个book元素的id、name、author和sale信息,并在每个book元素的信息后打印一行分隔符----------------------,以便于区分不同的book元素信息。
相关文章:
Dom4j详细介绍
Dom4j 1.1 解析概览 将数据存储为XML格式后,程序化地访问这些数据变得至关重要。虽然Java基础的IO操作能够实现这一目标,但这一过程往往既复杂又繁琐,尤其是在处理大型文件或需要频繁读写操作的场景下。为了解决这些问题,开发者…...
thissuper
this&super 一、 this this关键字表示调用的是当前类的成员变量或者成员方法 一般情况下,可以省略this关键字直接调用成员变量以及成员方法但当方法的形参与成员变量同名时,如果要在方法内使用成员变量,必须添加this关键字指明使用的是…...
cv::normalize()
cv::normalize()函数是OpenCV库中用于对矩阵或图像数据进行归一化处理的工具。归一化是图像处理和计算机视觉中常见的预处理步骤,它可以确保数据在一定范围内,从而有助于后续的处理和算法的稳定性和性能。cv::normalize()函数可以将输入矩阵的值缩放到一…...
【Python快速入门和实践016】Python常用脚本-对视频抽取指定帧数并保存
一、功能介绍 这段代码的功能是从一个视频文件中抽取指定数量的帧,并将这些帧保存为图像文件。步骤如下: 设置路径和参数: video_path:视频文件的路径。image_folder:保存抽取图像的目录。num_frames_to_extract&#…...
[Linux CMD] 目录与文件相关的命令
. 代表次层目录 .. 代表上一层目录 - 代表前一个工作目录 ~ 代表目前使用者身份所在的家目录 ~account 代表account这个使用者的家目录(account是个账号名称)…...
redis面试(十三)公平锁排队代码剖析
我们来看一下第二种redis分布式锁 第一种锁是可重入锁,非公平可重入锁,所谓的非公平可重入锁是什么意思呢?胡乱的争抢,根本没有任何公平性和顺序性可言 第二种锁,可重入锁,公平锁 通过公平锁,…...
冷热数据拆分
订单系统设计方案之如何做历史订单和归档 订单数据越来越多,数据库越来越慢该怎么办? 随着历史订单不断累积,2017年MySQL中订单表数据量已达千万级。之后的订单数据,远远大于亿级 对数据量大的问题,进行了以下优化…...
JavaScript 基础(四)
五、DOM编程 1.常用事件 onload 页面加载后触发事件 onscroll 滚动时触发 onresize 尺寸变化时 onclick 鼠标点击 onmouseover 鼠标悬停 onmouseout 鼠标移出 onmousemove 鼠标移动,会触发多次 onfocus 对象获得光标(焦点)时&#x…...
《机器学习by周志华》学习笔记-神经网络-01神经元模型
1、背景 本书所谈的「人工神经网络」不是生物学意义的神经网络。这是T.Kohonen 1988年在Neural Networks创刊号上给出的定义。 2、概念 2.1、神经网络 关于「神经网络(neural networks)」的研究很早就已经出现过,今天的「神经网络」已经是一个比较大且多学科交叉的领域,其…...
C#中常用的扩展类
/// <summary>/// 常用扩展/// </summary>public static class UsualExtension{public static string[] chineseNumbers { "零", "一", "二", "三", "四", "五", "六", "七", &…...
麒麟v10(ky10.x86_64)升级——openssl-3.2.2、openssh-9.8p1
系统版本: ky10.x86_64 下载安装包并上传 openssh下载地址 https://cdn.openbsd.org/pub/OpenBSD/OpenSSH/portable openssl下载地址 https://openssl-library.org/source/index.html zlib下载地址 https://zlib.net/fossils/ 上传安装包 备份配置文件 cp -r /etc/ssh /et…...
【Unity】有限状态机和抽象类多态
一、介绍 有限状态机是一个用来进行对象状态管理的计算模型。它由一组状态、一个或者多个触发事件以及状态之间的转换条件所组成。 对于任意一个游戏对象,我们可以为其编写一个或者多个状态机,使其能够在不同状态下有不同的决策和运作机制。 核心思想…...
KETTLE调用http传输中文参数的问题
场景:检查服务器异常(hive)服务,就通过http发送一条短信到手机上,内容类似:【通知】 S T A R T D A T E h i v e 服务检测异常 {START_DATE}_hive服务检测异常 STARTDATEhive服务检测异常{DB_ID}&#…...
Gaussian Splatting 在 Ubuntu22.04 下部署
代码:graphdeco-inria/gaussian-splatting (github) 论文:[2308.04079] 3D Gaussian Splatting for Real-Time Radiance Field Rendering (arxiv.org) 1. 禁用自带驱动 Nouveau Ubuntu 自带的显卡驱动,是非Nvida官方版。在后面装cuda的时候,会报驱动不兼容问题。 1.进入…...
ppt中添加页码(幻灯片编号)及问题解决方案
在幻灯片母版中,选择插入 幻灯片编号 右下角显示幻灯片编号 问题一:母版中没有显示编号 原因可能是母版版式中没有设置显示,勾选即可。 问题二:子母版中没有显示幻灯片 将母版中的编号复制到子母版中。 问题三:应用…...
Flutter 初识:对话框和弹出层
Flutter对话框和弹出层小结 对话框AlertDialog属性解析 showDialog属性解析示例 SimpleDialog示例 AboutDialog属性解析示例 Custom Full-Screen Dialog示例 带动画效果的CustomDialog(showGeneralDialog)属性解析示例 自定义Dialog属性解析示例 输入对话…...
启程与远征Ⅳ--人工智能革命尚未发生
人工智能有望彻底改变工作场所。到目前为止,已经有人工智能工具可以取代或增强每一项工作,并使生产力飞速提升。甚至有许多人预测,文案写作等整个行业将在未来几年内被人工智能工具完全取代。但是,如果你抛开炒作,看看…...
Python教程(十五):IO 编程
目录 专栏列表引言基础概念什么是IO? 同步IO vs 异步IO同步IO(Synchronous IO)异步IO(Asynchronous IO) Python中的IO标准IO标准输入和输出 文件IO文件操作的上下文管理器打开文件读取文件操作内存中的数据 高级文件操…...
Qt窗口交互场景、子窗口数据获取
一、前言 在现代软件开发中,图形用户界面(GUI)的设计不仅仅关乎美观,更在于用户体验和功能的无缝衔接。Qt框架以其强大的跨平台能力和丰富的组件库,成为众多开发者构建GUI应用的首选工具。在Qt应用中,窗口…...
【C++学习笔记 18】C++中的隐式构造函数
举个例子 #include <iostream> #include <string>using String std::string;class Entity{ private:String m_Name;int m_Age; public:Entity(const String& name):m_Name(name), m_Age(-1) {}Entity(int age) : m_Name("UnKnown"), m_Age(age) {}…...
Unity3D中Gfx.WaitForPresent优化方案
前言 在Unity中,Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染(即CPU被阻塞),这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案: 对惹,这里有一个游戏开发交流小组&…...
服务器硬防的应用场景都有哪些?
服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式,避免服务器受到各种恶意攻击和网络威胁,那么,服务器硬防通常都会应用在哪些场景当中呢? 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...
Reasoning over Uncertain Text by Generative Large Language Models
https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述 文本中的不确定性在许多语境中传达,从日常对话到特定领域的文档(例如医学文档)(Heritage 2013;Landmark、Gulbrandsen 和 Svenevei…...
LINUX 69 FTP 客服管理系统 man 5 /etc/vsftpd/vsftpd.conf
FTP 客服管理系统 实现kefu123登录,不允许匿名访问,kefu只能访问/data/kefu目录,不能查看其他目录 创建账号密码 useradd kefu echo 123|passwd -stdin kefu [rootcode caozx26420]# echo 123|passwd --stdin kefu 更改用户 kefu 的密码…...
Git常用命令完全指南:从入门到精通
Git常用命令完全指南:从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...
Mysql故障排插与环境优化
前置知识点 最上层是一些客户端和连接服务,包含本 sock 通信和大多数jiyukehuduan/服务端工具实现的TCP/IP通信。主要完成一些简介处理、授权认证、及相关的安全方案等。在该层上引入了线程池的概念,为通过安全认证接入的客户端提供线程。同样在该层上可…...
运动控制--BLDC电机
一、电机的分类 按照供电电源 1.直流电机 1.1 有刷直流电机(BDC) 通过电刷与换向器实现电流方向切换,典型应用于电动工具、玩具等 1.2 无刷直流电机(BLDC) 电子换向替代机械电刷,具有高可靠性,常用于无人机、高端家电…...
【Elasticsearch基础】Elasticsearch批量操作(Bulk API)深度解析与实践指南
目录 1 Bulk API概述 1.1 什么是批量操作 1.2 Bulk API的优势 2 Bulk API的工作原理 2.1 请求处理流程 2.2 底层机制 3 Bulk API的使用方法 3.1 基本请求格式 3.2 操作类型示例 3.3 响应格式 4 Bulk API的最佳实践 4.1 批量大小优化 4.2 错误处理策略 4.3 性能调…...
Windows开机自动启动中间件
WinSW(Windows Service Wrapper 是一个开源的 Windows 服务包装器,它可以帮助你将应用程序打包成系统服务,并实现开机自启动的功能。 一、下载 WinSW 下载 WinSW-x64.exe v2.12.0 (⬇️ 更多版本下载) 和 sample-minimal.xml 二、配置 WinS…...
分类数据集 - 场景分类数据集下载
数据集介绍:自然场景分类数据集,真实场景高质量图片数据;适用实际项目应用:自然场景下场景分类项目,以及作为通用场景分类数据集场景数据的补充;数据集类别:buildings、forest、glacier、mounta…...
