当前位置: 首页 > news >正文

使用 Java 更新 Word 文档中的图表数据-超详细

使用 Java 更新 Word 文档中的图表数据

在日常的工作中,尤其是在数据分析和报告自动化的场景中,可能会遇到需要定期更新 Word 文档中的图表数据的需求。比如,生成数据报告时,我们需要在图表中更新一些动态的数据值。今天,我将展示如何使用 Java 和 Apache POI 库来实现这一功能:自动读取 Word 文件中的图表,提取 Excel 数据源,修改数据并更新图表。

背景

我们要处理的是 Word 文档中的图表,而这些图表的数据源存储在嵌入的 Excel 文件中。通过操作 Excel 数据,我们可以更新图表中的数据,并且确保图表会根据新的数据重新渲染。

本篇文章的目标是:

  • 读取 Word 文件中的图表。
  • 提取和修改图表的数据源(嵌入的 Excel 文件)。
  • 更新图表数据,并将修改后的数据嵌入回 Word 文件中。

依赖库

本项目使用了 Apache POI 作为核心库,它支持读取和操作 Word 文档(.docx 文件)和 Excel 文件(.xlsx 文件)。你需要在项目中添加以下依赖:

<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.3</version>
</dependency>
<dependency><groupId>org.apache.xmlbeans</groupId><artifactId>xmlbeans</artifactId><version>5.1.1</version>
</dependency>// 或者 4.0版本<groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.1.2</version></dependency><!-- https://mvnrepository.com/artifact/org.apache.poi/ooxml-schemas --><dependency><groupId>org.apache.poi</groupId><artifactId>ooxml-schemas</artifactId><version>1.4</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.1.2</version></dependency><!-- https://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad --><dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>4.1.2</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml-schemas</artifactId><version>4.1.2</version></dependency>

步骤解析

  1. 读取 Word 文件
    使用 XWPFDocument 读取 Word 文件并获取其中的图表对象。每个图表都是一个 XWPFChart 对象,其中包含了图表的数据源,即嵌入的 Excel 文件。

  2. 提取 Excel 数据源
    从图表中提取嵌入的 Excel 数据源,并将其转化为 XSSFWorkbook 对象。这样我们可以访问 Excel 文件中的工作表,并对其数据进行修改。

  3. 修改 Excel 数据
    在修改 Excel 数据时,我们需要根据预设的规则来替换 Excel 单元格中的值。例如,在单元格中,某些值可能是动态的,需要替换为来自其他地方的数据。我们通过字符串查找和替换的方式来完成这一任务。

  4. 更新图表数据
    修改 Excel 数据后,我们需要将其更新回图表中。通过操作图表的底层 XML,我们可以更新图表的数据引用,并让图表基于新的数据重新绘制。

  5. 保存并覆盖原文件
    最后,我们将修改后的 Word 文件保存,并覆盖原有的文件,以便生成新的报告。

代码实现

以下是实现这个功能的 Java 代码:

import org.apache.poi.xwpf.usermodel.*;
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.xmlbeans.XmlCursor;import java.io.*;
import java.util.List;
import java.util.HashMap;
import java.util.Map;public class WordChartUpdater {static Map<String,Object> cellValueMap = new HashMap<>();static Map<String, Object> tagDataMap = new HashMap<>();static {tagDataMap.put("current_branch_name","测试");tagDataMap.put("ZYJGZB_079","测试x");tagDataMap.put("ZYJGZB_091","11");}public static void updateChartInWord(File wordFile, ChartData chartData) throws IOException {// 1. 读取 Word 文件FileInputStream fis = new FileInputStream(wordFile);XWPFDocument document = new XWPFDocument(fis);// 2. 获取文档中的所有图表List<XWPFChart> charts = document.getCharts();if (charts.isEmpty()) {System.out.println("No charts found in the Word document.");return;}// 3. 获取图表的数据源for (XWPFChart chart : charts) {XSSFWorkbook workbook = getChartDataAsWorkbook(chart);if (workbook == null || workbook.getNumberOfSheets() == 0) {System.out.println("The chart does not have a valid data source.");continue;}// 4. 修改 Excel 数据modifyChartData(workbook, chartData);// 5. 将修改后的 Excel 数据嵌入到 Word 图表中updateChartWithNewData(chart, workbook);}// 6. 保存更新后的 Word 文件(覆盖原文件)FileOutputStream fos = new FileOutputStream(wordFile);document.write(fos);fos.close();fis.close();}private static XSSFWorkbook getChartDataAsWorkbook(XWPFChart chart) throws IOException {try {return chart.getWorkbook();} catch (InvalidFormatException e) {throw new IOException("Failed to extract workbook from chart", e);}}private static void modifyChartData(XSSFWorkbook workbook, ChartData chartData) {XSSFSheet sheetAt = workbook.getSheetAt(0);for (int i = 0; i < 20; i++) {  // 20列20行数据XSSFRow row = sheetAt.getRow(i);if (row == null) {break;}for (int j = 0; j < 20; j++) {XSSFCell cell = row.getCell(j);if (cell == null) {break;}if (CellType.NUMERIC != cell.getCellType() && cell.getStringCellValue().contains("$")) {String key = cell.getStringCellValue();String substring = key.substring(key.lastIndexOf("$"), key.lastIndexOf("}") + 1);if (tagDataMap.get(substring) != null) {String s = key.replace(substring, (String) tagDataMap.get(substring));cell.setCellValue(s);cellValueMap.put(cell.getAddress().toString(), s);} else {cell.setCellValue(0);cellValueMap.put(cell.getAddress().toString(), 0);}}}}}private static void updateChartWithNewData(XWPFChart chart, XSSFWorkbook updatedWorkbook) throws IOException {// 图表数据更新的逻辑...// 评论或者私信即可领取}public static void main(String[] args) throws IOException {// 创建一个示例对象,填充数据ChartData chartData = new ChartData("value_079", "Branch A", "value_091");// 修改 Word 文件File wordFile = new File("D:\\Desktop\\GZRC_ceshi.docx");  // 修改为你的 Word 文件路径updateChartInWord(wordFile, chartData);}
}

代码详解

  • 读取 Word 文件:首先,我们使用 XWPFDocument 从 Word 文件中读取数据。

  • 提取 Excel 数据源:通过 getChartDataAsWorkbook 获取图表数据源,即嵌入在图表中的 Excel 文件。

  • 修改数据modifyChartData 方法根据需求修改 Excel 中的单元格数据,使用 tagDataMap 中的数据进行替换。

  • 更新图表:在 updateChartWithNewData 方法中,我们将修改后的数据更新回图表。

  • 保存更新的 Word 文件:最后,通过 document.write(fos) 将修改后的文件保存回磁盘。

总结

使用 Apache POI 处理 Word 文件中的图表更新是一项非常有用的技能,尤其是在自动化报告生成的过程中。通过对图表数据源(嵌入的 Excel 文件)进行修改,我们可以实现动态更新图表数据并更新 Word 文档,从而大大提高工作效率。

如果你有任何问题,或者遇到困难,欢迎在评论区留言。希望这篇文章能对你有所帮助!


相关文章:

使用 Java 更新 Word 文档中的图表数据-超详细

使用 Java 更新 Word 文档中的图表数据 在日常的工作中&#xff0c;尤其是在数据分析和报告自动化的场景中&#xff0c;可能会遇到需要定期更新 Word 文档中的图表数据的需求。比如&#xff0c;生成数据报告时&#xff0c;我们需要在图表中更新一些动态的数据值。今天&#xf…...

Qt常用控件之下拉框QComboBox

下拉框QComboBox QComboBox 是一个下拉框控件。 1. QComboBox属性 属性说明currentText当前选中的文本。currentIndex当前选中的条目下标&#xff08;从 0 开始&#xff0c;如果没有条目被选中则该值为 -1&#xff09;。editable是否允许被修改。为 true 时&#xff0c;QCom…...

Qt 中集成mqtt协议

一&#xff0c;引入qmqtt 库 我是将整个头文件/源文件都添加到了工程中进行编译&#xff0c;这样 跨平台时 方便&#xff0c;直接编译就行了。 原始仓库路径&#xff1a;https://github.com/emqx/qmqtt/tree/master 二&#xff0c;使用 声明一个单例类&#xff0c;将订阅到…...

2024年第十五届蓝桥杯大赛软件赛省赛Python大学A组真题解析

文章目录 试题A: 拼正方形(本题总分:5 分)解析答案试题B: 召唤数学精灵(本题总分:5 分)解析答案试题C: 数字诗意解析答案试题A: 拼正方形(本题总分:5 分) 【问题描述】 小蓝正在玩拼图游戏,他有7385137888721 个2 2 的方块和10470245 个1 1 的方块,他需要从中挑出一些…...

AI大模型-提示工程学习笔记19-自我反思

目录 1. 自我反思的核心思想 (1) LLM 的局限性 (2) Reflexion 的解决方案 2. Reflexion 的工作流程 (1) 任务输入 (2) 初始生成 (3) 反思 (Reflection) (4) 调整与改进 (5) 迭代 (6) 结果输出 3. Reflexion 的关键组件 (1) 大语言模型 (LLM) (2) 反思者 (Reflector…...

GaussDB 学习实战指南:从部署到高并发优化的全流程解析

引言 GaussDB 作为华为推出的高性能分布式数据库,凭借其 分布式架构、高可用性、云原生支持 等特性,成为企业级应用的核心选择。本文将以 实战操作为核心,覆盖 集群部署、数据分片、性能调优、容灾备份、云上迁移 五大场景,通过真实案例与代码示例,助你快速掌握 GaussDB …...

vue3 Props的使用

Props是什么&#xff1f; 官方地址&#xff1a;Props | Vue.js 在 Vue 中&#xff0c;props 是父组件向子组件传递数据的一种机制。 props 是子组件中定义的自定义属性&#xff0c;父组件通过这些属性向子组件传递数据。 它们是单向数据流的一部分&#xff0c;意味着数据只能…...

Ecode前后端传值

说明 在泛微 E9 系统开发过程中&#xff0c;使用 Ecode 调用后端接口并进行传值是极为常见且关键的操作。在上一篇文章中&#xff0c;我们探讨了 Ecode 调用后端代码的相关内容&#xff0c;本文将深入剖析在 Ecode 中如何向后端传值&#xff0c;以及后端又该如何处理接收这些值…...

【Linux】进程状态(二)

目录 前言&#xff1a; 一、进程状态&#xff1a; 1.运行状态(时间片) 2.阻塞状态 3.阻塞挂起状态 二、Linux进程状态&#xff1a; 1.运行状态(R)和阻塞状态(S) 2.深度睡眠状态(D) 3.停止状态(T) 3.1使进程在后台运行 4.追踪暂停状态(t) 5.死亡状态(X)和僵尸状态…...

domain 网络安全 网络安全域

&#x1f345; 点击文末小卡片 &#xff0c;免费获取网络安全全套资料&#xff0c;资料在手&#xff0c;涨薪更快 文章目录 1、域的概述 1.1、工作组与域1.2、域的特点1.3、域的组成1.4、域的部署概述1.5、活动目录1.6、组策略GPO 2、域的部署实验 2.1、建立局域网&#xf…...

链表和STL —— list 【复习笔记】

1. 链表 1.1 链表的定义和类型 和顺序表一样&#xff0c;链表也是一种线性表&#xff0c;线性表存储结构为链式存储就是链表 链式存储不仅要保存数据元素&#xff0c;还要保存数据元素间的关系&#xff0c;这两个部分信息形成了结点。结点有两个域&#xff1a;数据域&#x…...

Java Map实现类面试题

Java Map实现类面试题 HashMap Q1: HashMap的实现原理是什么&#xff1f; HashMap基于哈希表实现&#xff0c;使用数组链表红黑树&#xff08;Java 8&#xff09;的数据结构。 public class HashMapPrincipleExample {// 模拟HashMap的基本结构public class SimpleHashMap&…...

技术架构和工程架构区别

技术架构 技术架构‌是对某一技术问题解决方案的结构化描述&#xff0c;包括组件结构及其交互关系。它涵盖部署方案、存储方案、缓存方案、日志方案等多个方面&#xff0c;旨在通过组织人员和技术&#xff0c;以最低的成本满足需求和应对变化&#xff0c;保障软件的稳定高效运…...

简单介绍JVM

1.什么是JVM&#xff1f; JVM就是Java虚拟机【Java Virtual Machine】&#xff0c;简称JVM。主要部分包括类加载子系统&#xff0c;运行时数据区&#xff0c;执行引擎&#xff0c;本地方法库等&#xff0c;接下来我们一一介绍 2.类加载子系统 JVM中运行的就是我们日常写的JA…...

纷析云:赋能企业财务数字化转型的开源解决方案

在企业数字化转型的浪潮中&#xff0c;财务管理的高效与安全成为关键。纷析云凭借其开源、安全、灵活的财务软件解决方案&#xff0c;为企业提供了一条理想的转型路径。 一、开源的力量&#xff1a;自主、安全、高效 纷析云的核心优势在于其100%开源的财务软件源码。这意味着…...

DeepSeek开源周第二弹:DeepEP如何用RDMA+FP8让MoE模型飞起来?

一、引言&#xff1a;MoE模型的通信瓶颈与DeepEP的诞生 在混合专家&#xff08;MoE&#xff09;模型训练中&#xff0c;专家间的全对全&#xff08;All-to-All&#xff09;通信成为性能瓶颈。传统方案在跨节点传输时带宽利用率不足50%&#xff0c;延迟高达300μs以上。DeepSee…...

NLP学习记录十:多头注意力

一、单头注意力 单头注意力的大致流程如下&#xff1a; ① 查询编码向量、键编码向量和值编码向量分别经过自己的全连接层&#xff08;Wq、Wk、Wv&#xff09;后得到查询Q、键K和值V&#xff1b; ② 查询Q和键K经过注意力评分函数&#xff08;如&#xff1a;缩放点积运算&am…...

【MySql】EXPLAIN执行计划全解析:15个字段深度解读与调优指南

文章目录 一、执行计划核心字段总览二、关键字段深度拆解1. type&#xff08;访问类型&#xff09;——查询性能的晴雨表典型场景分析&#xff1a; 2. key_len&#xff08;索引使用长度&#xff09;——索引利用率的检测仪计算示例&#xff1a; 3. Extra&#xff08;附加信息&a…...

论文笔记(七十二)Reward Centering(五)

Reward Centering&#xff08;五&#xff09; 文章概括摘要附录B 理论细节C 实验细节D 相关方法的联系 文章概括 引用&#xff1a; article{naik2024reward,title{Reward Centering},author{Naik, Abhishek and Wan, Yi and Tomar, Manan and Sutton, Richard S},journal{arX…...

Linux内核自定义协议族开发指南:理解net_device_ops、proto_ops与net_proto_family

在Linux内核中开发自定义协议族需要深入理解网络协议栈的分层模型。net_device_ops、proto_ops和net_proto_family是三个关键结构体,分别作用于不同的层次。本文将详细解析它们的作用、交互关系及实现方法,并提供一个完整的开发框架。 一、核心结构体的作用与层级关系 struct…...

彻底告别Windows Defender烦恼:开源控制工具让你的电脑真正属于你

彻底告别Windows Defender烦恼&#xff1a;开源控制工具让你的电脑真正属于你 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-con…...

如何用ComfyUI ControlNet预处理器打造精准AI图像控制:从入门到精通

如何用ComfyUI ControlNet预处理器打造精准AI图像控制&#xff1a;从入门到精通 【免费下载链接】comfyui_controlnet_aux ComfyUIs ControlNet Auxiliary Preprocessors 项目地址: https://gitcode.com/gh_mirrors/co/comfyui_controlnet_aux 在AI图像生成的世界里&…...

电商客服+导购智能体的设计与开发翁

这个代码的核心功能是&#xff1a;基于输入词的长度动态选择反义词示例&#xff0c;并调用大模型生成反义词&#xff0c;体现了 “动态少样本提示&#xff08;Dynamic Few-Shot Prompting&#xff09;” 与 “上下文长度感知的示例选择” 的能力。 from langchain.prompts impo…...

HMCL启动器:3分钟快速上手跨平台Minecraft游戏体验

HMCL启动器&#xff1a;3分钟快速上手跨平台Minecraft游戏体验 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL 还在为不同平台安装Minecraft而烦恼吗&#xff1…...

napari六种图层类型完全解析:从Image到Surface的完整教程

napari六种图层类型完全解析&#xff1a;从Image到Surface的完整教程 【免费下载链接】napari napari: a fast, interactive, multi-dimensional image viewer for python 项目地址: https://gitcode.com/gh_mirrors/na/napari napari是一款快速、交互式的多维图像查看器…...

ChatGLM3-6B与Kubernetes集成:云原生部署实战

ChatGLM3-6B与Kubernetes集成&#xff1a;云原生部署实战 1. 引言 在人工智能快速发展的今天&#xff0c;如何高效部署和管理大语言模型成为了许多开发者和企业面临的实际问题。传统的单机部署方式虽然简单&#xff0c;但在面对高并发访问、弹性扩缩容和故障恢复等场景时显得…...

Qwen3-ASR-1.7B在Windows下的WSL2部署教程

Qwen3-ASR-1.7B在Windows下的WSL2部署教程 1. 开篇&#xff1a;语音识别新选择 如果你正在Windows上寻找一个好用的语音识别工具&#xff0c;Qwen3-ASR-1.7B可能是个不错的选择。这个模型支持30种语言和22种中文方言的识别&#xff0c;效果相当不错。最重要的是&#xff0c;它…...

QtCreator中文输入终极指南:Fcitx5插件编译与配置全流程(避坑版)

QtCreator中文输入终极指南&#xff1a;Fcitx5插件编译与配置全流程&#xff08;避坑版&#xff09; 在Linux环境下使用QtCreator进行开发时&#xff0c;中文输入问题一直是困扰开发者的常见痛点。不同于Windows或macOS系统&#xff0c;Linux平台的输入法框架更为复杂&#xff…...

字符串拼接用“+”还是 StringBuilder?别再凭感觉写了辜

前言 Kubernetes 本身并不复杂&#xff0c;是我们把它搞复杂的。无论是刻意为之还是那种虽然出于好意却将优雅的原语堆砌成 鲁布戈德堡机械 的狂热。平台最初提供的 ReplicaSets、Services、ConfigMaps&#xff0c;这些基础组件简单直接&#xff0c;甚至显得有些枯燥。但后来我…...

智慧教室整体建设服务商怎么选?广凌股份给出四大参考

“设备装上了&#xff0c;老师不会用&#xff1b;系统对接了&#xff0c;数据不通&#xff1b;项目验收了&#xff0c;后续没人管。”在2026年教育信息化论坛上&#xff0c;一位高校信息化负责人的这番话引发了不少共鸣。智慧教室建设已进入深水区&#xff0c;选择一家可靠的智…...