当前位置：首页 > news >正文

【Java】使用Apache POI识别PPT中的图片和文字，以及对应的大小、坐标、颜色、字体等

news 2026/2/10 1:16:25

本文介绍如何使用Apache POI识别PPT中的图片和文字，获取图片的数据、大小、尺寸、坐标，以及获取文字的字体、大小、颜色、坐标。

官方文档：https://poi.apache.org/components/slideshow/xslf-cookbook.html

官方文档和网上的资料介绍的很少，很多元素，需要一点点尝试才能获取到。

注意：本篇文章针对.pptx结尾的PPT文件

引入依赖：

 		<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>5.0.0</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.0.0</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>5.0.0</version></dependency>

核心代码：

	private static final String FILE_PATH = "/Temp/PPT/test.pptx";private static final String OUTPUT_PATH = "/Temp/PPT/output/";private static final String RGBA_TEMPLATE = "rgba(%d,%d,%d,1)";public static void main(String[] args) {analysisPpt(FILE_PATH);}public static void analysisPpt(String filePath) {try {InputStream input = new FileInputStream(filePath);XMLSlideShow xss = new XMLSlideShow(input);//getSlides(); 返回幻灯片中找到的所有普通幻灯片List<XSLFSlide> xslfSlideList = xss.getSlides();for (XSLFSlide xslfSlide : xslfSlideList) {//HSLFShape表示工作表中包含的所有形状（幻灯片或注释）List<XSLFShape> shapes = xslfSlide.getShapes();handleShapes(shapes);}} catch (Exception e) {e.printStackTrace();}}private static void handleShapes(final List<XSLFShape> shapes) throws Exception {for (XSLFShape shape : shapes) {if (shape instanceof XSLFGroupShape) {XSLFGroupShape groupShape = ((XSLFGroupShape) shape);// 对XSLFGroupShape进行递归处理handleShapes(groupShape.getShapes());} else if (shape instanceof XSLFTextShape) {XSLFTextShape xslfTextShape = ((XSLFTextShape) shape);List<XSLFTextParagraph> textParagraphs = xslfTextShape.getTextParagraphs();XSLFTextRun textRun = textParagraphs.get(0).getTextRuns().get(0);Rectangle2D anchor = xslfTextShape.getAnchor();PaintStyle fontColor = textRun.getFontColor();Color color = null;if (Objects.nonNull(fontColor)) {if (fontColor instanceof PaintStyle.SolidPaint) {PaintStyle.SolidPaint solidPaint = (PaintStyle.SolidPaint) fontColor;color = solidPaint.getSolidColor().getColor();} else if (fontColor instanceof XSLFTexturePaint) {// 一些大标题是该类型，暂无法获取大标题文字颜色XSLFTexturePaint texturePaint = (XSLFTexturePaint) fontColor;System.out.println("todo: XSLFTexturePaint ");} else {System.out.println("not match: " + fontColor.getClass());}}String fill = "";if (Objects.nonNull(color)) {fill = String.format(RGBA_TEMPLATE, color.getRed(), color.getGreen(), color.getBlue());}System.out.printf("[text]: %s \n[font]: %s [size]: %s [x,y]: (%s,%s) [color]: %s \n", xslfTextShape.getText(),textRun.getFontFamily(), textRun.getFontSize(), anchor.getX(), anchor.getY(), fill);System.out.println("----------------------------");} else if (shape instanceof XSLFPictureShape) {XSLFPictureShape xslfPictureShape = ((XSLFPictureShape) shape);XSLFPictureData pictureData = xslfPictureShape.getPictureData();// 图片数据byte[] data = pictureData.getData();savePicture(data, pictureData.getFileName());Dimension dimensionInPixels = pictureData.getImageDimensionInPixels();Rectangle2D anchor = xslfPictureShape.getAnchor();System.out.printf("[picture name]: %s: [size]: %s * %s [X,Y]: (%s,%s) \n", pictureData.getFileName(), dimensionInPixels.getWidth(),dimensionInPixels.getHeight(), anchor.getX(), anchor.getY());} else {System.out.println("unknown shape：" + shape.getClass());}}}private static void savePicture(final byte[] data, final String fileName) throws IOException {FileOutputStream out = new FileOutputStream(OUTPUT_PATH + fileName);out.write(data);out.close();}

【Java】使用Apache POI识别PPT中的图片和文字，以及对应的大小、坐标、颜色、字体等

本文介绍如何使用Apache POI识别PPT中的图片和文字，获取图片的数据、大小、尺寸、坐标，以及获取文字的字体、大小、颜色、坐标。官方文档：https://poi.apache.org/components/slideshow/xslf-cookbook.html 官方文档和网上的资料介绍的很少…...

编程日记 2023/8/20 14:46:05

根据源码，模拟实现 RabbitMQ - 实现消息持久化，统一硬盘操作(3)

目录一、实现消息持久化 1.1、消息的存储设定 1.1.1、存储方式 1.1.2、存储格式约定 1.1.3、queue_data.txt 文件内容 1.1.4、queue_stat.txt 文件内容 1.2、实现 MessageFileManager 类 1.2.1、设计目录结构和文件格式 1.2.2、实现消息的写入 1.2.3、实现消息的删除…...

编程日记 2023/8/20 14:45:01

找到所有数组中消失的数（C语言详解）

题目：找到所有数组中消失的数题目详情： 给你一个含 n 个整数的数组 nums ，其中 nums[i] 在区间 [1,n] 内。请你找出所以在 [1,n] 范围内但没有出现在 nums 中的数字，并以数组的形式返回结果。示例1： 输入&#xf…...

编程日记 2023/8/20 14:43:59

计算机毕设项目之基于django+mysql的疫情实时监控大屏系统(前后全分离)

系统阐述的是一款新冠肺炎疫情实时监控系统的设计与实现，对于Python、B/S结构、MySql进行了较为深入的学习与应用。主要针对系统的设计，描述，实现和分析与测试方面来表明开发的过程。开发中使用了 django框架和MySql数据库技术搭建系统的整体…...

编程日记 2023/8/20 14:42:58

Unity UI内存泄漏优化

项目一运行，占用的内存越来越多，不会释放，导致GC越来越频繁，越来越慢，这些都是为什么呢，今天从UI方面谈起。首先让我们来聊聊什么是内存泄漏呢？ 一般来讲内存泄漏就是指我们的应用向内存申请…...

编程日记 2023/8/20 14:41:57

学习笔记：Opencv实现图像特征提取算法SIFT

2023.8.19 为了在暑假内实现深度学习的进阶学习，特意学习一下传统算法，分享学习心得，记录学习日常 SIFT的百科： SIFT Scale Invariant Feature Transform, 尺度不变特征转换全网最详细SIFT算法原理实现_ssift算法_Tc.小浩的博客…...

编程日记 2023/8/20 14:40:54

【golang】接口类型（interface）使用和原理

接口类型的类型字面量与结构体类型的看起来有些相似，它们都用花括号包裹一些核心信息。只不过，结构体类型包裹的是它的字段声明，而接口类型包裹的是它的方法定义。接口类型声明中的这些方法所代表的就是该接口的方法集合。一个接口的方法集…...

编程日记 2023/8/20 14:39:53

【Linux操作系统】Linux系统编程中的共享存储映射（mmap）

在Linux系统编程中，进程之间的通信是一项重要的任务。共享存储映射（mmap）是一种高效的进程通信方式，它允许多个进程共享同一个内存区域，从而实现数据的共享和通信。本文将介绍共享存储映射的概念、原理、使用方法和注意…...

编程日记 2023/8/20 14:38:52

2235.两整数相加：19种语言解法（力扣全解法）

【LetMeFly】2235.两整数相加：19种语言解法（力扣全解法） 力扣题目链接：https://leetcode.cn/problems/add-two-integers/ 给你两个整数 num1 和 num2，返回这两个整数的和。示例 1： 输入：num…...

编程日记 2023/8/20 14:37:50

中国剩余定理及扩展

目录中国剩余定理解释中国剩余定理扩展——求解模数不互质情况下的线性方程组： 代码实现： 互质： 非互质： 中国剩余定理解释在《孙子算经》中有这样一个问题：“今有物不知其数，三三数之剩二&#x…...

编程日记 2023/8/20 14:36:48

数据在内存中的存储（deeper）

数据在内存中的存储（deeper） 一.数据类型的详细介绍二.整形在内存中的存储三.浮点型在内存中的存储一.数据类型的详细介绍类型的意义： 使用这个类型开辟内存空间的大小（大小决定了使用范围）如何看待内存空间的视角…...

编程日记 2023/8/20 14:35:46

算法修炼Day52|● 300.最长递增子序列 ● 674. 最长连续递增序列 ● 718. 最长重复子数组

LeetCode:300.最长递增子序列 300. 最长递增子序列 - 力扣（LeetCode） 1.思路 dp[i]的状态表示以nums[i]为结尾的最长递增子序列的个数。 dp[i]有很多个，选择其中最大的dp[i]Math.max(dp[j]1,dp[i]) 2.代码实现 1class Solution {2 pub…...

编程日记 2023/8/20 14:34:44

使用 HTML、CSS 和 JavaScript 创建实时 Web 编辑器

使用 HTML、CSS 和 JavaScript 创建实时 Web 编辑器在本文中，我们将创建一个实时网页编辑器。这是一个 Web 应用程序，允许我们在网页上编写 HTML、CSS 和 JavaScript 代码并实时查看结果。这是学习 Web 开发和测试代码片段的绝佳工具。我们将使用ifram…...

编程日记 2023/8/20 14:33:43

百望云联合华为发布票财税链一体化数智解决方案赋能企业数字化升级

随着数据跃升为数字经济关键生产要素，数据安全成为整个数字化建设的重中之重。为更好地帮助企业发展，中央及全国和地方政府相继出台了多部与数据相关的政策法规，鼓励各领域服务商提供具有自主创新的软件产品与服务，帮助企业在合规…...

编程日记 2023/8/20 14:32:42

实现两个栈模拟队列

实现两个栈模拟队列思路：可以想象一下左手和右手，两个栈：stack1（数据所在的栈） ，stack2（临时存放）。入队：需要将入队 num 加在 stack1 的栈顶即可； 出队&am…...

编程日记 2023/8/20 14:31:41

无涯教程-TensorFlow - 单词嵌入

Word embedding是从离散对象(如单词)映射到向量和实数的概念，可将离散的输入对象有效地转换为有用的向量。 Word embedding的输入如下所示: blue: (0.01359, 0.00075997, 0.24608, ..., -0.2524, 1.0048, 0.06259) blues: (0.01396, 0.11887, -0.48963, ..., 0.03…...

编程日记 2023/8/20 14:30:40

Facebook AI mBART：巴别塔的硅解

2018年，谷歌发布了BERT（来自transformers的双向编码器表示），这是一种预训练的语言模型，在一系列自然语言处理（NLP）任务中对SOTA结果进行评分，并彻底改变了研究领域。类似的基于变压器…...

编程日记 2023/8/20 14:29:39

BDA初级分析——SQL清洗和整理数据

一、数据处理数据处理之类型转换字符格式与数值格式存储的数据，同样是进行大小排序， 会有什么区别？ 以rev为例，看看字符格式与数值格式存储时，排序会有什么区别？ 用cast as转换为字符后进行排序 SEL…...

编程日记 2023/8/20 14:28:37

汽车后视镜反射率测定仪

后视镜是驾驶员坐在驾驶室座位上直接获取汽车后方、侧方和下方等外部信息的工具。它起着“第三只眼睛”的作用。后视镜按安装位置划分通常分为车外后视镜、监视镜和内后视镜。外后视镜观察汽车后侧方监视镜观察汽车前下方内后视镜观察汽车后方及车内情况。用途不一样镜面结构也…...

编程日记 2023/8/20 14:27:36

Redis学习笔记

redis相关内容默认端口6379 默认16个数据库，初始默认使用0号库使用select 切换数据库统一密码管理，所有库密码相同 dbsize：查看当前库key的数量 flushdb：清空当前库 flushall：清空全部库 redis是单线程多路…...

编程日记 2023/8/20 14:26:35

浏览器访问 AWS ECS 上部署的 Docker 容器（监听 80 端口）

✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义（Task Definition&…...

编程新知 2026/2/8 15:03:14

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

大家好，欢迎来到《云原生核心技术》系列的第七篇！ 在上一篇，我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在，我们就像一个拥有了一块崭新数字土地的农场主，是时…...

编程新知 2025/12/14 22:32:59

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2026/2/9 15:41:39

MMaDA: Multimodal Large Diffusion Language Models

CODE ： https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA，它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

编程新知 2026/2/3 15:24:36

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2026/1/31 15:09:31

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/9/13 16:17:01

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库，专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性，并提供了一个通用的框架&…...

编程新知 2025/11/28 5:32:31

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述企业和个人都在尝试各种AI，使用客户端或是内部自己搭建集成大模型的终端，加速与大型语言模型（LLM）的结合，同时使用检索增强生成（Retrieval Augmented Generation &#…...

编程新知 2026/2/9 20:30:28

Mysql8 忘记密码重置，以及问题解决

1.使用免密登录找到配置MySQL文件，我的文件路径是/etc/mysql/my.cnf，有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

编程新知 2026/1/9 8:59:09

vulnyx Blogger writeup

信息收集 arp-scan nmap 获取userFlag 上web看看一个默认的页面，gobuster扫一下目录可以看到扫出的目录中得到了一个有价值的目录/wordpress，说明目标所使用的cms是wordpress，访问http://192.168.43.213/wordpress/然后查看源码能看到这…...

编程新知 2026/1/29 5:24:50

相关文章：