HarmonyOS 鸿蒙应用开发基础:转换整个PDF文档为图片功能
在许多应用场景中,将PDF文档的每一页转换为单独的图片文件是非常有帮助的。这可以用于文档的分享、扫描文档的电子化存档、或者进行进一步的文字识别处理等。本文将介绍如何使用华为HarmonyOS提供的PDF处理服务将整个PDF文档转换为图片,并将这些图片存放在指定的文件夹中。以往想实现这个功能都需要一些收费的插件,现在鸿蒙直接支持。
场景介绍
假设我们有一个PDF文档,想要将其所有的页面转换为图片格式,并且希望每一页都生成一张单独的图片文件。所有生成的图片文件需要存储在一个指定的文件夹中,以便后续的处理和使用。HarmonyOS的PDF服务提供了将PDF文档转换为图片的功能,支持多种图片格式,具体可以参考ImageFormat。
接口说明
接口名 | 描述 |
---|---|
convertToImage(path: string, format: ImageFormat, onProgress?: Callback<number>): boolean | 转换PDF文档为图片。 |
- 接口名:
convertToImage
- 描述: 将PDF文档的每一页转换为图片,并存储在指定的目录中。
- 参数:
path: string
:指定输出图片的文件夹路径。format: ImageFormat
:指定图片的输出格式。onProgress?: Callback<number>
:可选参数,用于监听转换进度的回调函数。
示例代码
下面是一个完整的示例代码,演示如何将PDF文档的所有页面转换为PNG格式的图片,并存储在应用的沙箱目录下的output
文件夹中。
import { fileIo as fs } from '@kit.CoreFileKit';
import { common } from '@kit.AbilityKit';
import { hilog } from '@kit.PerformanceAnalysisKit';
import { pdfService } from '@kit.PDFKit';@Entry
@Component
struct PdfPage {private pdfDocument: pdfService.PdfDocument = new pdfService.PdfDocument();private context = getContext() as common.UIAbilityContext;private loadResult: pdfService.ParseResult = pdfService.ParseResult.PARSE_ERROR_FORMAT;aboutToAppear(): void {// 确保应用沙箱目录下有input.pdf文档let filePath = this.context.filesDir + '/input.pdf';this.loadResult = this.pdfDocument.loadDocument(filePath);}build() {Column() {// 转换PDF文档的按钮Button('convertToImage').onClick(async () => {if (this.loadResult === pdfService.ParseResult.PARSE_SUCCESS) {// 设置输出路径let outputPath = getContext().filesDir + '/output/';// 创建输出目录fs.mkdir(outputPath);// 将所有的页面转化为png图片,并存储在output文件夹里let res = this.pdfDocument.convertToImage(outputPath, pdfService.ImageFormat.PNG);// 记录转换结果日志hilog.info(0x0000, 'PdfPage', 'convertToImage %{public}s!', res ? 'success' : 'fail');}})}}
}
代码解析
- 导入必要的模块:首先,我们需要导入一些必要的模块,包括文件IO操作模块
fileIo
、上下文模块common
、日志记录模块hilog
,以及PDF处理模块pdfService
。 - 加载PDF文档:在
aboutToAppear
生命周期方法中,我们通过loadDocument
方法加载PDF文档。这里假设PDF文档的路径为应用沙箱目录下的input.pdf
。 - 创建输出目录:在点击按钮触发的事件处理函数中,我们首先检查PDF文档是否成功加载。如果成功,我们将创建一个用于存放输出图片的文件夹,路径为应用沙箱目录下的
output
文件夹。 - 转换为图片:然后,调用
convertToImage
方法,将PDF文档的所有页面转换为PNG格式的图片,并存放在刚刚创建的output
文件夹中。 - 日志记录:最后,我们使用
hilog.info
方法记录转换的结果,以便于调试和日志查看。
转换指定页面为图片
DF文档页面转换为图片,或将页面的指定区域转换为图片时使用。
接口说明
接口名 | 描述 |
---|---|
getPagePixelMap(): image.PixelMap | 获取当前页的图片。 |
getCustomPagePixelMap(matrix: PdfMatrix, isGray: boolean, drawAnnotations: boolean): image.PixelMap | 获取指定PdfPage区域的图片内容。 |
getAreaPixelMap(matrix: PdfMatrix, bitmapwidth: number, bitmapHeight: number, isGray: boolean, drawAnnotations: boolean): image.PixelMap | 获取指定PdfPage区域的图片内容,并指定图片的宽和高。 |
示例代码
- 调用loadDocument方法加载PDF文档。
- 调用getPage方法获取某个页面。
- 调用getPagePixelMap或getCustomPagePixelMap方法获取当前页面或者页面区域,这时获取的是image.PixelMap图像类型。
- 将image.PixelMap图像类型转化为二进制图片文件并保存,参考以下方法pixelMap2Buffer。
import { pdfService } from '@kit.PDFKit';import { image } from '@kit.ImageKit';import { fileIo as fs } from '@kit.CoreFileKit';import { common } from '@kit.AbilityKit';import { BusinessError } from '@kit.BasicServicesKit';@Entry@Componentstruct PdfPage {private pdfDocument: pdfService.PdfDocument = new pdfService.PdfDocument();private context = getContext() as common.UIAbilityContext;private loadResult: pdfService.ParseResult = pdfService.ParseResult.PARSE_ERROR_FORMAT;aboutToAppear(): void {// 确保沙箱目录有input.pdf文档let filePath = this.context.filesDir + '/input.pdf';this.loadResult = this.pdfDocument.loadDocument(filePath);}// 将 pixelMap 转成图片格式pixelMap2Buffer(pixelMap: image.PixelMap): Promise<ArrayBuffer> {return new Promise((resolve, reject) => {/**设置打包参数format:图片打包格式,只支持 jpg 和 webpquality:JPEG 编码输出图片质量bufferSize:图片大小,默认 10M*/let packOpts: image.PackingOption = { format: 'image/jpeg', quality: 98 }// 创建ImagePacker实例const imagePackerApi = image.createImagePacker()imagePackerApi.packToData(pixelMap, packOpts).then((buffer: ArrayBuffer) => {resolve(buffer)}).catch((err: BusinessError) => {reject()})})}build() {Column() {// 获取为图片并保存到应用沙箱Button('getPagePixelMap').onClick(async () => {if (this.loadResult === pdfService.ParseResult.PARSE_SUCCESS) {let page = this.pdfDocument.getPage(0)let pixmap: image.PixelMap = page.getPagePixelMap();if (!pixmap) {return}const imgBuffer = await this.pixelMap2Buffer(pixmap)const file =fs.openSync(this.context.filesDir + `/${Date.now()}.png`, fs.OpenMode.READ_WRITE | fs.OpenMode.CREATE);await fs.write(file.fd, imgBuffer)// 关闭文档await fs.close(file.fd)}})// 获取指定PdfPage区域的图片内容。Button('getCustomPagePixelMap').onClick(async () => {if (this.loadResult === pdfService.ParseResult.PARSE_SUCCESS) {let page = this.pdfDocument.getPage(0);let matrix = new pdfService.PdfMatrix();matrix.x = 100;matrix.y = 100;matrix.width = 500;matrix.height = 500;matrix.rotate = 0;let pixmap: image.PixelMap = page.getCustomPagePixelMap(matrix, false, false);if (!pixmap) {return;}const imgBuffer = await this.pixelMap2Buffer(pixmap);const file =fs.openSync(this.context.filesDir + `/${Date.now()}.jpeg`, fs.OpenMode.READ_WRITE | fs.OpenMode.CREATE);await fs.write(file.fd, imgBuffer);// 关闭文件await fs.close(file.fd);}})// 获取指定PdfPage区域的图片内容Button('getAreaPixelMap').onClick(async () => {if (this.loadResult === pdfService.ParseResult.PARSE_SUCCESS) {let page = this.pdfDocument.getPage(0);let matrix = new pdfService.PdfMatrix();matrix.x = 100;matrix.y = 100;matrix.width = 500;matrix.height = 500;matrix.rotate = 0;let pixmap: image.PixelMap = page.getAreaPixelMap(matrix, 400, 400, true, false);if (!pixmap) {return}const imgBuffer = await this.pixelMap2Buffer(pixmap)const file =fs.openSync(this.context.filesDir + `/${Date.now()}.bmp`, fs.OpenMode.READ_WRITE | fs.OpenMode.CREATE);await fs.write(file.fd, imgBuffer)// 关闭文件await fs.close(file.fd);}})}}}
总结
通过上述步骤和代码,我们可以轻松地实现将一个PDF文档的所有页面转换为单独的图片文件,并存放在指定的文件夹中。这种方法对于需要对PDF文档进行处理或分享的场景非常有用。请注意,实际开发中需要处理各种异常情况,确保程序的健壮性和用户体验。
相关文章:
HarmonyOS 鸿蒙应用开发基础:转换整个PDF文档为图片功能
在许多应用场景中,将PDF文档的每一页转换为单独的图片文件是非常有帮助的。这可以用于文档的分享、扫描文档的电子化存档、或者进行进一步的文字识别处理等。本文将介绍如何使用华为HarmonyOS提供的PDF处理服务将整个PDF文档转换为图片,并将这些图片存放…...
Flask-SQLAlchemy核心概念:模型类与数据库表、类属性与表字段、外键与关系映射
前置阅读,关于Flask-SQLAlchemy支持哪些数据库及基本配置,链接:Flask-SQLAlchemy_数据库配置 摘要 本文以一段典型的 SQLAlchemy 代码示例为引入,阐述以下核心概念: 模型类(Model Class) ↔ 数…...
刷题 | 牛客 - js中等题-下(更ing)30/54知识点解答
知识点汇总: 数组: Array.prototype.pop():从数组末尾删除一个元素,并返回这个元素。 Array.prototype.shift():从数组开头删除一个元素,并返回这个元素。 array.reverse():将数组元素反转顺…...
RAM(随机存取存储器)的通俗解释及其在路由器中的作用
RAM(随机存取存储器)的通俗解释及其在路由器中的作用 一、RAM是什么? RAM(Random Access Memory) 就像餐厅的“临时工作台”: 核心作用:临时存储正在处理的任务(如厨师同时处理多道…...

六、【前端启航篇】Vue3 项目初始化与基础布局:搭建美观易用的管理界面骨架
【前端启航篇】Vue3 项目初始化与基础布局:搭建美观易用的管理界面骨架 前言技术选型回顾与准备准备工作第一步:进入前端项目并安装 Element Plus第二步:在 Vue3 项目中引入并配置 Element Plus第三步:设计基础页面布局组件第四步…...
【项目需求分析文档】:在线音乐播放器(Online-Music)
1. 用户管理模块 1.1 注册功能 功能描述 提供注册页面,包含用户名、密码输入框及提交按钮。用户名需唯一性校验,密码使用 BCrypt 加密算法存储。注册成功后自动跳转至登录页面。 1.2 登录功能 功能描述 提供登录页面,包含用户名、密码输入…...

C++ 前缀和数组
一. 一维数组前缀和 1.1. 定义 前缀和算法通过预处理数组,计算从起始位置到每个位置的和,生成一个新的数组(前缀和数组)。利用该数组,可以快速计算任意区间的和,快速求出数组中某一段连续区间的和。 1.2. …...
PHP 实现通用数组字段过滤函数:灵活去除或保留指定 Key
PHP 实现数组去除或保留指定字段的通用函数详解 一、文章标题 《PHP 实现通用数组字段过滤函数:灵活去除或保留指定 Key》 二、摘要 在实际开发中,我们经常需要对数组进行字段级别的操作,例如从一个数组中删除某些敏感字段(如密码、token),或者只保留特定字段用于接口…...
NACOS2.3.0开启鉴权登录
环境 名称版本nacos2.3.0(Linux)java java version "17.0.14" 2025-01-21 LTS # # Copyright 1999-2021 Alibaba Group Holding Ltd. # # Licensed under the Apache License, Version 2.0 (the "License"); # you may not use thi…...

细胞冻存的注意事项,细胞冻存试剂有哪些品牌推荐
细胞冻存的原理 细胞冻存的基本原理是利用低温环境抑制细胞的新陈代谢,使细胞进入一种“休眠”状态。在低温条件下,细胞的生物活动几乎停止,从而实现长期保存。然而,细胞在冷冻过程中可能会因为细胞内外水分结冰形成冰晶而受损。…...

快速上手Linux火墙管理
实验网络环境: 主机IP网络f1192.168.42.129/24NATf2(双网卡) 192.168.42.128/24 192.168.127.20/24 NAT HOST-NOLY f3192.168.127.30/24HOST-ONLY 一、iptables服务 1.启用iptables服务 2.语法格式及常用参数 语法格式:参数&…...

[创业之路-375]:企业战略管理案例分析 - 华为科技巨擘的崛起:重构全球数字化底座的超级生命体
在人类文明从工业时代(机械、电气、自动化)迈向数字智能(硬件、软件、算法、虚拟、智能)时代的临界点上,一家中国企业正以令人震撼的姿态重塑全球科技版图。从通信网络的底层架构到智能终端的生态闭环,从芯…...
【paddle】常见的数学运算
根据提供的 PaddlePaddle 函数列表,我们可以将它们按照数学运算、逻辑运算、三角函数、特殊函数、统计函数、张量操作和其他操作等类型进行分类。以下是根据函数功能进行的分类: 取整运算 Rounding functions 代码描述round(x)距离 x 最近的整数floor(…...

AI基础知识(05):模型提示词、核心设计、高阶应用、效果增强
目录 一、核心设计原则 二、高阶应用场景 三、突破性技巧 以下是针对DeepSeek模型的提示词设计思路及典型应用场景示例,帮助挖掘其潜在能力: 一、核心设计原则 1. 需求明确化:用「角色定位任务目标输出格式」明确边界 例:作为历…...
分布式事务之Seata
概述 Seata有四种模式 AT模式:无侵入式的分布式事务解决方案,适合不希望对业务进行改造的场景,但由于需要添加全局事务锁,对影响高并发系统的性能。该模式主要关注多DB访问的数据一致性,也包括多服务下的多DB数据访问…...

推测解码算法在 MTT GPU 的应用实践
前言 目前主流的大模型自回归解码每一步都只生成一个token, 尽管kv cache等技术可以提升解码的效率,但是单个样本的解码速度依然受限于访存瓶颈,即模型需要频繁从内存中读取和写入数据,此时GPU的利用率有限。为了解决这种问题,…...

Axure酒店管理系统原型
酒店管理系统通常被设计为包含多个模块或界面,以支持酒店运营的不同方面和参与者。其中,管理端和商户端是两个核心组成部分,它们各自承担着不同的职责和功能。 软件版本:Axure RP 9 预览地址:https://556i1e.axshare.…...

写实交互数字人在AI招聘中的应用方案
随着科技的进步,越来越多的行业开始探索如何利用人工智能提升效率和服务质量。其中,写实交互数字人技术以其高度拟真的交互体验和丰富的情感表达能力,在人力资源领域特别是招聘环节中展现出了巨大潜力。本文将探讨写实交互数字人在AI招聘中的…...
C++中IO类(iostream、fstream和sstream)知识详解和应用
一、C I/O 类体系概览 C 的 I/O 功能由一组 流(stream) 类封装,位于头文件 <iostream>、<fstream>、<sstream> 等。核心类别及其继承关系简图如下: ios_base↑basic_ios<CharT,Traits>↑┌───────…...
Spring Boot中如何对密码等敏感信息进行脱敏处理
以下是常见的脱敏方法及实现步骤,涵盖配置、日志和API响应等多个层面: 1. 配置文件敏感信息脱敏 (1) 使用加密库(如Jasypt) 步骤: 添加依赖: <dependency><groupId>com.github.ulise…...
React从基础入门到高级实战:React 基础入门 - JSX与组件基础
JSX 与组件基础 引言 在 React 开发中,JSX 和 组件 是两个最基础且核心的概念。JSX 是一种独特的语法,让你在 JavaScript 中编写类似 HTML 的代码,而组件则是 React 应用的基本构建块,帮助你将复杂的界面拆分为可复用的模块。本…...

房贷利率计算前端小程序
利率计算前端小程序 视图效果展示如下: 在这里插入代码片 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0&qu…...

在Visual Studio中进行cuda编程
首先下载与CUDA Toolkit匹配的Visual Studio版本 比如我的CUDA Toolkit版本是12.6,那么我可以使用2022的Visual Studio。 查看Toolkit版本 nvcc -V 配置 ok,让我们开始Visual Studio的nvcc编译器配置 参考例文https://github.com/apachecn/succinc…...

Fastrace:Rust 中分布式追踪的现代化方案
原文链接:Fastrace: A Modern Approach to Distributed Tracing in Rust | FastLabs / Blog 摘要 在微服务架构中,分布式追踪对于理解应用程序的行为至关重要。虽然 tokio-rs/tracing 在 Rust 中被广泛使用,但它存在一些显著的挑战…...

Linux云计算训练营笔记day13【CentOS 7 find、vim、vimdiff、ping、wget、curl、RPM、YUM】
Linux云计算训练营笔记day13[CentOS 7 find、vim、vimdiff、ping、wget、curl、RPM、YUM]] 目录 Linux云计算训练营笔记day13[CentOS 7 find、vim、vimdiff、ping、wget、curl、RPM、YUM]]1.find练习2.vim高级使用2.1 命令模式:2.2 插入模式:2.3 末行模式: 3. vimdiff4. ping5.…...

黑马Java基础笔记-15
Set 无索引,无序,不可重复 HashSet object类中默认hashCode的方法是根据地址值。 如果集合中存储的是自定义对象,必须要重写hashCode和equals方法。 底层原理 jdk8以前:数组 链表 jdk8及以后:数组 链表 红黑…...
Elasticsearch简单集成java框架方式。
Elasticsearch 在 Java 中最常用的客户端是什么?如何初始化一个 RestHighLevelClient?如何用 Spring Boot 快速集成 Elasticsearch?Spring Data Elasticsearch 如何定义实体类与索引的映射? 最常用的 Java 客户端 目前官方推荐使用…...
【RAG文档切割】从基础拆分到语义分块实战指南
目录 🌟 前言🏗️ 技术背景与价值🩹 当前技术痛点🛠️ 解决方案概述👥 目标读者说明 🧠 一、技术原理剖析📊 分块流程架构图💡 核心分块策略🔧 关键技术模块 Ὦ…...
stream数据流
核心知识点:数据流(Stream Data Flow) 1. 通俗易懂的解释 想象一下你正在用花园里的水管浇花。水管里的水不是一次性全部倒出来的,而是持续不断地从水龙头流出,经过水管,最终从喷头喷洒到花上。在这个过程…...
利用 XML 外部实体注入(XXE)读取文件和探测内部网络
利用 XML 外部实体注入(XXE)读取文件和探测内部网络 引言 XML 外部实体注入(XXE)是一种常见的安全漏洞,攻击者可以通过这种漏洞读取服务器上的文件或探测内部网络。本文将通过一个实际的 Python 代码示例,…...