当前位置: 首页 > news >正文

Java使用IText生产PDF时,中文标点符号出现在行首的问题处理

Java使用IText生成PDF时,中文标点符号出现在行首的问题处理

使用itext 5进行html转成pdf时,标点符号出现在某一行的开头 但这种情况下显然不符合中文书写的规则,主要问题出在itext中的DefaultSplitCharacter类,该方法主要用来判断字符是否为可拆分字符。

itext 版本:5.5.13

解决办法:
1、可以通过修改源码的方式,可以参考
如何修改jar包源码以及解决iText生成pdf时中文标点存在行首问题

2、如果不想修改源码,也可以在自己项目中创建与itext中DefaultSplitCharacter相同的包路径,并在该包下重新DefaultSplitCharacter类,能这样处理的原因,与类的加载顺序有关。
在这里插入图片描述

package com.itextpdf.text.pdf;import com.itextpdf.text.SplitCharacter;public class DefaultSplitCharacter implements SplitCharacter {/*** An instance of the default SplitCharacter.*/public static final SplitCharacter DEFAULT = new DefaultSplitCharacter();// line of text cannot start or end with this characterstatic final char u2060 = '\u2060'; // - ZERO WIDTH NO BREAK SPACE// a line of text cannot start with any following characters in// NOT_BEGIN_CHARACTERS[]static final char u30fb = '\u30fb'; // ・ - KATAKANA MIDDLE DOTstatic final char u2022 = '\u2022'; // • - BLACK SMALL CIRCLE (BULLET)static final char uff65 = '\uff65'; // ・ - HALFWIDTH KATAKANA MIDDLE DOTstatic final char u300d = '\u300d'; // 」 - RIGHT CORNER BRACKETstatic final char uff09 = '\uff09'; // ) - FULLWIDTH RIGHT PARENTHESISstatic final char u0021 = '\u0021'; // ! - EXCLAMATION MARKstatic final char u0025 = '\u0025'; // % - PERCENT SIGNstatic final char u0029 = '\u0029'; // ) - RIGHT PARENTHESISstatic final char u002c = '\u002c'; // , - COMMAstatic final char u002e = '\u002e'; // . - FULL STOPstatic final char u003f = '\u003f'; // ? - QUESTION MARKstatic final char u005d = '\u005d'; // ] - RIGHT SQUARE BRACKETstatic final char u007d = '\u007d'; // } - RIGHT CURLYstatic final char uff61 = '\uff61'; // 。 - HALFWIDTH IDEOGRAPHIC FULL STOPstatic final char uff70 = '\uff70'; // ー - HALFWIDTH KATAKANA-HIRAGANA PROLONGED SOUND MARKstatic final char uff9e = '\uff9e'; // ゙ - HALFWIDTH KATAKANA VOICED SOUND MARKstatic final char uff9f = '\uff9f'; // ゚ - HALFWIDTH KATAKANA SEMI-VOICED SOUND MARKstatic final char u3001 = '\u3001'; // 、 - IDEOGRAPHIC COMMAstatic final char u3002 = '\u3002'; // 。 - IDEOGRAPHIC FULL STOPstatic final char uff0c = '\uff0c'; // , - FULLWIDTH COMMAstatic final char uff0e = '\uff0e'; // . - FULLWIDTH FULL STOPstatic final char uff1a = '\uff1a'; // : - FULLWIDTH COLONstatic final char uff1b = '\uff1b'; // ; - FULLWIDTH SEMICOLONstatic final char uff1f = '\uff1f'; // ? - FULLWIDTH QUESTION MARKstatic final char uff01 = '\uff01'; // ! - FULLWIDTH EXCLAMATION MARKstatic final char u309b = '\u309b'; // ゛ - KATAKANA-HIRAGANA VOICED SOUND MARKstatic final char u309c = '\u309c'; // ゜ - KATAKANA-HIRAGANA SEMI-VOICED SOUND MARKstatic final char u30fd = '\u30fd'; // ヽ - KATAKANA ITERATION MARKstatic final char u2019 = '\u2019'; // ’ - RIGHT SINGLE QUOTATION MARKstatic final char u201d = '\u201d'; // ” - RIGHT DOUBLE QUOTATION MARKstatic final char u3015 = '\u3015'; // 〕 - RIGHT TORTOISE SHELL BRACKETstatic final char uff3d = '\uff3d'; // ] - FULLWIDTH RIGHT SQUARE BRACKETstatic final char uff5d = '\uff5d'; // } - FULLWIDTH RIGHT CURLY BRACKETstatic final char u3009 = '\u3009'; // 〉 - RIGHT ANGLE BRACKETstatic final char u300b = '\u300b'; // 》 - RIGHT DOUBLE ANGLE BRACKETstatic final char u300f = '\u300f'; // 』 - RIGHT WHITE CORNER BRACKETstatic final char u3011 = '\u3011'; // 】 - RIGHT BLACK LENTICULAR BRACKETstatic final char u00b0 = '\u00b0'; // ° - DEGREE SIGNstatic final char u2032 = '\u2032'; // ′ - PRIMEstatic final char u2033 = '\u2033'; // ″ - DOUBLE PRIMEstatic final char[] NOT_BEGIN_CHARACTERS = new char[] { u30fb, u2022, uff65, u300d, uff09, u0021, u0025, u0029,u002c, u002e, u003f, u005d, u007d, uff61, uff70, uff9e, uff9f, u3001, u3002, uff0c, uff0e, uff1a, uff1b,uff1f, uff01, u309b, u309c, u30fd, u2019, u201d, u3015, uff3d, uff5d, u3009, u300b, u300f, u3011, u00b0,u2032, u2033, u2060 };// a line of text cannot end with any following characters in// NOT_ENDING_CHARACTERS[]static final char u0024 = '\u0024'; // $ - DOLLAR SIGNstatic final char u0028 = '\u0028'; // ( - LEFT PARENTHESISstatic final char u005b = '\u005b'; // [ - LEFT SQUARE BRACKETstatic final char u007b = '\u007b'; // { - LEFT CURLY BRACKETstatic final char u00a3 = '\u00a3'; // £ - POUND SIGNstatic final char u00a5 = '\u00a5'; // ¥ - YEN SIGNstatic final char u201c = '\u201c'; // “ - LEFT DOUBLE QUOTATION MARKstatic final char u2018 = '\u2018'; // ‘ - LEFT SINGLE QUOTATION MARKstatic final char u300a = '\u300a'; // 《 - LEFT DOUBLE ANGLE BRACKETstatic final char u3008 = '\u3008'; // 〈 - LEFT ANGLE BRACKETstatic final char u300c = '\u300c'; // 「 - LEFT CORNER BRACKETstatic final char u300e = '\u300e'; // 『 - LEFT WHITE CORNER BRACKETstatic final char u3010 = '\u3010'; // 【 - LEFT BLACK LENTICULAR BRACKETstatic final char u3014 = '\u3014'; // 〔 - LEFT TORTOISE SHELL BRACKETstatic final char uff62 = '\uff62'; // 「 - HALFWIDTH LEFT CORNER BRACKETstatic final char uff08 = '\uff08'; // ( - FULLWIDTH LEFT PARENTHESISstatic final char uff3b = '\uff3b'; // [ - FULLWIDTH LEFT SQUARE BRACKETstatic final char uff5b = '\uff5b'; // { - FULLWIDTH LEFT CURLY BRACKETstatic final char uffe5 = '\uffe5'; // ¥ - FULLWIDTH YEN SIGNstatic final char uff04 = '\uff04'; // $ - FULLWIDTH DOLLAR SIGNstatic final char[] NOT_ENDING_CHARACTERS = new char[] { u0024, u0028, u005b, u007b, u00a3, u00a5, u201c, u2018,u3008, u300a, u300c, u300e, u3010, u3014, uff62, uff08, uff3b, uff5b, uffe5, uff04, u2060 };@Overridepublic boolean isSplitCharacter(int start, int current, int end, char[] cc, PdfChunk[] ck) {// Note: If you don't add an try/catch and there is an issue with// isSplitCharacter(), iText silently fails and// you have no idea there was a problem.try {char c = getCharacter(current, cc, ck);int next = current + 1;if (next < cc.length) {char charNext = getCharacter(next, cc, ck);for (char not_begin_character : NOT_BEGIN_CHARACTERS) {if (charNext == not_begin_character) {return false;}}}for (char not_ending_character : NOT_ENDING_CHARACTERS) {if (c == not_ending_character) {return false;}}if (c <= ' ' || c == '-' || c == '\u2010') {return true;}if (c < 0x2002)return false;return ((c >= 0x2002 && c <= 0x200b)|| (c >= 0x2e80 && c < 0xd7a0)|| (c >= 0xf900 && c < 0xfb00)|| (c >= 0xfe30 && c < 0xfe50)|| (c >= 0xff61 && c < 0xffa0));} catch (Exception ex) {ex.printStackTrace();}return true;}/*** Returns a character int the array (Note: modified from the iText default* version with the addition null check of '|| ck[Math.min(position, ck.length -* 1)] == null'.** @param position position in the array* @param ck       chunk array* @param cc       the character array that has to be checked* @return the character*/protected char getCharacter(int position, char[] cc, PdfChunk[] ck) {if (ck == null || ck[Math.min(position, ck.length - 1)] == null) {return cc[position];}return (char) ck[Math.min(position, ck.length - 1)].getUnicodeEquivalent(cc[position]);}
}

相关文章:

Java使用IText生产PDF时,中文标点符号出现在行首的问题处理

Java使用IText生成PDF时&#xff0c;中文标点符号出现在行首的问题处理 使用itext 5进行html转成pdf时&#xff0c;标点符号出现在某一行的开头 但这种情况下显然不符合中文书写的规则&#xff0c;主要问题出在itext中的DefaultSplitCharacter类&#xff0c;该方法主要用来判断…...

npx和npm有什么区别,包管理器yarn的使用方法,node的版本管理工具nvm使用方法

文章目录 一、npx介绍及使用1、npx 是什么2、npx 会把远端的包下载到本地吗?3、npx 执行完成之后&#xff0c; 下载的包是否会被删除&#xff1f;4、npx和npm的区别 二、yarn介绍及使用1、Yarn是什么&#xff1f;2、Yarn的常见场景&#xff1a;3、Yarn常用命令 三、nvm介绍及使…...

【网络技术】【Kali Linux】Wireshark嗅探(九)安全HTTP协议(HTTPS协议)

一、实验目的 本次实验是基于之前的实验&#xff1a;Wireshark嗅探&#xff08;七&#xff09;&#xff08;HTTP协议&#xff09;进行的。本次实验使用Wireshark流量分析工具进行网络嗅探&#xff0c;旨在初步了解安全的HTTP协议&#xff08;HTTPS协议&#xff09;的工作原理。…...

POI-tl 知识整理:整理3 -> 动态生成表格

1 表格行循环 &#xff08;1&#xff09;需要渲染的表格的模板 说明&#xff1a;{{goods}} 是个标准的标签&#xff0c;将 {{goods}} 置于循环行的上一行&#xff0c;循环行设置要循环的标签和内容&#xff0c;注意此时的标签应该使用 [] &#xff0c;以此来区别poi-tl的默认标…...

chatgpt和文心一言哪个更好用

ChatGPT和文心一言都是近年来备受关注的人工智能语言模型。它们在智能回复、语言准确性、知识库丰富度等方面都有着较高的表现。然而&#xff0c;它们各自也有自己的特点和优势。在本文中&#xff0c;我们将从这几个方面对这两个模型进行比较&#xff0c;以帮助您更好地了解它们…...

移动端开发进阶之蓝牙通讯(一)

移动端开发进阶之蓝牙通讯&#xff08;一&#xff09; 移动端进阶之蓝牙通讯需要综合考虑蓝牙版本选择、协议栈使用、服务匹配、设备连接、安全性和硬件支持等方面。 一、蓝牙版本选择 根据实际需求和应用场景选择合适的蓝牙版本&#xff1b; 1.0&#xff0c;1M/s。 2.0EDR…...

一个完整的流程表单流转

1.写在前面 一个完整的流程表单审批&#xff08;起表单-->各环节审批-->回退-->重新审批-->完成&#xff09;&#xff0c;前端由Vue2jsElement UI升级为Vue3tsElement Plus&#xff0c;后端流程框架使用Flowable&#xff0c;项目参考了ruoyi-vue-pro(https://gite…...

2024杭州国际智慧城市,人工智能,安防展览会(杭州智博会)

在智能化浪潮的冲击下&#xff0c;我们的生活与环境正在经历一场深刻的变革。这是一场前所未有的技术革命&#xff0c;它以前所未有的速度和广度&#xff0c;改变着我们的生活方式、工作方式、思维方式和社会结构。在这场变革中&#xff0c;有的人选择激流勇进&#xff0c;拥抱…...

编程笔记 html5cssjs 031 HTML视频

编程笔记 html5&css&js 031 HTML视频 一、<video>: 视频元素二、属性三、事件四、嵌入视频页面五、练习小结 视频应用广泛&#xff0c;当前的互联网应用中&#xff0c;视频越来越重要&#xff0c;比如抖音、快手、腾讯视频等应用。 一、<video>: 视频元素 …...

SpringBoot外部配置文件

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏: 循序渐进学SpringBoot ✨特色专栏: MySQL学习 🥭本文内容:SpringBoot外部配置文件 📚个人知识库: Leo知识库,欢迎大家访问 1.前言☕…...

99个Python脚本实用实例

题目&#xff1a;有四个数字&#xff1a;1、2、3、4&#xff0c;能组成多少个互不相同且无重复数字的三位数&#xff1f;各是多少&#xff1f; #!/usr/bin/python# -*- coding: UTF-8 -*-for i in range(1,5): for j in range(1,5): for k in range(1,5): …...

HarmonyOS 工程目录介绍

工程目录 AppScope&#xff1a;存放应用全局所需要的资源文件 base element&#xff1a;文件夹主要存放公共的字符串、布局文件等资源media&#xff1a;存放全局公共的多媒体资源文件app.json5&#xff1a;应用的全局的配置文件&#xff0c;用于存放应用公共的配置信息 {"…...

门店管理系统驱动智慧零售升级

在当今数字化经济的大潮中&#xff0c;实体门店正在经历一场由内而外的深度变革。门店管理系统以其高效、便捷和全面的功能特性&#xff0c;为实体店提供了高效的运营解决方案。 门店管理系统拜托了传统零售业对本地化软件的依赖&#xff0c;它将复杂的信息技术转化为易于获取…...

Iterator迭代器操作集合元素时,不能用集合删除元素

在使用Iterator迭代器对集合中的元素进行迭代时&#xff0c;如果调用了集合对象的remove()方法删除元素或者调用add()方法添加元素之后&#xff0c;继续使用迭代器遍历元素&#xff0c;会出现异常(java.util.ConcurrentModificationException)。 import java.util.ArrayList; …...

Spring Boot是什么-特点介绍

什么是SpringBoot Spring Boot是由Pivotal团队提供的全新框架&#xff0c;其中“Boot”的意思就是“引导”&#xff0c;Spring Boot 并不是对 Spring 功能上的增强&#xff0c;而是提供了一种快速开发 Spring应用的方式。 Spring Boot 特点 嵌入的 Tomcat&#xff0c;无需部署…...

相机成像之图像传感器与ISP【四】

文章目录 1、图像传感器基础1.1 基础原理——光电效应1.2 基础的图像传感器设计1.3 衡量传感器效率的一个关键指标&#xff1a;光量子效率&#xff08;QE&#xff09;1.4 感光单元的响应1.5 像素的满阱容量1.6 像素尺寸和填充比例1.7 微透镜的作用1.8 光学低通滤波器简介1.9 传…...

新手入门Java 方法带参,方法重载及面向对象和面向过程的区别介绍

第二章 方法带参 课前回顾 1.描述类和对象的关系 类是一组对象的共有特征和行为的描述。对象是类的其中一个具体的成员。 2.如何创建对象 类名 对象名 new 类名();3.如何定义和调用方法 public void 方法名(){}对象名.方法名();4.成员变量和局部变量的区别 成员变量有初…...

使用Sqoop将Hive数据导出到TiDB

关系型数据库与大数据平台之间的数据传输之前写过一些 使用Sqoop将数据在HDFS与MySQL互导 使用Sqoop将SQL Server视图中数据导入Hive 使用DataX将Hive与MySQL中的表互导 使用Sqoop将Hive数据导出到TiDB虽然没写过&#xff0c;但网上一堆写的&#xff0c;那为什么我要专门写一下…...

互联网上门洗衣洗鞋工厂系统搭建;

随着移动互联网的普及&#xff0c;人们越来越依赖手机应用程序来解决生活中的各种问题。通过手机预约服务、购买商品、获取信息已经成为一种生活习惯。因此&#xff0c;开发一款上门洗鞋小程序&#xff0c;可以满足消费者对于方便、快捷、专业的洗鞋服务的需求&#xff0c;同时…...

Redis面试题12

Redis 的主从复制是什么&#xff1f; Redis 的主从复制是一种数据备份和高可用性机制&#xff0c;通过将一个 Redis 服务器的数据复制到其他 Redis 从服务器上来实现数据的冗余备份和读写分离。 主从复制的工作原理如下&#xff1a; 配置主服务器并开启主从复制功能。从服务器…...

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 抽象 现代智能交通系统 &#xff08;ITS&#xff09; 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 &#xff08;…...

iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版​分享

平时用 iPhone 的时候&#xff0c;难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵&#xff0c;或者买了二手 iPhone 却被原来的 iCloud 账号锁住&#xff0c;这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

条件运算符

C中的三目运算符&#xff08;也称条件运算符&#xff0c;英文&#xff1a;ternary operator&#xff09;是一种简洁的条件选择语句&#xff0c;语法如下&#xff1a; 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true&#xff0c;则整个表达式的结果为“表达式1”…...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 &#xff08;一&#xff09;概念解析 TRS&#xff08;Total Return Swap&#xff09;收益互换是一种金融衍生工具&#xff0c;指交易双方约定在未来一定期限内&#xff0c;基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

uniapp中使用aixos 报错

问题&#xff1a; 在uniapp中使用aixos&#xff0c;运行后报如下错误&#xff1a; AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...

微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据

微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据 Power Query 具有大量专门帮助您清理和准备数据以供分析的功能。 您将了解如何简化复杂模型、更改数据类型、重命名对象和透视数据。 您还将了解如何分析列&#xff0c;以便知晓哪些列包含有价值的数据&#xff0c;…...

安宝特案例丨Vuzix AR智能眼镜集成专业软件,助力卢森堡医院药房转型,赢得辉瑞创新奖

在Vuzix M400 AR智能眼镜的助力下&#xff0c;卢森堡罗伯特舒曼医院&#xff08;the Robert Schuman Hospitals, HRS&#xff09;凭借在无菌制剂生产流程中引入增强现实技术&#xff08;AR&#xff09;创新项目&#xff0c;荣获了2024年6月7日由卢森堡医院药剂师协会&#xff0…...

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案

目录 使用 erase 返回值继续迭代使用索引进行遍历 我们知道类似 vector 的顺序迭代器被删除后&#xff0c;迭代器会失效&#xff0c;因为顺序迭代器在内存中是连续存储的&#xff0c;元素删除后&#xff0c;后续元素会前移。 但一些场景中&#xff0c;我们又需要在执行删除操作…...

Linux系统部署KES

1、安装准备 1.版本说明V008R006C009B0014 V008&#xff1a;是version产品的大版本。 R006&#xff1a;是release产品特性版本。 C009&#xff1a;是通用版 B0014&#xff1a;是build开发过程中的构建版本2.硬件要求 #安全版和企业版 内存&#xff1a;1GB 以上 硬盘&#xf…...

HybridVLA——让单一LLM同时具备扩散和自回归动作预测能力:训练时既扩散也回归,但推理时则扩散

前言 如上一篇文章《dexcap升级版之DexWild》中的前言部分所说&#xff0c;在叠衣服的过程中&#xff0c;我会带着团队对比各种模型、方法、策略&#xff0c;毕竟针对各个场景始终寻找更优的解决方案&#xff0c;是我个人和我司「七月在线」的职责之一 且个人认为&#xff0c…...