当前位置: 首页 > news >正文

解析邮件文本内容; Mime文本解析; MimeStreamParser; multipart解析

原始文本

------=_Part_46705_715015081.1699589700255
Content-Type: text/html;charset=UTF-8
Content-Transfer-Encoding: base64PGh0bWw+CiAgICA8aGVhZD4KICAgICAgICA8bWV0YSBodHRwLW
VxdWl2PSJDb250ZW50LVR5cGUiIGNvbnRlbnQ9InRleHQvaHRt
bDsgY2hhcnNldD1VVEYtOCI+CiAgICAgICAgPHRpdGxlPkpTUC
BQYWdlPC90aXRsZT4KICAgIDwvaGVhZD4KICAgIDxib2R5Pgog
ICAgICAgIDxoMT5IZWxsbyBXb3JsZCE8L2gxPgogICAgPC9ib2
R5Pgo8L2h0bWw+
------=_Part_46705_715015081.1699589700255--

Maven

 <dependency><groupId>org.apache.james</groupId><artifactId>apache-mime4j-core</artifactId><version>0.8.9</version></dependency>

解析方法

String data = "------=_Part_46705_715015081.1699589700255\n" +"Content-Type: text/html;charset=UTF-8\n" +"Content-Transfer-Encoding: base64\n" +"\n" +"PGh0bWw+CiAgICA8aGVhZD4KICAgICAgICA8bWV0YSBodHRwLW\n" +"VxdWl2PSJDb250ZW50LVR5cGUiIGNvbnRlbnQ9InRleHQvaHRt\n" +"bDsgY2hhcnNldD1VVEYtOCI+CiAgICAgICAgPHRpdGxlPkpTUC\n" +"BQYWdlPC90aXRsZT4KICAgIDwvaGVhZD4KICAgIDxib2R5Pgog\n" +"ICAgICAgIDxoMT5IZWxsbyBXb3JsZCE8L2gxPgogICAgPC9ib2\n" +"R5Pgo8L2h0bWw+\n" +"------=_Part_46705_715015081.1699589700255--";
System.out.println(data);
HtmContentHandler contentHandler = new HtmContentHandler();
MimeConfig mime4jParserConfig = MimeConfig.DEFAULT;
BodyDescriptorBuilder bodyDescriptorBuilder = new DefaultBodyDescriptorBuilder();
MimeStreamParser mime4jParser = new MimeStreamParser(mime4jParserConfig, DecodeMonitor.SILENT, bodyDescriptorBuilder);
mime4jParser.setContentDecoding(true);
mime4jParser.setContentHandler(contentHandler);
mime4jParser.parse(new ByteArrayInputStream(data.getBytes(UTF_8)));
System.out.println(contentHandler.getData());

HtmContentHandler


import org.apache.commons.io.IOUtils;
import org.apache.james.mime4j.MimeException;
import org.apache.james.mime4j.dom.Header;
import org.apache.james.mime4j.field.ContentTypeFieldImpl;
import org.apache.james.mime4j.message.SimpleContentHandler;
import org.apache.james.mime4j.stream.BodyDescriptor;
import org.apache.james.mime4j.stream.Field;import java.io.IOException;
import java.io.InputStream;
import java.util.Optional;/*** @author zengrenyuan* @date 2023/11/10**/
public class HtmContentHandler extends SimpleContentHandler {private String data;private String charset;private String contentType;@Overridepublic void body(BodyDescriptor bd, InputStream is) throws MimeException, IOException {this.data = IOUtils.toString(is, Optional.ofNullable(charset).orElse("UTF-8"));//这里可以处理文本内容}@Overridepublic void headers(Header header) {//在这里解析头信息Field contentType = header.getField("Content-Type");if (contentType != null) {if (contentType instanceof ContentTypeFieldImpl) {this.contentType = ((ContentTypeFieldImpl) contentType).getMimeType();charset = ((ContentTypeFieldImpl) contentType).getParameter("charset");}}}public String getData() {return data;}public String getCharset() {return charset;}public String getContentType() {return contentType;}
}

参考资料

https://james.apache.org/mime4j/index.html
https://github.com/apache/james-mime4j

如果想解析一段Email数据也可以参考
https://github.com/ram-sharma-6453/email-mime-parser

相关文章:

解析邮件文本内容; Mime文本解析; MimeStreamParser; multipart解析

原始文本 ------_Part_46705_715015081.1699589700255 Content-Type: text/html;charsetUTF-8 Content-Transfer-Encoding: base64PGh0bWwCiAgICA8aGVhZD4KICAgICAgICA8bWV0YSBodHRwLW VxdWl2PSJDb250ZW50LVR5cGUiIGNvbnRlbnQ9InRleHQvaHRt bDsgY2hhcnNldD1VVEYtOCICiAgICAgIC…...

获取请求IP以及IP解析成省份

某些业务需要获取请求IP以及将IP解析成省份之类的&#xff0c;于是我写了一个工具类&#xff0c;可以直接COPY /*** IP工具类* author xxl* since 2023/11/9*/ Slf4j public class IPUtils {/*** 过滤本地地址*/public static final String LOCAL_ADDRESS "127.0.0.1&quo…...

YOLOv8-seg改进:复现HIC-YOLOv5,HIC-YOLOv8-seg助力小目标分割

🚀🚀🚀本文改进:HIC-YOLOv8-seg:1)添加一个针对小物体的额外预测头,以提供更高分辨率的特征图2)在backbone和neck之间采用involution block来增加特征图的通道信息;3)在主干网末端加入 CBAM 的注意力机制; 🚀🚀🚀HIC-YOLOv8-seg小目标分割检测&复杂场景…...

vscode 终端进程启动失败: shell 可执行文件“C:\Windows\System32\WindowsPower

vscode 终端进程启动失败: shell 可执行文件“C:\Windows\System32\WindowsPower 第一次用vscode&#xff0c;然后遇到这个问题&#xff0c;在设置里搜索 terminal.integrated.defaultProfile.windows 将这里的null改成"Command Prompt" 重启就可以了...

【中间件篇-Redis缓存数据库02】Redis高级特性和应用(慢查询、Pipeline、事务、Lua)

Redis高级特性和应用(慢查询、Pipeline、事务、Lua) Redis的慢查询 许多存储系统&#xff08;例如 MySQL)提供慢查询日志帮助开发和运维人员定位系统存在的慢操作。所谓慢查询日志就是系统在命令执行前后计算每条命令的执行时间&#xff0c;当超过预设阀值,就将这条命令的相关…...

栈 和 队列

什么是栈? 一种特殊的线性表&#xff0c;只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶&#xff0c;另一端称为栈底。栈中的数据元素遵守后进先出&#xff08;LIFO - Last In First Out&#xff09;的原则。   从数据结构的角度来看&…...

【推荐】一款AI写作大师、问答、绘画工具-「智元兔 AI」

在当今技术飞速发展的时代&#xff0c;越来越多的领域开始应用人工智能&#xff08;Artificial Intelligence&#xff0c;简称AI&#xff09;。其中&#xff0c;AI写作工具备受瞩目&#xff0c;备受推崇。在众多的选择中&#xff0c;智元兔AI是一款在笔者使用过程中非常有帮助的…...

阿里云付费用户破100万 用户规模亚洲最大

导读阿里巴巴集团公布2018财年第一季度财报&#xff0c;阿里云达到一个重要里程碑&#xff0c;云计算付费用户数量首次超过100万&#xff0c;成为亚洲首家达到百万级用户规模的云计算公司。同时&#xff0c;企业级市场被云计算人工智能等新技术全面激活&#xff0c;推动该季度营…...

人工智能基础——Python:Matplotlib与绘图设计

人工智能的学习之路非常漫长&#xff0c;不少人因为学习路线不对或者学习内容不够专业而举步难行。不过别担心&#xff0c;我为大家整理了一份600多G的学习资源&#xff0c;基本上涵盖了人工智能学习的所有内容。点击下方链接,0元进群领取学习资源,让你的学习之路更加顺畅!记得…...

Ubuntu 配置 Github 的 SSH keys

先进入已有的 Git 目录或使用新建的一个 Git 仓库下。 设置 Github 用户名和邮箱&#xff1a; $ git config --global user.name [Github用户名] $ git config --global user.email [Github认证邮箱]生成 SSH 密钥文件&#xff1a; $ ssh-keygen -t rsa -C [Github认证邮箱]…...

Flink—— Flink Data transformation(转换)

Flink数据算子转换有很多类型&#xff0c;各位看官看好&#xff0c;接下来&#xff0c;演示其中的十八种类型。 1.Map&#xff08;映射转换&#xff09; DataStream → DataStream 将函数作用在集合中的每一个元素上,并返回作用后的结果&#xff0c;其中输入是一个数据流&…...

前端读取文件当文件选择相同文件名的文件,内容不会变化

前端读取文件当文件选择相同文件名的文件&#xff0c;内容不会变化 今天遇到个奇怪的bug&#xff0c;使用打开文件&#xff0c;并选择文件时&#xff0c;正常情况会读取文件信息。 但是如果先选择相同的文件名&#xff0c;则内容不会发生变化。 先说结论 只要不使用事件中e…...

PHP 服装销售管理系统mysql数据库web结构layUI布局apache计算机软件工程网页wamp

一、源码特点 PHP 服装销售管理系统是一套完善的web设计系统mysql数据库 &#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 php服装销售管理系统1 二、功能介绍 (1)员工管理&#xff1a;对员工信息…...

用于图像处理的高斯滤波器 (LoG) 拉普拉斯

一、说明 欢迎来到拉普拉斯和高斯滤波器的拉普拉斯的故事。LoG是先进行高斯处理&#xff0c;继而进行拉普拉斯算子的图像处理算法。用拉普拉斯具有过零功能&#xff0c;实现边缘岭脊提取。 二、LoG算法简述 在这篇博客中&#xff0c;让我们看看拉普拉斯滤波器和高斯滤波器的拉普…...

【h5 uniapp】 滚动 滚动条,数据跟着变化

uniapp项目 需求&#xff1a; 向下滑动时&#xff0c;数据增加&#xff0c;上方的日历标题日期也跟着变化 向上滑动时&#xff0c;上方的日历标题日期跟着变化 实现思路&#xff1a; 初次加载目前月份的数据 以及下个月的数据 this.getdate()触底加载 下个月份的数据 onReach…...

ModStartBlog v8.5.0 评论开关布局调整,系统后台全面优化

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用&#xff0c;支持后台一键快速安装&#xff0c;让开发者能快的实现业务功能开发。 系统完全开源&#xff0c;基于 Apache 2.0 开源协议。 功能特性 丰富的模块市场&#xff0c;后台一键快速安装 …...

django|报错SQLite 3.8.3 or later is required的解决方案

迁移原同事写的程序&#xff0c;到新服务器上边。运行报错。解决方案有三种 降低django版本升级sqlite3&#xff0c;不低于3.8.3版本修改django源码 方案一、降低django版本 卸载高版本django pip uninstall django安装低版本&#xff0c;如 pip install django2.1.7注意&…...

通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现 [附POC]

文章目录 通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现 0x06 修复建议 通达OA get_datas.php前台sql注入-可获取数据库session登入后台漏洞复现…...

苹果官方:所有国行iPhone 15系列都在中国生产!

近几年来&#xff0c;国内供应链逐渐外迁&#xff0c;而拥有庞大劳动力市场的印度却成为了香饽饽&#xff0c;逐渐获得越来越多企业的重视&#xff0c;就连苹果公司也将其视为发展的重要战略要地。 自从苹果扩大印度生产iPhone规模后&#xff0c;很快流言四起&#xff0c;各种负…...

Oracle 安装及 Spring 使用 Oracle

参考内容&#xff1a; docker安装oracle数据库史上最全步骤&#xff08;带图文&#xff09; Mac下oracle数据库客户端 Docker安装Oracle docker能安装oracle吗 Batch script for add a auto-increased primary key for exist table with records Docker 安装 Oracle11g 注意&a…...

小猫爪:S32K3安全架构实战——REG_PORT、MPU与XRDC的协同配置指南

1. S32K3安全架构概览 第一次接触S32K3的安全功能时&#xff0c;我完全被它复杂的保护机制搞晕了。直到在汽车电子项目中踩过几次坑&#xff0c;才真正理解REG_PORT、MPU和XRDC这三重防护的协同价值。简单来说&#xff0c;它们就像公司安保系统的三道防线&#xff1a;REG_PORT是…...

如何快速掌握跨平台资源下载:res-downloader终极完整指南

如何快速掌握跨平台资源下载&#xff1a;res-downloader终极完整指南 【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是否曾…...

别再傻傻分不清!一张图看懂IDS、IPS、防火墙、网闸这些安全设备到底该放哪儿

企业网络安全设备部署实战指南&#xff1a;从拓扑设计到纵深防御 第一次接触企业级网络拓扑时&#xff0c;那些密密麻麻的连线图和各式各样的安全设备图标总让人望而生畏。作为刚入行的网络安全工程师&#xff0c;最常遇到的困惑莫过于&#xff1a;IDS该放在核心交换机旁边还是…...

突破限制:百度网盘直链解析工具助你实现高速下载

突破限制&#xff1a;百度网盘直链解析工具助你实现高速下载 【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 还在为百度网盘下载速度慢而烦恼吗&#xff1f;&#x1f680; 今天…...

Qwen3-TTS-12Hz效果展示:中英混合技术文档语音生成,术语发音精准实测

Qwen3-TTS-12Hz效果展示&#xff1a;中英混合技术文档语音生成&#xff0c;术语发音精准实测 重要提示&#xff1a;本文仅展示Qwen3-TTS-12Hz模型的技术效果和语音生成能力&#xff0c;所有测试基于公开可用的模型版本进行。内容完全聚焦技术展示&#xff0c;不涉及任何其他信息…...

SITS2026闭门报告首度公开:自然语言转代码在金融/医疗/嵌入式三大高危场景的11项合规性断点(含GDPR与ISO/IEC 23894适配路径)

第一章&#xff1a;SITS2026闭门报告核心结论与行业影响 2026奇点智能技术大会(https://ml-summit.org) SITS2026闭门报告首次系统披露了大模型推理基础设施在超低延迟场景下的结构性瓶颈&#xff0c;指出当前主流服务框架中约68%的端到端延迟源于KV缓存跨设备同步开销&#…...

5分钟掌握spacetime:轻量级JavaScript时区库的终极入门指南

5分钟掌握spacetime&#xff1a;轻量级JavaScript时区库的终极入门指南 【免费下载链接】spacetime A lightweight javascript timezone library 项目地址: https://gitcode.com/gh_mirrors/sp/spacetime spacetime是一款轻量级JavaScript时区处理库&#xff0c;专为简化…...

7步快速掌握ComfyUI视频合成:从新手到高手的完整指南

7步快速掌握ComfyUI视频合成&#xff1a;从新手到高手的完整指南 【免费下载链接】ComfyUI-VideoHelperSuite Nodes related to video workflows 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-VideoHelperSuite 你是否曾经面对一堆AI生成的静态图像&#xff0c…...

别再只调参了!用PyTorch实战ERL算法,让进化算法帮你自动探索强化学习策略

别再只调参了&#xff01;用PyTorch实战ERL算法&#xff0c;让进化算法帮你自动探索强化学习策略 当你在深夜盯着屏幕上的DDPG训练曲线&#xff0c;看着那个始终徘徊在基线附近的奖励值&#xff0c;是否想过——或许有更聪明的方式让AI自己找到突破口&#xff1f;去年我们在开发…...

Qt Widget控件属性详解

1. QWidget 可以在Qt Creator 右侧看到 QWidget 的各种属性2 QWidget常用属性 2.1 enabled 描述了一个控件是否”可用“状态&#xff0c;相对于”禁用“ 禁用&#xff1a;该控件不能接收任何用户的输入事件&#xff0c;并且外观上是灰色的如果一个 widget 被禁用&#xff0c;则…...