SpringBoot 实现 PDF 添加水印有哪些方案
SpringBoot 实现 PDF 添加水印有哪些方案
- 方式一:使用 Apache PDFBox 库
- 方式二:使用 iText 库
- 方式三:用 Ghostscript 命令行
- 方式四:Free Spire.PDF for Java
- 方式五:Aspose.PDF for Java
简介
PDF(Portable Document Format,便携式文档格式)是一种流行的文件格式,它可以在多个操作系统和应用程序中进行查看和打印。在某些情况下,我们需要对 PDF 文件添加水印,以使其更具有辨识度或者保护其版权。本文将介绍如何使用 Spring Boot 来实现 PDF 添加水印的方式。
方式一:使用 Apache PDFBox 库
PDFBox 是一个流行的、免费的、用 Java 编写的库,它可以用来创建、修改和提取 PDF 内容。PDFBox 提供了许多 API,包括添加文本水印的功能。
添加 PDFBox 依赖
首先,在 pom.xml 文件中添加 PDFBox 的依赖:
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.24</version>
</dependency
添加水印
在添加水印之前,需要读取原始 PDF 文件:
PDDocument document = PDDocument.load(new File("original.pdf"));
然后,遍历 PDF 中的所有页面,并使用 PDPageContentStream 添加水印:// 遍历 PDF 中的所有页面
for (int i = 0; i < document.getNumberOfPages(); i++) {PDPage page = document.getPage(i);PDPageContentStream contentStream = new PDPageContentStream(document, page, PDPageContentStream.AppendMode.APPEND, true, true);// 设置字体和字号contentStream.setFont(PDType1Font.HELVETICA_BOLD, 36);// 设置透明度contentStream.setNonStrokingColor(200, 200, 200);// 添加文本水印contentStream.beginText();contentStream.newLineAtOffset(100, 100); // 设置水印位置contentStream.showText("Watermark"); // 设置水印内容contentStream.endText();contentStream.close();
}
最后,需要保存修改后的 PDF 文件:
document.save(new File("output.pdf"));
document.close();
完整代码
下面是使用 PDFBox 来实现 PDF 添加水印的完整代码:import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.font.PDType1Font;import java.io.File;
import java.io.IOException;public class PdfBoxWatermark {public static void main(String[] args) throws IOException {// 读取原始 PDF 文件PDDocument document = PDDocument.load(new File("original.pdf"));// 遍历 PDF 中的所有页面for (int i = 0; i < document.getNumberOfPages(); i++) {PDPage page = document.getPage(i);PDPageContentStream contentStream = new PDPageContentStream(document, page, PDPageContentStream.AppendMode.APPEND, true, true);// 设置字体和字号contentStream.setFont(PDType1Font.HELVETICA_BOLD, 36);// 设置透明度contentStream.setNonStrokingColor(200, 200, 200);// 添加文本水印contentStream.beginText();contentStream.newLineAtOffset(100, 100); // 设置水印位置contentStream.showText("Watermark"); // 设置水印内容contentStream.endText();contentStream.close();}// 保存修改后的 PDF 文件document.save(new File("output.pdf"));document.close();}
}
方式二:使用 iText 库
iText 是一款流行的 Java PDF 库,它可以用来创建、读取、修改和提取 PDF 内容。iText 提供了许多 API,包括添加文本水印的功能。
添加 iText 依赖
在 pom.xml 文件中添加 iText 的依赖:
<dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.13</version>
</dependency>
添加水印
在添加水印之前,需要读取原始 PDF 文件:
PdfReader reader = new PdfReader("original.pdf");
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream("output.pdf"));
然后,遍历 PDF 中的所有页面,并使用 PdfContentByte 添加水印:// 获取 PDF 中的页数
int pageCount = reader.getNumberOfPages();// 添加水印
for (int i = 1; i <= pageCount; i++) {PdfContentByte contentByte = stamper.getUnderContent(i); // 或者 getOverContent()contentByte.beginText();contentByte.setFontAndSize(BaseFont.createFont(), 36f);contentByte.setColorFill(BaseColor.LIGHT_GRAY);contentByte.showTextAligned(Element.ALIGN_CENTER, "Watermark", 300, 400, 45);contentByte.endText();
}
最后,需要保存修改后的 PDF 文件并关闭文件流:
stamper.close();
reader.close();
完整代码
下面是使用 iText 来实现 PDF 添加水印的完整代码:
import com.itextpdf.text.*;
import com.itextpdf.text.pdf.*;import java.io.FileOutputStream;
import java.io.IOException;public class ItextWatermark {public static void main(String[] args) throws IOException, DocumentException {// 读取原始 PDF 文件PdfReader reader = new PdfReader("original.pdf");PdfStamper stamper = new PdfStamper(reader, new FileOutputStream("output.pdf"));// 获取 PDF 中的页数int pageCount = reader.getNumberOfPages();// 添加水印for (int i = 1; i <= pageCount; i++) {PdfContentByte contentByte = stamper.getUnderContent(i); // 或者 getOverContent()contentByte.beginText();contentByte.setFontAndSize(BaseFont.createFont(), 36f);contentByte.setColorFill(BaseColor.LIGHT_GRAY);contentByte.showTextAligned(Element.ALIGN_CENTER, "Watermark", 300, 400, 45);contentByte.endText();}// 保存修改后的 PDF 文件并关闭文件流stamper.close();reader.close();}
}
方式三:用 Ghostscript 命令行
Ghostscript 是一款流行的、免费的、开源的 PDF 处理程序,它可以用来创建、读取、修改和提取 PDF 内容。Ghostscript 中提供了命令行参数来添加水印。
Ghostscript
首先需要在本地安装 Ghostscript 程序。
添加水印,可以在终端中使用 Ghostscript 的命令行工具执行以下命令来实现:
gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=output.pdf -c "newpath /Helvetica-Bold findfont 36 scalefont setfont 0.5 setgray 200 200 moveto (Watermark) show showpage" original.pdf
上述命令中,-sDEVICE=pdfwrite 表示输出为 PDF 文件;-sOutputFile=output.pdf 表示输出文件名为 output.pdf;最后一个参数 original.pdf 则表示原始 PDF 文件的路径;中间的字符串则表示添加的水印内容。
注意事项
使用 Ghostscript 命令行添加水印时,会直接修改原始 PDF 文件,因此建议先备份原始文件。
方式四:Free Spire.PDF for Java
下面介绍一下使用 Free Spire.PDF for Java 实现 PDF 添加水印的方式。
Free Spire.PDF for Java 是一款免费的 Java PDF 库,它提供了一个简单易用的 API,用于创建、读取、修改和提取 PDF 内容。Free Spire.PDF for Java 也支持添加文本水印以及图片水印。
添加 Free Spire.PDF for Java 依赖
首先,在 pom.xml 文件中添加 Free Spire.PDF for Java 的依赖:
<dependency><groupId>e-iceblue</groupId><artifactId>free-spire-pdf-for-java</artifactId><version>1.9.6</version>
</dependency>
添加文本水印
在添加水印之前,需要读取原始 PDF 文件:
PdfDocument pdf = new PdfDocument();
pdf.loadFromFile("original.pdf");
然后,遍历 PDF 中的所有页面,并使用 PdfPageBase 添加水印:// 遍历 PDF 中的所有页面
for (int i = 0; i < pdf.getPages().getCount(); i++) {PdfPageBase page = pdf.getPages().get(i);// 添加文本水印PdfWatermark watermark = new PdfWatermark("Watermark");watermark.setFont(new PdfFont(PdfFontFamily.Helvetica, 36));watermark.setOpacity(0.5f);page.getWatermarks().add(watermark);
}
最后,需要保存修改后的 PDF 文件:pdf.saveToFile("output.pdf");
pdf.close();
添加图片水印
添加图片水印与添加文本水印类似,只需要将 PdfWatermark 的参数修改为图片路径即可。// 添加图片水印
PdfWatermark watermark = new PdfWatermark("watermark.png");
watermark.setOpacity(0.5f);
page.getWatermarks().add(watermark);
完整代码
下面是使用 Free Spire.PDF for Java 来实现 PDF 添加水印的完整代码:import com.spire.pdf.*;public class FreeSpirePdfWatermark {public static void main(String[] args) {// 读取原始 PDF 文件PdfDocument pdf = new PdfDocument();pdf.loadFromFile("original.pdf");// 遍历 PDF 中的所有页面for (int i = 0; i < pdf.getPages().getCount(); i++) {PdfPageBase page = pdf.getPages().get(i);// 添加文本水印PdfWatermark watermark = new PdfWatermark("Watermark");watermark.setFont(new PdfFont(PdfFontFamily.Helvetica, 36));watermark.setOpacity(0.5f);page.getWatermarks().add(watermark);// 添加图片水印// PdfWatermark watermark = new PdfWatermark("watermark.png");// watermark.setOpacity(0.5f);// page.getWatermarks().add(watermark);}// 保存修改后的 PDF 文件pdf.saveToFile("output.pdf");pdf.close();}
}
方式五:Aspose.PDF for Java
Aspose.PDF for Java 是一个强大的 PDF 处理库,提供了添加水印的功能。结合 Spring Boot 使用 Aspose.PDF for Java 库添加 PDF 水印的方式如下:
首先,在 pom.xml 文件中添加 Aspose.PDF for Java 的依赖:
<dependency><groupId>com.aspose</groupId><artifactId>aspose-pdf</artifactId><version>21.4</version>
</dependency>
在 Spring Boot 应用程序中调用 Aspose.PDF for Java 的 API 设置 PDF 水印。
添加文本水印
@PostMapping("/addTextWatermark")
public ResponseEntity<byte[]> addTextWatermark(@RequestParam("file") MultipartFile file) throws IOException {// 加载 PDF 文件Document pdfDocument = new Document(file.getInputStream());TextStamp textStamp = new TextStamp("Watermark");textStamp.setWordWrap(true);textStamp.setVerticalAlignment(VerticalAlignment.Center);textStamp.setHorizontalAlignment(HorizontalAlignment.Center);pdfDocument.getPages().get_Item(1).addStamp(textStamp);// 保存 PDF 文件ByteArrayOutputStream outputStream = new ByteArrayOutputStream();pdfDocument.save(outputStream);return ResponseEntity.ok().header(HttpHeaders.CONTENT_DISPOSITION, "attachment; filename=\"watermarked.pdf\"").contentType(MediaType.APPLICATION_PDF).body(outputStream.toByteArray());
}
添加图片水印
@PostMapping("/addImageWatermark")
public ResponseEntity<byte[]> addImageWatermark(@RequestParam("file") MultipartFile file) throws IOException {// 加载 PDF 文件Document pdfDocument = new Document(file.getInputStream());ImageStamp imageStamp = new ImageStamp("watermark.png");imageStamp.setWidth(100);imageStamp.setHeight(100);imageStamp.setVerticalAlignment(VerticalAlignment.Center);imageStamp.setHorizontalAlignment(HorizontalAlignment.Center);pdfDocument.getPages().get_Item(1).addStamp(imageStamp);// 保存 PDF 文件ByteArrayOutputStream outputStream = new ByteArrayOutputStream();pdfDocument.save(outputStream);return ResponseEntity.ok().header(HttpHeaders.CONTENT_DISPOSITION, "attachment; filename=\"watermarked.pdf\"").contentType(MediaType.APPLICATION_PDF).body(outputStream.toByteArray());
}
注意,以上代码中的文件名、宽度、高度等参数需要根据实际情况进行调整。
完整代码
完整的 Spring Boot 控制器类代码如下:
import com.aspose.pdf.*;
import org.springframework.http.HttpHeaders;
import org.springframework.http.MediaType;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.*;
import org.springframework.web.multipart.MultipartFile;import java.io.ByteArrayOutputStream;
import java.io.IOException;@RestController
@RequestMapping("/api/pdf")
public class PdfController {@PostMapping("/addTextWatermark")public ResponseEntity<byte[]> addTextWatermark(@RequestParam("file") MultipartFile file) throws IOException {// 加载 PDF 文件Document pdfDocument = new Document(file.getInputStream());TextStamp textStamp = new TextStamp("Watermark");textStamp.setWordWrap(true);textStamp.setVerticalAlignment(VerticalAlignment.Center);textStamp.setHorizontalAlignment(HorizontalAlignment.Center);pdfDocument.getPages().get_Item(1).addStamp(textStamp);// 保存 PDF 文件ByteArrayOutputStream outputStream = new ByteArrayOutputStream();pdfDocument.save(outputStream);return ResponseEntity.ok().header(HttpHeaders.CONTENT_DISPOSITION, "attachment; filename=\"watermarked.pdf\"").contentType(MediaType.APPLICATION_PDF).body(outputStream.toByteArray());}@PostMapping("/addImageWatermark")public ResponseEntity<byte[]> addImageWatermark(@RequestParam("file") MultipartFile file) throws IOException {// 加载 PDF 文件Document pdfDocument = new Document(file.getInputStream());ImageStamp imageStamp = new ImageStamp("watermark.png");imageStamp.setWidth(100);imageStamp.setHeight(100);imageStamp.setVerticalAlignment(VerticalAlignment.Center);imageStamp.setHorizontalAlignment(HorizontalAlignment.Center);pdfDocument.getPages().get_Item(1).addStamp(imageStamp);// 保存 PDF 文件ByteArrayOutputStream outputStream = new ByteArrayOutputStream();pdfDocument.save(outputStream);return ResponseEntity.ok().header(HttpHeaders.CONTENT_DISPOSITION, "attachment; filename=\"watermarked.pdf\"").contentType(MediaType.APPLICATION_PDF).body(outputStream.toByteArray());}
}
这里使用了两个 RESTful API:/addTextWatermark 和 /addImageWatermark,分别用于添加文本水印和图片水印。在请求中通过 file 参数传递 PDF 文件。
下面介绍如何使用 Postman 来测试 Spring Boot 应用程序的 API。
下载并安装 Postman。
打开 Postman,选择 POST 请求方法。
在 URL 地址栏中输入 http://localhost:8080/api/pdf/addTextWatermark。
在 Headers 标签页中设置 Content-Type 为 multipart/form-data。
在 Body 标签页中选择 form-data 类型,然后设置 key 为 file,value 选择本地的 PDF 文件。
点击 Send 按钮发送请求,等待应答结果。
处理结果将会在响应的 Body 中返回,也可以选择浏览器下载或保存到本地磁盘。
以上就是使用 Aspose.PDF for Java 库结合 Spring Boot 添加 PDF 水印的方式。
结论
本文介绍了几种使用 Spring Boot 实现 PDF 添加水印的方式,分别是使用 Apache PDFBox 库、iText 库以及 Ghostscript 命令行等。选择哪种方式,可以根据项目需求和个人偏好来决定。无论采用哪种方式,都需要注意保护原始 PDF 文件,不要在不必要的情况下直接修改原始文件。欢迎点赞收藏,在你老板安排你干这时,希望你能够及时找到相关的Java工具库,实现这项功能。
相关文章:
SpringBoot 实现 PDF 添加水印有哪些方案
SpringBoot 实现 PDF 添加水印有哪些方案 方式一:使用 Apache PDFBox 库方式二:使用 iText 库方式三:用 Ghostscript 命令行方式四:Free Spire.PDF for Java方式五:Aspose.PDF for Java 简介 PDF(Portable …...
【blender渲染】blender流体模拟基础
各位新年好哇,最近在做demo的时候,为了更好的效果,开始摸索一点离线渲染的东西。像这种后续渲染的处理,由于3ds max是更偏向于建模的dcc,有点不那么好使(没有说看不起vray的意思哈)。 像在实时…...
小白进阶之字符串处理
#include <cstdio> #include <cstring> int main() {char str[105];int count0,len0;scanf("%s",str);//输入字符lenstrlen(str);//求字符长for(int i0;i<len;i){if(str[i]A)//匹配计数count;}printf("%d",count); }#include <cstdio>…...
自定义Dubbo RPC通信协议
前言 Dubbo 协议层的核心SPI接口是org.apache.dubbo.rpc.Protocol,通过扩展该接口和围绕的相关接口,就可以让 Dubbo 使用我们自定义的协议来通信。默认的协议是 dubbo,本文提供一个 Grpc 协议的实现。 设计思路 Google 提供了 Java 的 Grpc…...
VB6.0报错:操作符AddressOf使用无效
VB调试,尝试调用DLL中的方法并带有回调函数,报错提示: 操作符AddressOf使用无效 代码: Private Sub btnScan_Click()... WCHBLEStartScanBLEDevices AddressOf callBackEnd Sub This function is called from the dll Public Fu…...
SpringCloud Aliba-Sentinel【中篇】-从入门到学废【5】
目录 1.流控规则 2. 熔断规则 3.热点规则 1.流控规则 1.资源名:唯一名称,默认请求路径 2.针对来源: Sentinel可以针对调用者进行限流,填写微服务名,默认default (不区分来源) 3.阈值类型/单机阈值: QPS(每秒钟的请求数量&…...
四、基础篇 vue条件渲染
v-if v-if 指令用于条件性地渲染一块内容。这块内容只会在指令的表达式返回 truthy 值的时候被渲染。 <template><div class"content"><div v-if"show">show渲染了</div></div> </template><script> export de…...
广东金牌电缆:法大大电子合同助力业务风险管控
广东金牌电缆集团股份有限公司(以下简称“广东金牌电缆”)成立于2013年,现为广东省电线电缆重点生产企业、广东省守合同重信用单位、国家专精特新小巨人企业、国家高新技术企业,拥有自主商标“夺冠”,“夺冠”商标被评…...
机器学习周刊第五期:一个离谱的数据可视化Python库、可交互式动画学概率统计、机器学习最全文档、快速部署机器学习应用的开源项目、Redis 之父的最新文章
date: 2024/01/08 这个网站用可视化的方式讲解概率和统计基础知识,很多内容还是可交互的,非常生动形象。 大家好,欢迎收看第五期机器学习周刊 本期介绍7个内容,涉及Python、概率统计、机器学习、大模型等,目录如下: 一个离谱的Python库看见概率,看见统计2024机器学习最…...
vue和react的hooks
一、什么是hooks 直译“钩子”,在程序中代表,系统运行在某一时期时,会调用注册在该时机的回调函数。例如浏览器提供的onload或addEventListener能注册在浏览器各种时机调用的方法。 二、react中的hooks 一系列以“use”作为开发的方法&…...
2024.1.19
今天狠狠地复习了一下C语言,不复习不知道,一复习吓一跳昂,这感觉好多都忘却了,这并非一件好事,所以说还好复习了,不然考试就有点问题了,但是还好写一下这些代码就马上想起来了,所以说…...
上位机编程:CP56Time2a格式精讲
Cp56Time2a介绍: Cp56Time2a是西门子PLC(可编程逻辑控制器)中用于时间数据传输的一种特殊格式,主要用于PCS7和基于TCP/IP的S7通信过程中。这种时间格式主要为了确保在不同的系统和设备之间进行精确的时间同步。 Cp56Time2a格式&a…...
Webpack5入门到原理12:处理 Html 资源
1. 下载包 npm i html-webpack-plugin -D 2. 配置 webpack.config.js const path require("path"); const ESLintWebpackPlugin require("eslint-webpack-plugin"); const HtmlWebpackPlugin require("html-webpack-plugin");module.expo…...
Vue3-Axios二次封装与Api接口统一管理
一、安装axios npm i axios 二、创建utils工具文件夹 创建request.ts文件 import axios from axios //引入element-plus消息提示 import { ElMessage } from element-plus //引入用户相关的仓库 import useUserStore from /store/modules/user //使用axios对象create方法,创建…...
RHCE: 主从DNS服务器配置 (实现正反向解析)
主服务器配置: 准备工作: #关闭防火墙 [root192 ~]# systemctl stop firewalld#关闭selinux [root192 ~]# setenforce 0#查看selinux状态 [root192 ~]# getenforce Permissive#安装bind包 [root192 ~]# yum install bind -y#查询软件包下的文件 /etc/named.conf #主配置文…...
Git学习笔记(第6章):GitHub操作(远程库操作)
目录 6.1 远程库操作 6.1.1 创建远程库 6.1.2 命名远程库 6.1.3 本地库推送到远程库(push) 6.1.4 远程库拉取到本地库(pull) 6.1.5 远程库克隆到本地库(clone) 6.2 团队内协作 6.3 跨团队协作 6.4 SSH免密登录 6.1 远程库操作 命令 作用 git remote -v 查看所有远程…...
【主题广范|见刊快】2024年海洋工程与测绘遥感国际学术会议(ICOESRS 2024)
【主题广范|见刊快】2024年海洋工程与测绘遥感国际学术会议(ICOESRS 2024) 2024 International Conference Ocean Engineering and Surveying Remote Sensing(ICOESRS 2024) 一、【会议简介】 随着人类对海洋的认识和开发不断深入,海洋工程和测绘遥感技术的研究和应…...
解决el-radio-group只触发一次的问题
1.需求是点击合并后,出来二次确认框。现在的问题是点击完出现二次确认框后,再次点击不出来二次确认框了 2.一开始代码是这样写的 <el-radio-group v-model"unfold" size"mini" changechangeMerge><el-radio-button :labe…...
openssl3.2 - 官方demo学习 - pkey - EVP_PKEY_RSA_keygen.c
文章目录 openssl3.2 - 官方demo学习 - pkey - EVP_PKEY_RSA_keygen.c概述笔记END openssl3.2 - 官方demo学习 - pkey - EVP_PKEY_RSA_keygen.c 概述 官方指出 : RSA key 如果小于2048位, 就属于弱key 官方demo中, 给出的默认key长度为4096位 从名字生成上下文 初始化上下文…...
密码搜|Facebook 8组问答,搞定Pixel与广告之间的关系!
Q1:Pixel(像素/代码)是什么? A:Pixel有多种称呼:Pixel、像素、代码。它只是一种分析工具,可帮助广告主了解用户在网站上采取的操作,继而衡量广告成效。 设置Facebook Pixel像素代码…...
我的日常开发工具迭代|MonkeyCode实测存档
做开发日常,其实大部分编码需求都很琐碎,根本用不上繁杂的专业工具。但市面上的AI编程软件,要么收费贵、额度抠搜,要么功能臃肿、操作繁琐,用起来处处受限。我一直在找一款适配个人日常使用、不折腾、无套路的轻量化编…...
Agent Runtime 重构:Session 作为事件日志的工程实践
1. 这不是新赛道,而是 runtime 层的“操作系统时刻”正在重演你有没有试过让一个 AI 代理连续工作四十分钟?不是闲聊,而是真干活:查数据库、调 API、读文档、写代码、改配置、再验证——一环扣一环。去年我带团队跑一个客户的数据…...
人教版高中英语选择性必修四单词音频+单词表+单词默写表(2026年最新)
2026年最新人教版高中英语选择性必修四课本单词表、单词默写表和听力音频,PDF高清电子版,可下载打印!单词音频下载链接:https://pan.quark.cn/s/c757d00cb27d人教版高中英语选修四单词高频30个1、literature /ˈlɪtrətʃə(r)/ …...
xc-union 从 1.0.0 到 2.0.0:开源私域返利基座
618 拼的不只是流量,更是开发效率。 每到大促节点,很多团队都会集中遇到同一类需求: 查券/导购工具要尽快上线H5 页面先跑,后端接口后续持续扩展要求可快速交付,也要支持后续二开 问题是,如果从零开始手撸&…...
中科院空天院团队Geography and Sustainability:1985年至2022年各国人均耕地面积差距的扩大:对实现可持续发展目标的威胁
耕地作为粮食的载体,是保障粮食安全的关键要素。全球人口增长不可避免地导致耕地扩张以满足对食物、纤维和能源日益增长的需求,这给耕地的承载能力带来沉重负担,并加速了土壤退化与流失,对实现联合国可持续发展目标2(S…...
RK3588开发板接口测试实战:USB、CAN、UART、GPIO全解析
1. 项目概述与核心价值作为一名在嵌入式开发领域摸爬滚打了十多年的老工程师,我深知拿到一块新开发板后,那种既兴奋又有点无从下手的感觉。特别是像RK3588这样功能强大的核心板,接口丰富,性能强劲,但如何快速验证这些基…...
谷歌收录怎么做比较快?提升网页打开速度至2秒内的优化方案
谷歌爬虫(Googlebot)在网站停留的时间存在硬性额度。网页文件若达到 6MB,传输会耗尽爬虫配额。调整网页体积到 1MB 以内,同等时间内抓取数量能提升 4倍。每日抓取页面从 1000 个爬升到 4000 个,新内容进入索引库的时间…...
LangFuse与LangSmith区别
文章目录🔄 **核心定位对比**🎯 **适用场景差异**💡 **为什么两者并存?**🔄 核心定位对比 LangSmith(LangChain官方): 闭源产品,由LangChain官方提供深度集成ÿ…...
智慧校园之考场作弊事实识别图像数据集 考试作弊识别监控 学生作弊识别系统数据集 AI识别作弊数据集
考试违规检测数据集简介 类别 Tags 标签 Object DetectionClasses (2) 类别(2) Cheating 作弊 Not Cheating 未作弊项目详情数据集类别涵盖考试场景下多种违规行为类别,包括但不限于作弊工具使用、交头接耳、擅自离座、抄袭等典型违规场景数据…...
抖音无水印下载器:高效保存高清视频与图集的完整解决方案
抖音无水印下载器:高效保存高清视频与图集的完整解决方案 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback su…...
