当前位置: 首页 > article >正文

SecGPT-14B案例分享:安全意识培训中AI生成钓鱼邮件识别考题与解析

SecGPT-14B案例分享安全意识培训中AI生成钓鱼邮件识别考题与解析1. 引言当安全意识培训遇上AI助手想象一下你是一家公司的安全培训负责人。每个月你都要绞尽脑汁设计新的钓鱼邮件识别考题既要贴近最新的攻击手法又要能有效测试员工的警惕性。这工作不仅耗时耗力而且随着攻击手段的快速演变你设计的考题可能很快就过时了。现在有了SecGPT-14B这个专为网络安全打造的AI助手情况就完全不同了。它不仅能帮你快速生成逼真的钓鱼邮件考题还能提供专业的解析告诉你这封邮件里到底藏着哪些“坑”。今天我就带你看看如何用这个已经部署好的SecGPT-14B模型来一场高效、智能的安全意识培训。2. 快速上手你的AI安全助手已就位2.1 模型服务状态确认如果你已经按照之前的教程部署了SecGPT-14B现在只需要确认服务是否正常运行。打开终端输入以下命令cat /root/workspace/llm.log如果看到类似下面的输出说明模型服务已经成功启动并正在运行INFO: Started server process [1234] INFO: Waiting for application startup. INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRLC to quit)看到这些信息你就可以放心使用了。模型加载需要一些时间特别是第一次启动时请耐心等待几分钟。2.2 打开对话界面SecGPT-14B提供了一个非常友好的Web界面让你可以像聊天一样和它交流。在浏览器中打开Chainlit前端界面你会看到一个简洁的对话窗口。这个界面设计得很直观左边是对话历史右边是输入框。你可以直接在这里输入问题模型会实时给出回答。界面响应速度很快体验很流畅。3. 实战演练让AI生成钓鱼邮件考题3.1 生成第一道考题伪装成IT部门的密码重置邮件让我们从最常见的钓鱼邮件类型开始。在Chainlit的输入框中输入以下指令请生成一封伪装成公司IT部门的钓鱼邮件主题是“紧急您的账户密码需要立即重置”。邮件内容要看起来专业包含常见的钓鱼元素比如紧迫感、伪造的登录链接、模仿公司logo等。最后请指出这封邮件中的3个可疑点。几秒钟后SecGPT-14B就会生成一封相当逼真的钓鱼邮件发件人IT Support itsupportyourcompany-security.com主题【紧急行动】您的账户密码需要立即重置尊敬的员工我们的安全系统检测到您的账户在异常位置有登录尝试。为保护您的账户安全请立即点击以下链接重置密码重置密码重要提示您必须在24小时内完成此操作否则账户将被临时锁定此链接仅限本次使用请勿转发给他人如果您未发起此请求请立即联系IT部门感谢您的配合。公司IT安全团队可疑点分析发件人邮箱域名使用了“yourcompany-security.com”而不是公司官方域名紧迫性制造强调“24小时内完成”制造恐慌感促使快速行动链接伪装域名看起来相似但实际是伪造的“securelogin”子域名3.2 生成进阶考题针对财务部门的发票诈骗邮件接下来我们试试更针对性的攻击场景。输入新的指令生成一封针对财务部门的钓鱼邮件伪装成合作供应商催收逾期发票。要求包含附件伪装的Excel文件邮件语气要正式但带有催促意味。同时分析这封邮件的4个危险信号。SecGPT-14B的生成结果会让你惊讶发件人张经理 zhang.lisupplier-invoice.com主题关于贵司发票 No. INV-2024-0875 的紧急跟进财务部负责人您好我司系统显示贵司有一笔发票编号INV-2024-0875金额¥48,750.00已逾期15天。随邮件附上详细账单及付款信息[INV-2024-0875_付款明细.xlsm]为避免产生滞纳金并影响后续合作请于今日下班前安排付款至以下账户开户行XX银行深圳分行账户名深圳XX科技有限公司账号6228 4832 1098 7765 432如有疑问可查看附件中的联系方式。期待您的及时处理顺祝商祺张立财务部经理深圳XX科技有限公司危险信号分析异常附件类型使用.xlsm格式可能包含宏病毒而非常规的.pdf或.xlsx紧急付款要求要求“今日下班前”付款不给核实时间账户信息在邮件正文正规公司通常会通过安全渠道或合同约定账户发件人邮箱与公司名不匹配邮箱域名与声称的公司名称不一致3.3 生成高阶考题CEO欺诈邮件最后我们来挑战一下最难识别的CEO欺诈邮件创建一封高度定制的CEO欺诈邮件针对公司某个特定部门的经理。邮件要引用真实的公司活动使用正确的内部术语请求紧急转账。然后详细解释为什么这种邮件很难被识别以及员工应该如何验证。看看AI能生成多逼真的内容发件人王总 wang.zongcompany-ceo.com主题紧急并购项目保密付款 - 仅你知我知李经理我正在外出差手机信号不好。有件紧急且高度保密的事情需要你立即处理。你知道我们正在秘密洽谈收购“创新科技”的事吧对方要求今天下午3点前收到一笔¥285,000的诚意金否则可能转向竞争对手。因涉及商业机密此事不能通过常规财务流程。请立即将款项汇至以下账户我会在回公司后补全所有手续收款方创新科技有限公司银行招商银行北京分行账号6214 8576 3210 9876关键点此事仅限你我知道切勿在内部系统中创建记录使用“特殊项目-并购准备”这个预算科目你知道的完成后短信通知我13xxxxxxxxx不要发邮件时间紧迫全靠你了王总为什么这类邮件难以识别上下文真实引用了真实的并购项目如果公司确实有相关传闻内部知识准确使用了正确的预算科目和内部术语社交工程技巧制造紧迫感、强调保密性、模仿领导沟通风格规避正常流程要求绕过常规审批这本身是危险信号但容易被忽略验证建议通过其他渠道电话、内部通讯工具直接联系领导确认即使要求保密也应告知直接上级或安全部门对任何要求绕过正常流程的请求保持高度警惕4. 智能解析不只是生成更要教会识别4.1 深度分析钓鱼邮件的心理战术SecGPT-14B不仅能生成考题还能提供深度的解析。试着问它详细分析钓鱼邮件中常用的5种心理操纵技巧并举例说明如何识别和应对。它会给出专业的分析1. 紧迫感制造手法使用“立即”、“紧急”、“最后机会”等词汇限制思考时间例子“您的账户将在1小时后被锁定”识别问自己“为什么这么急正规流程需要这么赶吗”应对无论多急都按照正常流程验证2. 权威伪装手法冒充领导、IT部门、银行、政府机构等权威角色例子“我是王总现在需要你帮忙处理一件急事”识别验证发件人真实身份不轻信显示名称应对通过已知官方渠道联系确认3. 好奇心激发手法使用诱人标题或内容吸引点击例子“您有一笔奖金待领取”、“关于您的最新评价”识别思考“为什么我会收到这个我申请过吗”应对不点击不明链接直接访问官方网站查看4. 恐惧利用手法制造安全威胁、法律问题、财务损失等恐惧例子“您的账户存在异常活动请立即验证”识别正规机构不会用恐吓方式沟通应对保持冷静通过独立渠道联系相关机构5. 帮助请求手法伪装成需要帮助的同事、朋友或客户例子“我在外地手机丢了急需你帮我买个礼品卡”识别验证对方身份特别是涉及金钱时应对电话确认不单独处理涉及资金的请求4.2 识别技术层面的红绿灯除了心理战术钓鱼邮件在技术层面也有很多破绽。让SecGPT-14B帮你总结列出钓鱼邮件在技术层面常见的10个可疑特征从发件人地址、链接、附件等方面分析。你会得到一份实用的检查清单发件人地址相关域名细微差别company.com vs companny.com多一个n子域名滥用security.company.com vs company.security.com免费邮箱冒充用gmail、qq邮箱冒充公司邮箱链接相关4.显示文本与真实链接不符鼠标悬停查看真实URL5.短链接服务bit.ly、t.cn等隐藏真实目的地6.IP地址直接访问http://192.168.1.1/login 而非域名附件相关7.非常见文件类型.exe、.scr、.js、.vbs等可执行文件8.双重扩展名invoice.pdf.exe实际是exe文件9.宏启用文档.docm、.xlsm要求启用宏邮件内容10.语法错误官方邮件通常经过校对错误较少11.格式混乱logo模糊、排版不专业12.要求禁用安全设置“请将我们加入白名单”5. 培训应用构建动态更新的考题库5.1 自动化考题生成流程有了SecGPT-14B你可以建立一个自动化的考题生成系统。下面是一个简单的Python脚本示例展示了如何批量生成不同难度的钓鱼邮件考题import requests import json from typing import List, Dict class PhishingExamGenerator: def __init__(self, api_url: str http://localhost:8000/v1/chat/completions): self.api_url api_url def generate_question(self, difficulty: str, target_role: str) - Dict: 生成不同难度和目标的钓鱼邮件考题 prompts { easy: f生成一封针对{target_role}的初级钓鱼邮件包含3个明显的可疑点。邮件主题要吸引人内容要简短。, medium: f生成一封针对{target_role}的中级钓鱼邮件模仿正规公司通知包含5个需要仔细辨认的可疑点。, hard: f生成一封针对{target_role}的高级钓鱼邮件高度定制化引用公司内部信息包含7个隐蔽的可疑点。 } prompt prompts.get(difficulty, prompts[medium]) # 调用SecGPT-14B API response requests.post( self.api_url, json{ model: SecGPT-14B, messages: [{role: user, content: prompt}], temperature: 0.7, max_tokens: 1000 } ) if response.status_code 200: result response.json() email_content result[choices][0][message][content] # 请求解析可疑点 analysis_prompt f请详细分析以下邮件的可疑点按重要性排序\n\n{email_content} analysis_response requests.post( self.api_url, json{ model: SecGPT-14B, messages: [{role: user, content: analysis_prompt}], temperature: 0.3, max_tokens: 800 } ) analysis analysis_response.json()[choices][0][message][content] if analysis_response.status_code 200 else 解析生成失败 return { difficulty: difficulty, target: target_role, email: email_content, analysis: analysis, hints: self._generate_hints(difficulty) } return {error: 生成失败} def _generate_hints(self, difficulty: str) - List[str]: 根据难度生成提示 hints { easy: [ 检查发件人邮箱地址, 查看链接的真实URL, 注意邮件的紧迫性要求 ], medium: [ 验证附件文件类型, 核对公司名称和域名, 检查语法和格式错误, 确认请求是否符合常规流程 ], hard: [ 通过其他渠道验证请求, 检查邮件头信息, 分析语言模式和写作风格, 验证引用信息的真实性, 确认是否有内部系统记录 ] } return hints.get(difficulty, []) def generate_exam_paper(self, questions_per_difficulty: int 2) - Dict: 生成完整的试卷 targets [新员工, 财务人员, IT管理员, 高管助理, 普通员工] difficulties [easy, medium, hard] exam { title: 钓鱼邮件识别能力测试, date: 2024年, instructions: 请仔细阅读每封邮件找出所有可疑点。每封邮件至少包含3个可疑点。, questions: [] } for difficulty in difficulties: for target in targets[:questions_per_difficulty]: question self.generate_question(difficulty, target) if error not in question: exam[questions].append(question) return exam # 使用示例 if __name__ __main__: generator PhishingExamGenerator() # 生成单个考题 question generator.generate_question(medium, 财务人员) print(f生成的邮件\n{question[email]}\n) print(f解析\n{question[analysis]}\n) print(f提示{question[hints]}) # 生成完整试卷在实际使用中可能需要分批处理 # exam generator.generate_exam_paper() # print(f试卷包含 {len(exam[questions])} 道题)5.2 培训效果评估与反馈生成考题只是第一步更重要的是评估培训效果。SecGPT-14B还可以帮你分析员工的答题情况假设在一次培训中50名员工面对一封钓鱼邮件有35人识别出了主要可疑点但只有15人报告了所有可疑点。请分析可能的原因并提出改进培训的建议。模型会给出深入的分析识别率分析主要可疑点识别率高70%说明基础培训有效员工能发现明显问题全面识别率低30%表明员工可能只关注最明显的1-2个问题对隐蔽手段缺乏认识时间压力下检查不够仔细改进建议分层培训基础层所有员工 - 识别明显特征进阶层关键岗位 - 识别隐蔽手段专家层安全团队 - 深度分析技术细节实战演练升级从单封邮件到完整攻击链加入时间压力测试模拟针对性攻击如针对财务的诈骗反馈机制优化每题提供详细解析展示优秀识别案例定期重复测试跟踪进步情景化训练结合具体工作岗位场景使用真实业务邮件模板模拟紧急情况下的判断6. 总结让安全意识培训更智能、更有效通过今天的实践我们看到了SecGPT-14B在安全意识培训中的强大能力。它不仅仅是一个生成工具更是一个全方位的培训助手。核心价值总结效率提升几分钟生成一套专业考题替代数小时的手工设计质量保证基于最新攻击手法生成逼真案例保持培训内容时效性个性化定制针对不同部门、岗位生成针对性测试内容深度解析不仅生成考题还提供专业分析和教学要点持续更新随着模型更新能自动适应新的攻击手法实际应用建议月度测试每月生成新的考题库保持员工警惕性专项培训针对特定威胁如CEO欺诈、供应链攻击进行深度训练新员工培训快速建立基础安全意识降低人为风险事件复盘分析真实事件生成类似案例进行强化训练最后的小贴士生成的考题要结合实际公司情况进行调整定期更新模型知识保持与最新威胁同步结合其他培训方式如讲座、演练形成完整体系收集员工反馈不断优化考题难度和类型安全意识的提升是一个持续的过程而AI工具能让这个过程更加高效、更有针对性。SecGPT-14B就像是一个24小时在线的安全培训师随时为你提供最新的威胁案例和专业的解析指导。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

SecGPT-14B案例分享:安全意识培训中AI生成钓鱼邮件识别考题与解析

SecGPT-14B案例分享:安全意识培训中AI生成钓鱼邮件识别考题与解析 1. 引言:当安全意识培训遇上AI助手 想象一下,你是一家公司的安全培训负责人。每个月,你都要绞尽脑汁设计新的钓鱼邮件识别考题,既要贴近最新的攻击手…...

Audio Pixel Studio人声分离技术解析:频谱掩码与短时傅里叶变换原理

Audio Pixel Studio人声分离技术解析:频谱掩码与短时傅里叶变换原理 1. 引言:从“听”到“分”的技术魔法 你有没有想过,为什么我们能在KTV里跟着原唱哼歌,也能在音乐软件里轻松找到一首歌的“伴奏版”或“纯人声版”&#xff1…...

Nunchaku FLUX.1 CustomV3与Vue3前端整合:实时图像生成预览系统

Nunchaku FLUX.1 CustomV3与Vue3前端整合:实时图像生成预览系统 1. 引言 想象一下这样的场景:你在电商平台设计商品海报,需要快速生成多种风格的图片素材;或者你在创作社交媒体内容,想要实时看到不同提示词产生的视觉…...

影墨·今颜模型API开发入门:使用IDEA进行Java客户端调用

影墨今颜模型API开发入门:使用IDEA进行Java客户端调用 最近有不少做Java开发的朋友问我,怎么在自己的项目里调用那些很火的AI图片生成API。他们看了一些Python的教程,觉得挺简单,但一回到自己熟悉的Java环境,就有点无…...

CLAP模型在ARM架构的移植优化:树莓派实战

CLAP模型在ARM架构的移植优化:树莓派实战 1. 引言 想在树莓派上跑音频AI模型?之前可能觉得这是天方夜谭,毕竟CLAP这种对比学习音频语言模型通常需要GPU和大内存。但经过一番折腾,我发现其实在4GB内存的树莓派上也能流畅运行CLAP…...

Phi-3-mini新手必看:Ollama环境搭建与模型调用完整步骤

Phi-3-mini新手必看:Ollama环境搭建与模型调用完整步骤 想快速体验一个既聪明又轻巧的AI助手吗?今天要介绍的Phi-3-mini-4k-instruct,可能就是你的理想选择。它只有38亿参数,小到能在普通电脑上流畅运行,但智能程度却…...

极限测试:Qwen-Image-2512-Pixel-Art-LoRA 在生成超大规模像素壁画(4096x4096)上的表现

极限测试:Qwen-Image-2512-Pixel-Art-LoRA 在生成超大规模像素壁画(4096x4096)上的表现 最近在玩各种AI绘画模型,总想试试它们的极限在哪。大家平时用模型生成图片,可能大多停留在512x512或者1024x1024的分辨率&#…...

开源图标库RemixIcon:打造专业界面的视觉解决方案

开源图标库RemixIcon:打造专业界面的视觉解决方案 【免费下载链接】RemixIcon Open source neutral style icon system 项目地址: https://gitcode.com/gh_mirrors/re/RemixIcon 开源图标库作为现代UI设计的核心组件,为开发者和设计师提供了标准化…...

Nano-Banana与LSTM模型集成:提升复杂结构时序分析能力

Nano-Banana与LSTM模型集成:提升复杂结构时序分析能力 在工业质检领域,时间序列数据分析一直是个技术难点。传统方法往往难以捕捉复杂结构变化中的动态规律,导致预测不准、检测不及时。今天我们来探讨一种创新方案:将LSTM时序预测…...

实战指南:在快马平台部署一个具备origin多峰拟合功能的专业材料分析应用

最近在材料学实验数据分析中,经常需要处理XRD或光谱数据,进行多峰拟合来获取晶粒尺寸、应力等信息。传统的Origin软件功能强大,但协作和分享不便。这次我尝试在InsCode(快马)平台上,构建一个具备类似Origin核心分析能力的Web应用&…...

突破桌面自动化瓶颈:用RobotJS构建企业级任务流

突破桌面自动化瓶颈:用RobotJS构建企业级任务流 【免费下载链接】robotjs Node.js Desktop Automation. 项目地址: https://gitcode.com/gh_mirrors/ro/robotjs 在数字化转型加速的今天,桌面自动化已成为提升工作效率的关键技术。传统的人工操作…...

基于 Express 的毕业设计效率提升指南:从脚手架到部署的工程化实践

作为一名即将毕业的计算机专业学生,我深知完成一个高质量的毕业设计项目是多么具有挑战性。时间紧、任务重,既要实现核心功能,又要保证代码质量和可维护性,常常让人手忙脚乱。尤其是在使用 Node.js 的 Express 框架时,…...

AudioSeal Pixel Studio入门必看:AI语音合成厂商必备的防冒用、防盗用技术栈

AudioSeal Pixel Studio入门必看:AI语音合成厂商必备的防冒用、防盗用技术栈 1. 引言:当AI语音成为“双刃剑” 想象一下这个场景:你是一家AI语音合成公司的技术负责人。你们团队辛苦研发的、音色极具辨识度的明星主播声音,突然出…...

AIGlasses OS Pro开发:C++高性能视觉算法实现

AIGlasses OS Pro开发:C高性能视觉算法实现 探索如何在AIGlasses OS Pro上使用C构建高性能视觉算法,掌握内存管理和并行计算的关键优化技巧 1. 开发环境搭建与基础配置 AIGlasses OS Pro为开发者提供了完整的C开发工具链。首先需要安装专门的SDK包&…...

Axure界面全中文改造:本地化方案助新手高效掌握原型设计

Axure界面全中文改造:本地化方案助新手高效掌握原型设计 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包,不定期更新。支持 Axure 9、Axure 10。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn …...

wan2.1-vae开源价值:规避商业模型版权风险,满足国企/政务合规要求

wan2.1-vae开源价值:规避商业模型版权风险,满足国企/政务合规要求 1. 引言:为什么开源模型在今天如此重要? 如果你在国企、事业单位或者任何对数据安全、版权合规有严格要求的机构工作,最近可能正为AI图像生成这件事…...

MiniCPM-V-2_6应用案例:智能识图助手,工作学习效率翻倍

MiniCPM-V-2_6应用案例:智能识图助手,工作学习效率翻倍 1. 引言:当你的电脑能“看懂”图片 想象一下这个场景:你正在写一份报告,需要从一份PDF扫描件里提取表格数据,或者从一张复杂的流程图里总结关键步骤…...

SecGPT-14B精彩案例分享:真实CTF题解、渗透测试思路推演全过程

SecGPT-14B精彩案例分享:真实CTF题解、渗透测试思路推演全过程 1. 引言:当AI大模型遇上网络安全实战 想象一下,你正在参加一场网络安全竞赛(CTF),面对一道复杂的Web渗透题,或者在企业内部进行…...

AudioSeal Pixel Studio行业落地:在线音乐教育平台师生语音作业版权归属管理

AudioSeal Pixel Studio行业落地:在线音乐教育平台师生语音作业版权归属管理 1. 引言:在线音乐教育的“作业归属”难题 想象一下这个场景:一位在线音乐老师,每周要批改上百份学生提交的演唱或乐器演奏的语音作业。学生A提交了一…...

网易云音乐批量下载工具:高效构建个人离线音乐库的完整指南

网易云音乐批量下载工具:高效构建个人离线音乐库的完整指南 【免费下载链接】netease-cloud-music-dl Netease cloud music song downloader, with full ID3 metadata, eg: front cover image, artist name, album name, song title and so on. 项目地址: https:/…...

影墨·今颜小红书模型在智能客服场景的落地:自动生成标准问答对与情景对话

影墨今颜小红书模型在智能客服场景的落地:自动生成标准问答对与情景对话 1. 引言:从客服的日常痛点说起 如果你负责过客服团队,或者自己就是客服,一定对下面这些场景不陌生:新产品上线,销售和运营同事催着…...

Cursor-free-vip深度解析:突破AI编程助手限制的技术与伦理

Cursor-free-vip深度解析:突破AI编程助手限制的技术与伦理 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your…...

Hunyuan-MT 7B算法优化:提升小语种翻译质量的核心方法

Hunyuan-MT 7B算法优化:提升小语种翻译质量的核心方法 1. 引言 小语种翻译一直是机器翻译领域的难点,数据稀缺、语言结构复杂、文化差异大等问题长期困扰着开发者。腾讯混元开源的Hunyuan-MT-7B模型在WMT2025比赛中拿下30个语种第一名,其中…...

Hunyuan-MT Pro快速上手:Streamlit缓存机制加速重复翻译响应(Cache层详解)

Hunyuan-MT Pro快速上手:Streamlit缓存机制加速重复翻译响应(Cache层详解) 1. 项目概述:现代化翻译终端 Hunyuan-MT Pro是一个基于腾讯混元开源模型构建的现代化翻译Web终端。它将Streamlit的便捷交互界面与混元模型强大的多语言…...

解决ChatTTS报错asset/decoder.safetensors not exist models load failed的高效方案

最近在部署ChatTTS项目时,遇到了一个挺典型的报错:asset/decoder.safetensors not exist models load failed。这个错误直接导致模型加载失败,整个应用启动不了。经过一番折腾和梳理,我总结了一套高效的排查和解决方案&#xff0c…...

【程序源代码】 类似openclaw 龙虾AI终端助手(含源码)

关键字:类似openclaw 龙虾AI终端助手(含源码、后端源码) (一)系统介绍 1.1 系统介绍 类似openclaw 龙虾AI终端助手(含源码、后端源码)基于 Solon AI (支持 Java8 到 Java25&…...

如何用TFTPD64构建企业级网络服务解决方案:从部署到性能调优实战指南

如何用TFTPD64构建企业级网络服务解决方案:从部署到性能调优实战指南 【免费下载链接】tftpd64 The working repository of the famous TFTP server. 项目地址: https://gitcode.com/gh_mirrors/tf/tftpd64 TFTPD64是一款集成TFTP(简单文件传输协…...

千问3.5-27B图文理解效果展示:复杂场景图识别+多对象关系推理案例

千问3.5-27B图文理解效果展示:复杂场景图识别多对象关系推理案例 你有没有想过,让AI像人一样“看懂”一张图片,不仅能说出里面有什么,还能分析出它们之间的关系?比如,看到一张家庭聚会的照片,A…...

理解 Prompt Cache 与 Agent 的“上下文税”:AI时代架构纪律

导读:本文通过Claude Code案例,解释了 AI agent 中的提示词缓存机制,实现 92% 缓存命中率,显著降低重复计算的“上下文税”,节省高达81%的成本。核心原理在于Transformer的预填充阶段计算Key-Value向量,仅需…...

PP-DocLayoutV3详细步骤:像素级坐标定位text/title/table/figure等11类区域

PP-DocLayoutV3详细步骤:像素级坐标定位text/title/table/figure等11类区域 你是不是经常遇到这样的问题:拿到一份扫描的合同或者论文PDF,想提取里面的文字和表格,结果OCR工具把标题、正文、图片和表格全都混在一起,识…...