当前位置: 首页 > article >正文

Agent_Skills_万千应用_第01篇_PDF 处理 Skill:让 Agent 真正会读、会拆、会抽取 PDF

Agent Skills 万千应用 · 第01篇PDF 处理 Skill让 Agent 真正会读、会拆、会抽取 PDF01场景痛点开场PDF 是办公室里最像“黑盒”的文件你一定遇到过这种场景老板丢来一份 80 页行业报告让你 10 分钟内说清楚“重点、机会、风险”客户发来合同 PDF让你先帮忙看付款、违约、知识产权有没有坑供应商发来报价单 PDF你复制到 Excel 后发现型号、数量、单价全部错位。这时你问 AI“帮我总结这个 PDF。”它确实会写几段话但往往很空没有页码、没有字段、没有风险等级也无法继续交付给别人。真正的问题不是 AI 不会读而是 PDF 处理本身需要一套稳定流程先判断类型再选择方法最后输出可复查结果。02Skill 实操效果两个真实案例对比案例 A合同 PDF 初筛普通提示词输出合同整体比较完整建议关注付款条款、违约责任和知识产权归属最好请法务进一步确认。这句话没错但几乎不能直接用。使用 PDF Skill 后风险项位置风险说明建议付款节点不明确第3页第4条只写“验收后付款”未说明付款期限改为“验收通过后15个工作日内付款”违约责任偏重第6页第9条乙方赔偿责任未设置上限增加“不超过合同总金额”的上限知识产权归属不清第7页第11条未明确交付成果归属补充成果归属和使用范围这才像一个能给业务同事看的“初筛结果”。示例案例 B供应商报价单抽取普通提示词输出已提取报价信息包括产品名称、数量和价格。问题是真实报价单最怕列错位型号和数量错一列后面全错。使用 PDF Skill 后型号数量单价交期异常提示A100 控制板20185.007天正常B210 传感器5042.5010天正常C300 线束未识别9.805天数量列疑似缺失需人工确认PDF Skill 不会假装全都识别成功而是把“不确定项”标出来这对真实工作非常重要。03Skill 简介它是什么能解决什么PDF 处理 Skill 是一个专门处理 PDF 的 Agent 能力包。官方资料里OpenAI Codex 将 Skill 描述为包含SKILL.md和可选scripts/、references/、assets/的目录Claude 也提供了文档类预置 Skills并支持按需加载。这个 Skill 主要解决五类问题 报告摘要提炼结论、关键数据、页码来源 发票整理抽取金额、税额、开票日期 合同初筛定位风险条款并给修改建议 表格抽取尽量保留行列结构和异常标记 拆分合并按页码或规则生成新 PDF网上已有基础版 PDF Skill例如 Anthropic 官方开源的 PDF Skill。为了更适合中文办公场景我也生成了一份增强版pdf-processing-skill-zh-v4.zip随本文交付包提供下载。04核心机制SKILL.md 不是说明书而是调度入口PDF Skill 的关键不是写一堆提示词而是设计一套“判断—加载—执行—检查”的流程。它的核心规则有三层第一层触发条件。用户说“总结 PDF、看合同、提取报价单、合并文件”时Agent 知道该启用它。第二层渐进式加载。不要一次性加载所有规则。合同任务只加载合同清单发票任务只加载发票字段拆分合并任务才调用脚本。第三层输出自检。关键结论尽量带页码表格抽取要标记异常项无法识别的内容写“未识别”不能编造。这就是 Skill 和普通提示词的区别普通提示词靠临场发挥Skill 靠固定流程交付。05使用方式先让 Agent 读到 Skill再自然语言调用整体方法很简单把 Skill 包放到 Agent 能读取的位置然后在任务里明确调用。ChatGPT可把 Skill 包和 PDF 一起上传然后说“按这个 Skill 规则处理”。Claude支持官方 Skills也可以上传自定义 Skill。Hermes如果支持本地 skills 目录可把文件夹放入对应目录。OpenClaw可放入项目或用户级 skills 目录在任务中指定使用。示例提示词请用 PDF Processing Skill 处理这份合同 PDF输出风险清单、页码位置、修改建议和需人工确认项。06避坑指南别让 PDF Skill 变成“看起来很准”✅扫描件不等于文字 PDF。如果 PDF 是图片扫描件需要 OCR 或视觉识别不要直接提取文字。✅表格跨页最容易错。报价单、BOM、检测报告必须保留列名并标记不确定单元格。✅合同初筛不是法律意见。它适合做风险提示不能替代专业律师判断。✅关键结论要带来源。报告、合同、论文类 PDF最好输出页码或章节位置。✅不要覆盖原文件。拆分、合并、填写 PDF 时应生成新文件并保留处理日志。07下期预告下一篇继续讲办公场景里的高频能力Word 排版 Skill如何让 Agent 把内容变成真正可交付的公众号文档。AI 会写内容只是第一步。真正能交付还要解决标题层级、目录、表格、页码、图文排版和 Word 渲染稳定性。

相关文章:

Agent_Skills_万千应用_第01篇_PDF 处理 Skill:让 Agent 真正会读、会拆、会抽取 PDF

Agent Skills 万千应用 第01篇 PDF 处理 Skill:让 Agent 真正会读、会拆、会抽取 PDF 01|场景痛点开场:PDF 是办公室里最像“黑盒”的文件 你一定遇到过这种场景:老板丢来一份 80 页行业报告,让你 10 分钟内说清楚“…...

基于OpenCV-Python的指针式仪表视觉检测技术深度解析与工程实现

基于OpenCV-Python的指针式仪表视觉检测技术深度解析与工程实现 【免费下载链接】MeterReadV2 指针式仪表读数python程序 项目地址: https://gitcode.com/gh_mirrors/me/MeterReadV2 在工业自动化与智能制造领域,指针式仪表的自动化读数一直是数据采集环节的…...

AI横扫各行各业,为什么唯独啃不动数字孪生?

当下AI技术席卷全网,画图、写代码、生成素材样样全能,让不少人产生了“AI万能”的认知错觉。行业内不断传出声音,声称AI将彻底取代数字孪生开发、替代技术从业者,实现项目全自动落地。但深耕数字孪生可视化领域的从业者都清楚&…...

将Taotoken集成到自动化客服系统实现智能问答降本增效

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 将Taotoken集成到自动化客服系统实现智能问答降本增效 对于需要构建或升级智能客服系统的企业而言,核心诉求往往集中在…...

ChromeKeePass终极指南:如何在Chrome浏览器中实现KeePass密码自动填充

ChromeKeePass终极指南:如何在Chrome浏览器中实现KeePass密码自动填充 【免费下载链接】ChromeKeePass Chrome extensions for automatically filling credentials from KeePass 项目地址: https://gitcode.com/gh_mirrors/ch/ChromeKeePass ChromeKeePass是…...

如何无限期使用Cursor AI编程助手:完整免费方案指南

如何无限期使用Cursor AI编程助手:完整免费方案指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial…...

暗黑破坏神2存档修改器终极指南:告别重复刷装备,5分钟打造完美角色!

暗黑破坏神2存档修改器终极指南:告别重复刷装备,5分钟打造完美角色! 【免费下载链接】diablo_edit Diablo II Character editor. 项目地址: https://gitcode.com/gh_mirrors/di/diablo_edit 你是否厌倦了在暗黑破坏神2中反复刷装备&am…...

打卡2026阿里云峰会

打卡2026阿里云峰会。 这次大会不仅在美丽的西湖边上, 还有几个新朋友要来。。...

如何让Windows 11完美运行经典老游戏:DDrawCompat终极兼容方案

如何让Windows 11完美运行经典老游戏:DDrawCompat终极兼容方案 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/d…...

Midjourney色调分离终极手册(仅限Pro用户内部流通的17个未公开--no--参数组合)

更多请点击: https://codechina.net 第一章:Midjourney色调分离的核心原理与视觉语义边界 色调分离(Tonal Separation)在 Midjourney 并非原生参数,而是通过提示词工程、风格化权重控制与隐式潜在空间引导协同实现的视…...

跨行面试时被问你凭什么胜任,我亮出这个证书后面试官沉默了

很多人跨行找工作,最怕的不是不会,而是那句直戳心口的话:「你没有相关经验,凭什么说自己能胜任?」 😶这句话背后,考的从来不只是能力,还有你能不能拿出一个让人信服的证明。到了 202…...

ReTerraForged终极指南:5步掌握Minecraft高级地形生成技术

ReTerraForged终极指南:5步掌握Minecraft高级地形生成技术 【免费下载链接】ReTerraForged TerraForged for modern MC versions 项目地址: https://gitcode.com/gh_mirrors/re/ReTerraForged ReTerraForged是一款专为现代Minecraft版本设计的革命性地形生成…...

macOS运行Windows程序的终极指南:Whisky完全攻略

macOS运行Windows程序的终极指南:Whisky完全攻略 【免费下载链接】Whisky A modern Wine wrapper for macOS built with SwiftUI 项目地址: https://gitcode.com/gh_mirrors/wh/Whisky 想在Mac上无缝运行Windows软件和游戏,但又不想安装虚拟机或双…...

如何为Hermes Agent配置Taotoken作为自定义模型供应商并写入环境变量

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 如何为Hermes Agent配置Taotoken作为自定义模型供应商并写入环境变量 基础教程类,详细说明在Hermes Agent中配置Taotok…...

免费暗黑2存档编辑器终极指南:3分钟成为游戏存档修改大师

免费暗黑2存档编辑器终极指南:3分钟成为游戏存档修改大师 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2的存档问题烦恼吗?角色属性不够强、装备不理想、任务进度丢失……现在&#xf…...

CFO必看|OpenAI官方写给财务团队的Codex教程:5大场景+可直接复制的Prompt

OpenAI发布Codex财务团队教程,5大场景一键生成MBR报告、财务模型审计、CFO汇报材料、差异分析及预测刷新,让财务人专注数字核查与决策准备。内容由AI智能生成有用高效赋能CFO团队,释放财务决策核心价值。近日,OpenAI出了一份财务团…...

一款多功能显示控制器芯片,FHD 120/144Hz,支持最高1920x1080@120Hz.

主要特性特性类别具体规格输入接口1VGA (模拟RGB)、1HDMI 1.4 (带HDCP1.4/2.2)、1DP1.2 组合接口 (兼容HDMI 1.4,带HDCP1.4/2.2)输出接口2 Port LVDS,支持8bit/10bit最大分辨率1920x1200100Hz 或 1920x1080120Hz (带ODC)色彩深度输入:6/8/10b…...

Steam Economy Enhancer:终极Steam市场与库存自动化管理指南

Steam Economy Enhancer:终极Steam市场与库存自动化管理指南 【免费下载链接】Steam-Economy-Enhancer 中文版:Enhances the Steam Inventory and Steam Market. 项目地址: https://gitcode.com/gh_mirrors/ste/Steam-Economy-Enhancer Steam Eco…...

UV-UI终极指南:如何在30分钟内构建跨平台应用

UV-UI终极指南:如何在30分钟内构建跨平台应用 【免费下载链接】uv-ui uv-ui 破釜沉舟之兼容vue32、app、h5、小程序等多端基于uni-app和uView2.x的生态框架,支持单独导入,开箱即用,利剑出击。 项目地址: https://gitcode.com/gh…...

StreamCap:打破直播录制壁垒,轻松捕获40+平台精彩内容

StreamCap:打破直播录制壁垒,轻松捕获40平台精彩内容 【免费下载链接】StreamCap Multi-Platform Live Stream Automatic Recording Tool | 多平台直播流自动录制客户端 基于FFmpeg 支持监控/定时/转码 项目地址: https://gitcode.com/gh_mirrors/st…...

智能图像分层革命:5分钟将任何图片转换为可编辑PSD图层

智能图像分层革命:5分钟将任何图片转换为可编辑PSD图层 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 你是否曾面对一张精美的插画&#xff…...

如何快速搭建Sunshine游戏串流:面向新手的完整指南

如何快速搭建Sunshine游戏串流:面向新手的完整指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 你是否曾想过在客厅的电视上流畅玩PC游戏,或者在平板上享…...

TikTokDownload:5分钟搞定抖音去水印批量下载终极方案

TikTokDownload:5分钟搞定抖音去水印批量下载终极方案 【免费下载链接】TikTokDownload 抖音去水印批量下载用户主页作品、喜欢、收藏、图文、音频 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokDownload 想要轻松保存抖音上的精彩内容却苦于官方水印…...

DistroAV(原OBS-NDI)完整使用指南:NDI技术在OBS中的高效应用

DistroAV(原OBS-NDI)完整使用指南:NDI技术在OBS中的高效应用 【免费下载链接】obs-ndi DistroAV (formerly OBS-NDI): NDI integration for OBS Studio 项目地址: https://gitcode.com/gh_mirrors/ob/obs-ndi DistroAV(原名…...

免费激活IDM的终极解决方案:开源脚本完整指南

免费激活IDM的终极解决方案:开源脚本完整指南 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script 你是否经常遇到IDM(Internet Download Mana…...

终极指南:使用EdiZon轻松编辑Switch游戏存档与内存

终极指南:使用EdiZon轻松编辑Switch游戏存档与内存 【免费下载链接】EdiZon 💡 A homebrew save management, editing tool and memory trainer for Horizon (Nintendo Switch) 项目地址: https://gitcode.com/gh_mirrors/ed/EdiZon EdiZon是一款…...

Aimmy AI瞄准辅助终极指南:从零开始到游戏高手

Aimmy AI瞄准辅助终极指南:从零开始到游戏高手 【免费下载链接】Aimmy Universal Second Eye for Gamers with Impairments (Universal AI Aim Aligner (AI Aimbot) - ONNX/YOLOv8 - C#) 项目地址: https://gitcode.com/gh_mirrors/ai/Aimmy Aimmy是一款基于…...

从怀疑到真香!2026我整理直播内容总结只留下这一款好用工具

上周刚开完3小时的季度评审会,老板散会前说“下班前把整理好的纪要发我”,我抱着电脑坐在位置上,对着三小时录音头都大——逐句听改错别字一下午就没了;之前做用户访谈,受访者一口西南官话,换了三个工具识别…...

终极指南:3分钟完成Figma中文界面汉化,设计师必备的完整翻译插件

终极指南:3分钟完成Figma中文界面汉化,设计师必备的完整翻译插件 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而烦恼吗?作为…...

ncmdump终极教程:3分钟解锁网易云音乐NCM加密格式

ncmdump终极教程:3分钟解锁网易云音乐NCM加密格式 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM格式文件无法在其他播放器使用而烦恼吗?ncmdump就是你需要的终极解决方案&#xf…...