当前位置：首页 > article >正文

LOCAL_SENSITIVE_PATTERNS：不经过大模型的本地正则补强:开源免费的WPS AI 软件察元AI文档助手

article 2026/5/19 3:40:39

LOCAL_SENSITIVE_PATTERNS：不经过大模型的本地正则补强摘要本文围绕标题所述主题，结合本仓库当前源码行进行说明。仅供技术理解与内部培训，不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。正文0. 结论先行结论先行：保密检查由内置助手触发大模型按模板输出审查意见，程序再从摘要中抽取命中片段并尝试挂批注。长文档依赖分块与结构化 JSON 提示。下文每节先说明要点，紧接着给出仓库中的对应源码片段。本篇标题：LOCAL_SENSITIVE_PATTERNS：不经过大模型的本地正则补强1. 助手标识与默认写回方式保密检查对应内置助手 id 为 analysis.security-check。下列片段展示其在注册表中的默认动作与输入来源等字段，便于与界面行为对照。// src/utils/assistantRegistry.js 第653-667行{id:'analysis.security-check',label:'保密检查',shortLabel:'保密检查',group:'analysis',modelType:'chat',defaultModelCategory:'chat',supportsRibbon:true,defaultDisplayLocations:['ribbon-main'],allowedActions:['comment','link-comment','insert','append','none'],defaultAction:'link-comment',defaultOutputFormat:'markdown',defaultInputSource:INPUT_SOURCE_DOCUMENT,description:'基于关键词和上下文检查文档中的涉密、涉军、单位名称、密级标识和敏感业务信息风险。',2. 研判原则写入提示词模板研判原则与风险级别枚举写在 userPromptTemplate 的长模板中，模型据此输出 Markdown 小节。下列片段为模板中研判原则与风险级别相关行。// src/utils/assistantRegistry.js 第704-713行研判原则：1.关键词命中不等于泄密，必须结合上下文判断，不要机械命中即报高风险2.对常见公开词、泛化称谓、新闻公开语境、教材示例语境，要谨慎降噪，避免误报3.仅依据原文内容作出审慎判断，不要臆测背景、来源、真实单位或法律结论4.对每项风险必须说明：命中片段、风险类别、风险级别、判断依据、建议处理方式5.风险级别统一使用：-高风险：直接出现密级标识、具体部队/单位身份、具体部署计划、未公开内部编号、明确敏感联系人信息等-中风险：出现敏感关键词且上下文指向内部事项，但是否涉密仍需人工确认-低风险或待人工复核：存在可疑词或敏感线索，但公开性、敏感性、上下文不足，暂不能直接判定6.如果文本未发现明显保密风险，明确写“未发现明显保密风险”3.

LOCAL_SENSITIVE_PATTERNS：不经过大模型的本地正则补强:开源免费的WPS AI 软件察元AI文档助手

相关文章：

LOCAL_SENSITIVE_PATTERNS：不经过大模型的本地正则补强:开源免费的WPS AI 软件察元AI文档助手

开发者效率工具集claw：从Unix哲学到现代开发工作流集成

与拼写检查 JSON 路径的差异：为何保密检查走 Markdown 摘要链:开源免费的WPS AI 软件察元AI文档助手

35岁程序员亲历：AI时代如何避免踩坑？收藏这份避坑指南，小白也能看懂大模型！

Graph-CoT：图神经网络结合思维链，实现复杂图结构推理

避坑指南：Tina Linux下MIPI DSI与LVDS屏调试的那些‘坑’（以V853/D1s为例）

别再为OpenMV串口传图卡顿发愁了！手把手教你选对硬件（STM32 SWD vs TTL）并优化代码

避坑指南：为什么你的Realsense D435i视频流用VLC/EasyPlayer打不开？RTSP回传思翼MK15E的正确姿势

光子量子计算编译优化技术与自适应框架设计

【BUUCTF】【WEB】ReadlezPHP

从码农到技术总监：10年程序员的职业进化史

多智能体时代，Workflow 为什么开始失效？

选择智能体框架：LangChain、AutoGen、CrewAI、Dify对比

别让你的AI模型‘偏心’：用Python实战解决机器学习公平性问题（附代码）

防火门禁用行为管控及消防实用管理细则

NotebookLM能源知识图谱构建全链路（从PDF文献到可推理决策引擎）

NotebookLM审稿回复效率提升300%：用结构化Prompt工程重构Response框架（含可直接导入的Notion模板）

别再手动算q值了！用Excel地理探测器软件包，5分钟搞定空间分异分析

本地部署dify的Excel提取器出现以下问题：Error extracting from Excel workbook: Request URL is missing an ‘http://’ or

深度可分离CNN量化优化：PROM方法解析

Spring AI + Ollama 深度实战：从 RAG 问答到 Graph Agent 全流程指南

基于MCP协议为Gemini模型构建安全可控的外部工具链

别被“逻辑“吓退了，入门级数字化认证根本不需要你是学霸

Sora-FullStack全栈开发框架：构建AI视频生成应用的工程实践

实测对比：百度OCR车牌识别在夜间、侧拍、模糊场景下的效果到底怎么样？

Java OCR实战：精准提取与解析身份证信息

中美Agent生态的路径差异——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读三

Linux依赖冲突回溯生产排障流程

SKNet核心机制解析与PyTorch实战：从Split-Fuse-Select到完整网络构建

NotebookLM智能摘要失效真相（92%用户正在误用的3类文档结构）