当前位置: 首页 > article >正文

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强:开源免费的WPS AI 软件 察元AI文档助手

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强摘要本文围绕标题所述主题,结合本仓库当前源码行进行说明。仅供技术理解与内部培训,不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。正文0. 结论先行结论先行:保密检查由内置助手触发大模型按模板输出审查意见,程序再从摘要中抽取命中片段并尝试挂批注。长文档依赖分块与结构化 JSON 提示。下文每节先说明要点,紧接着给出仓库中的对应源码片段。本篇标题:LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强1. 助手标识与默认写回方式保密检查对应内置助手 id 为 analysis.security-check。下列片段展示其在注册表中的默认动作与输入来源等字段,便于与界面行为对照。// src/utils/assistantRegistry.js 第653-667行{id:'analysis.security-check',label:'保密检查',shortLabel:'保密检查',group:'analysis',modelType:'chat',defaultModelCategory:'chat',supportsRibbon:true,defaultDisplayLocations:['ribbon-main'],allowedActions:['comment','link-comment','insert','append','none'],defaultAction:'link-comment',defaultOutputFormat:'markdown',defaultInputSource:INPUT_SOURCE_DOCUMENT,description:'基于关键词和上下文检查文档中的涉密、涉军、单位名称、密级标识和敏感业务信息风险。',2. 研判原则写入提示词模板研判原则与风险级别枚举写在 userPromptTemplate 的长模板中,模型据此输出 Markdown 小节。下列片段为模板中研判原则与风险级别相关行。// src/utils/assistantRegistry.js 第704-713行研判原则:1.关键词命中不等于泄密,必须结合上下文判断,不要机械命中即报高风险2.对常见公开词、泛化称谓、新闻公开语境、教材示例语境,要谨慎降噪,避免误报3.仅依据原文内容作出审慎判断,不要臆测背景、来源、真实单位或法律结论4.对每项风险必须说明:命中片段、风险类别、风险级别、判断依据、建议处理方式5.风险级别统一使用:-高风险:直接出现密级标识、具体部队/单位身份、具体部署计划、未公开内部编号、明确敏感联系人信息等-中风险:出现敏感关键词且上下文指向内部事项,但是否涉密仍需人工确认-低风险或待人工复核:存在可疑词或敏感线索,但公开性、敏感性、上下文不足,暂不能直接判定6.如果文本未发现明显保密风险,明确写“未发现明显保密风险”3.

相关文章:

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强:开源免费的WPS AI 软件 察元AI文档助手

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强 摘要 本文围绕标题所述主题,结合本仓库当前源码行进行说明。仅供技术理解与内部培训,不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。 正文 0. 结论先行 结论先行:保密检查由内置助手…...

开发者效率工具集claw:从Unix哲学到现代开发工作流集成

1. 项目概述:一个为开发者打造的“瑞士军刀”式工具集最近在GitHub上闲逛,发现了一个名为opsyhq/claw的项目,它的名字和图标(一个爪子)一下子就抓住了我的眼球。点进去一看,简介很简单:“A coll…...

与拼写检查 JSON 路径的差异:为何保密检查走 Markdown 摘要链:开源免费的WPS AI 软件 察元AI文档助手

与拼写检查 JSON 路径的差异:为何保密检查走 Markdown 摘要链 摘要 本文围绕标题所述主题,结合本仓库当前源码行进行说明。仅供技术理解与内部培训,不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。 正文 0. 结论先行 结论先行:保密检查由内…...

35岁程序员亲历:AI时代如何避免踩坑?收藏这份避坑指南,小白也能看懂大模型!

作者作为一名有十多年经验的程序员,分享了自己在AI快速发展背景下,利用GPT Pro和Deep Research进行产品调研的经历。文章指出,仅依靠AI工具并不足以成功,更重要的是要找到真实的市场痛点和需求。作者通过实际案例分析了纯工具类、…...

Graph-CoT:图神经网络结合思维链,实现复杂图结构推理

1. 项目概述:当图神经网络遇上思维链推理最近在复现和优化一些图相关的推理任务时,我反复遇到了一个瓶颈:传统的图神经网络模型在处理需要多步逻辑推理的问题时,比如社交网络中的影响力传播预测、知识图谱上的复杂问答&#xff0c…...

避坑指南:Tina Linux下MIPI DSI与LVDS屏调试的那些‘坑’(以V853/D1s为例)

Tina Linux下MIPI DSI与LVDS屏调试实战避坑指南(V853/D1s开发板为例) 1. 高速差分接口调试的"死亡陷阱" 当V853开发板首次连接那块7英寸MIPI屏时,我遭遇了职业生涯最诡异的显示故障——屏幕上半部正常显示,下半部却呈现…...

别再为OpenMV串口传图卡顿发愁了!手把手教你选对硬件(STM32 SWD vs TTL)并优化代码

OpenMV串口传图性能优化实战:从硬件选型到代码调优 当你在实验室调试OpenMV串口传图项目时,是否经历过这样的场景:图像传输像老式拨号上网一样缓慢,帧率低得让人怀疑人生,调试界面卡成PPT?这背后往往隐藏着…...

避坑指南:为什么你的Realsense D435i视频流用VLC/EasyPlayer打不开?RTSP回传思翼MK15E的正确姿势

深度解析:Realsense D435i视频流RTSP传输的兼容性陷阱与实战解决方案 当你在无人机项目中尝试通过RTSP协议传输Realsense D435i的实时视频流时,是否遇到过VLC或EasyPlayer无法正常播放的困扰?这种看似简单的视频流传输背后,隐藏着…...

光子量子计算编译优化技术与自适应框架设计

1. 光子量子计算编译技术概述光子量子计算作为量子计算的重要实现路径之一,其独特的室温运行特性和优异的光子传输性能使其在分布式量子计算领域具有天然优势。在测量基量子计算(MBQC)范式中,量子计算过程被转化为对特定纠缠态&am…...

【BUUCTF】【WEB】ReadlezPHP

考点:打开题目,发现页面有点阴森:右键没有任何反应,那就右上角三个点:更多工具->开发者工具OK没有任何线索,那就用bp看看。拉倒最下面,发现右下角一个文件./time.php?source这可能是一个线索…...

从码农到技术总监:10年程序员的职业进化史

一、初入职场:在代码与bug中蹒跚学步2016年的夏天,我背着双肩包,攥着毕业证,走进了一家中型软件公司的大门,成为了一名Java开发程序员,也就是别人口中的“码农”。那时候,我的生活被代码和bug填…...

多智能体时代,Workflow 为什么开始失效?

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…...

选择智能体框架:LangChain、AutoGen、CrewAI、Dify对比

去年秋天,我们团队准备上一个新项目,一个可以为客户自动生成月度运营分析报告的智能体。需求不复杂,就是每周从数据库里拉点数据,跑一下趋势分析,最后产出一个带图表和结论的PDF。 我那时候刚花了三个月时间把LangCha…...

别让你的AI模型‘偏心’:用Python实战解决机器学习公平性问题(附代码)

别让你的AI模型‘偏心’:用Python实战解决机器学习公平性问题(附代码) 在信贷审批系统中,女性申请者的通过率比男性低23%;在招聘算法中,35岁以上候选人的简历筛选通过率骤降40%——这些真实案例揭示了一个残…...

防火门禁用行为管控及消防实用管理细则

第一章 总则第一条 制定目的为严格规范防火门日常使用、巡查、维护、管控工作,杜绝违规封堵、常开、损坏、挪用等禁用行为,落实消防安全主体责任,保障疏散通道、安全出口畅通,防范火灾蔓延扩散,依据《建筑设计防火规范…...

NotebookLM能源知识图谱构建全链路(从PDF文献到可推理决策引擎)

更多请点击: https://kaifayun.com 第一章:NotebookLM能源知识图谱构建全链路(从PDF文献到可推理决策引擎) NotebookLM 作为 Google 推出的面向研究者的 AI 原生笔记工具,其核心能力在于对用户上传文档进行语义理解与…...

NotebookLM审稿回复效率提升300%:用结构化Prompt工程重构Response框架(含可直接导入的Notion模板)

更多请点击: https://intelliparadigm.com 第一章:NotebookLM审稿意见回复的范式变革 从线性批注到语义驱动的协同迭代 NotebookLM 不再将审稿意见视为静态文本批注,而是将其作为结构化知识图谱的输入节点。当用户上传论文 PDF 与审稿人意见…...

别再手动算q值了!用Excel地理探测器软件包,5分钟搞定空间分异分析

别再手动算q值了!用Excel地理探测器软件包,5分钟搞定空间分异分析 地理空间数据分析中,识别变量间的分异特征和驱动因子一直是研究难点。传统方法依赖复杂公式推导和编程实现,让许多研究者望而却步。而地理探测器(Geod…...

本地部署dify的Excel提取器出现以下问题:Error extracting from Excel workbook: Request URL is missing an ‘http://’ or

本地部署dify的Excel提取器出现以下问题:An error occurred in the samanhappy/excel_process/excel_process, please contact the author of samanhappy/excel_process/excel_process for help, error type: Exception, error details: Error extracting from Exce…...

深度可分离CNN量化优化:PROM方法解析

1. 深度可分离CNN量化现状与挑战 在移动端和边缘计算场景中,卷积神经网络(CNN)的部署面临两大核心矛盾:模型精度与计算资源之间的权衡,以及理论计算量与实际硬件效率的差距。传统量化方法通常采用"一刀切"策略,对所有卷…...

Spring AI + Ollama 深度实战:从 RAG 问答到 Graph Agent 全流程指南

场景 Spring AI RAG 检索增强生成:概念、实战与完整代码: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/161055108 基于上面的基础,实现Graph工作流编排的简单示例。 大语言模型(LLM)在实际应用中面…...

基于MCP协议为Gemini模型构建安全可控的外部工具链

1. 项目概述:当MCP遇上Gemini,一个AI代理的“瑞士军刀”诞生了如果你最近在折腾AI Agent(智能体)或者RAG(检索增强生成)应用,大概率听说过“Model Context Protocol”,也就是MCP。简…...

别被“逻辑“吓退了,入门级数字化认证根本不需要你是学霸

很多人一听到“数字化认证”“AI考试”“逻辑题”,脑子里立刻浮现两种画面:一种是数学特别强的人在刷题,另一种是自己看不懂专业词,直接劝退。可真到企业实习、岗位转型、项目落地时你会发现,职场需要的往往不是“学霸…...

Sora-FullStack全栈开发框架:构建AI视频生成应用的工程实践

1. 项目概述:一个全栈式Sora应用开发框架的诞生最近在AI视频生成领域,Sora的横空出世无疑点燃了无数开发者和创业者的热情。但兴奋过后,一个现实问题摆在眼前:如何将Sora这类前沿模型的能力,真正落地成一个稳定、可用、…...

实测对比:百度OCR车牌识别在夜间、侧拍、模糊场景下的效果到底怎么样?

百度OCR车牌识别实战评测:夜间、侧拍与模糊场景下的真实表现 当停车场道闸自动抬起,交通卡口违章记录自动生成,这些看似简单的场景背后都依赖一项关键技术——车牌识别。作为计算机视觉领域的经典应用,车牌识别技术已经从实验室走…...

Java OCR实战:精准提取与解析身份证信息

1. 为什么选择Java OCR处理身份证信息? 在企业级应用开发中,身份证信息录入是个高频需求场景。传统人工录入不仅效率低下,还容易出错。我去年参与过一个政务系统改造项目,工作人员每天要处理300张身份证照片,手动录入的…...

中美Agent生态的路径差异——《重构与崛起——OpenClaw时代的中国Agent产业生态报告》解读三

易观分析:面对OpenClaw掀起的全球AI Agent技术浪潮,中美两国走出截然不同的发展路径。美国生态追求底层框架与协议的原创定义;而中国生态以应用驱动、平台绑定和合规先行为核心逻辑,快速将前沿技术转化为可落地的商业现实。这两条…...

Linux依赖冲突回溯生产排障流程

Linux依赖冲突回溯生产排障流程这是一篇面向中级 Linux 使用者的技术文章,主题聚焦在依赖冲突回溯,重点讨论库版本关系、安装失败和升级影响。在真实生产环境中,依赖冲突回溯相关问题往往不会以单一错误形式出现,而是混杂在日志、…...

SKNet核心机制解析与PyTorch实战:从Split-Fuse-Select到完整网络构建

1. SKNet核心机制解析:从Split-Fuse-Select到多尺度特征融合 SKNet(Selective Kernel Networks)是CVPR 2019提出的创新性网络结构,它在传统卷积神经网络的基础上引入了动态选择机制。这个机制的核心在于让网络能够自适应地选择不同…...

NotebookLM智能摘要失效真相(92%用户正在误用的3类文档结构)

更多请点击: https://intelliparadigm.com 第一章:NotebookLM智能摘要失效的底层归因 NotebookLM 的智能摘要功能在部分场景下出现静默失效(即无报错但输出空摘要或重复原文),其根本原因并非模型能力退化,…...