当前位置: 首页 > article >正文

一直怕大模型幻觉,发现针对性harness约束能大大消除

我让AI写长文然后人工审核发现大量胡编乱造。如果人工一个个消除实在太累了这就不是LLM自动化办公的路子了尝试了 harness (engineering)的实操路子 试用发现大模型正在把长文中我人工审核发现的幻觉问题一点点列出来原来它自己可以发现这些——虽然仍然不完整但终于明白了啥叫 Harness Engineering以及如何实施。但是对于长上下文、复杂案例想通过这种方式彻底消除hallucination这种当前transfomer算法LLM的固有特性似乎是难度极高、近乎不可能的。所以人工审核仍然是必不可少环节。正确实施的harness engineering手段看起来主要优势在于可以大大减少人工审核的工作强度。importosimportreimportjsonimportsysclassLegalVerifier:def__init__(self,evidence_path,db_path,draft_path):self.evidence_pathevidence_path self.db_pathdb_path self.draft_pathdraft_path# 加载数据withopen(evidence_path,r,encodingutf-8)asf:self.evidence_textf.read()withopen(db_path,r,encodingutf-8)asf:self.law_dbjson.load(f)self.draft_textifos.path.exists(draft_path):withopen(draft_path,r,encodingutf-8)asf:self.draft_textf.read()defverify_step_1_fact_mapping(self):第一步校验事实锚定检查。检查草稿中是否有无中生有的数字/日期errors[]# 抽取草稿中所有的金额和日期最容易产生幻觉的地方money_exprsre.findall(r(\d万[元||]?|\d分|\d元),self.draft_text)date_exprsre.findall(r(\d{4}年\d月\d日),self.draft_text)formoneyinmoney_exprs:ifmoneynotinself.evidence_text:errors.append(f【事实幻觉】文书出现了金额 {money}但该金额未在原始证据材料中记载)fordateindate_exprs:ifdatenotinself.evidence_text:errors.append(f【事实幻觉】文书出现了日期 {date}但该日期未在原始证据材料中记载)returnerrorsdefverify_step_2_mcp_law_check(self):第二步校验模拟 MCP 确定性法条与类案校验errors[]# 匹配文书中的法条格式例如《民法典》第五百六十三条laws_citedre.findall(r《([^》])》第([百十万零一二三四五六七八九\d])[条],self.draft_text)# 匹配文书中的案例号例如(2025)最高法民终123号cases_citedre.findall(r?\(\d{4}\)[^号]号?,self.draft_text)valid_lawsself.law_db.get(laws,{})valid_casesself.law_db.get(cases,[])forlaw,clauseinlaws_cited:iflawnotinvalid_lawsorclausenotinvalid_laws[law]:errors.append(f【法条幻觉】文书引用了未经校验的法条《{law}》第{clause}条请联网或检索确定库。)forcaseincases_cited:clean_casecase.strip(())ifclean_casenotinvalid_cases:errors.append(f【类案幻觉】文书引用了虚构的案例号{case}该案例不存在于受信类案库中。)returnerrorsdefverify_step_3_critic_audit(self):第三步校验反向合规审计。检查是否强制标注了证据来源标记 (见附件/见材料)errors[]linesself.draft_text.split(\n)fori,lineinenumerate(lines):if(原告inlineor被告inline)and(证明inlineor陈述inlineor约定inline):if见notinlineand附件notinlineand证据notinline:errors.append(f【中立与合规审计】第{i1}行事实陈述缺乏物理证据指针违反封闭宇宙原则内容: \{line.strip()}\)returnerrorsdefrun_all_checks(self):print( ⚖️ 开始执行 Trae 法律智能体防御性三步校验 )ifnotself.draft_text:print([AUDIT_FAILED] 错误目标文书草稿为空或不存在。)sys.exit(1)all_errors[]all_errors.extend(self.verify_step_1_fact_mapping())all_errors.extend(self.verify_step_2_mcp_law_check())all_errors.extend(self.verify_step_3_critic_audit())ifall_errors:print(\n[AUDIT_FAILED] 审计未通过发现以下幻觉或违规行为)forerrinall_errors:print(err)print(\n请 Trae Agent 根据上述错误报告重新读取源材料修改文书并再次运行此脚本。)sys.exit(1)else:print(\n[AUDIT_PASSED] 恭喜文书 100% 契合已知事实法条/案例全部真实有效未发现任何幻觉偏离。)sys.exit(0)if__name____main__:verifierLegalVerifier(evidence_pathdata/evidence.txt,db_pathdata/law_database.json,draft_pathoutput/judgment_draft.md)verifier.run_all_checks()

相关文章:

一直怕大模型幻觉,发现针对性harness约束能大大消除

我让AI写长文,然后人工审核,发现大量胡编乱造。 如果人工一个个消除,实在太累了,这就不是LLM自动化办公的路子了 尝试了 harness (engineering)的实操路子, 试用发现: 大模型正在把长文中我人工审核发现的幻…...

Props技术:基于隐私保护预言机的机器学习安全数据管道

1. Props技术:为机器学习解锁深网数据的安全钥匙如果你正在为机器学习项目寻找高质量的训练数据而发愁,或者为如何在应用中安全地处理用户敏感信息而头疼,那么你很可能已经触及了当前AI发展的一个核心痛点:数据瓶颈与信任危机。表…...

Gogs符号链接导致远程命令执行漏洞深度解析

1. 这个漏洞不是“能执行命令”那么简单,而是Gogs在文件系统边界上彻底失守CVE-2024-56731这个编号刚出现在NVD数据库时,我第一反应是点开看PoC——结果发现它连exploit.py都不需要写,一条curl加一个精心构造的.git/config就能让目标服务器执…...

QrazyBox终极指南:专业二维码修复工具拯救你的损坏二维码

QrazyBox终极指南:专业二维码修复工具拯救你的损坏二维码 【免费下载链接】qrazybox QR Code Analysis and Recovery Toolkit 项目地址: https://gitcode.com/gh_mirrors/qr/qrazybox 你是否曾因打印模糊、水渍污染或屏幕划痕导致的重要二维码无法扫描而焦急…...

昇腾CANN ops-nn GELU 激活函数:精确版 vs tanh 近似版,选错就是 3× 慢

GELU(Gaussian Error Linear Unit)是 BERT 的灵魂激活函数,后来被 GPT-2/3 沿用。两种实现:精确版(调用 erf,慢但数学精确)和 tanh 近似版(快但误差 ~0.1%)。BERT 的训练…...

昇腾CANN ops-nn 交叉熵损失的融合优化:从三次 Kernel Launch 到一次

语言模型每一层的损失计算:logits → softmax → log → 取 target 位置的负值。标准做法三次 kernel launch:softmax kernel → log kernel → NLL kernel。三次 HBM 往返,中间存两个 NV 矩阵(V 是词表大小,LLaMA 是 …...

昇腾CANN ops-nn RMSNorm:为什么 LLaMA 和 Mistral 都用它替代 LayerNorm

LayerNorm 做两件事:减均值(center)、除标准差(scale)。RMSNorm 只做一件:除 RMS。丢掉均值减法——省了 30% 计算,训练效果几乎一样。LLaMA、Mistral、Gemma 全系标配。 RMSNorm 的公式&#x…...

昇腾CANN ops-transformer FlashAttention 反向传播:不存 Attention 矩阵怎么求梯度

FlashAttention 前向传播的精髓:不存 NN 的 attention 矩阵,只存 O(N) 的输出和 softmax 归一化因子。反向传播时,需要 attention 矩阵来计算梯度——但矩阵没存。解法:重新算一遍。用额外的计算换显存——这是典型的 compute-for…...

在node js后端服务中集成taotoken实现多模型智能客服响应

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在 Node.js 后端服务中集成 Taotoken 实现多模型智能客服响应 构建一个在线客服系统时,一个核心挑战是如何平衡响应质量…...

通过Taotoken的Token Plan套餐实现项目成本的可预测与精细控制

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过Taotoken的Token Plan套餐实现项目成本的可预测与精细控制 对于有长期、稳定大模型调用需求的团队而言,项目预算的…...

现在停用默认filter_config将导致合规风险!DeepSeek最新CVE-2024-7812漏洞预警及3小时紧急加固方案

更多请点击: https://codechina.net 第一章:DeepSeek敏感信息过滤 DeepSeek系列大模型在企业级部署中,需严格遵循数据安全与隐私合规要求。敏感信息过滤(Sensitive Information Filtering, SIF)是其推理链路中关键的前…...

DeepSeek免费额度怎么用才不浪费?资深MLOps工程师的6小时压测报告与最优请求批处理公式

更多请点击: https://kaifayun.com 第一章:DeepSeek免费额度怎么用才不浪费?资深MLOps工程师的6小时压测报告与最优请求批处理公式 在连续6小时、覆盖12种负载模式的真实压测中,我们发现DeepSeek API免费额度(当前为1…...

DeepSeek监控告警设置实战指南(告警失效率下降92%的7个关键开关)

更多请点击: https://kaifayun.com 第一章:DeepSeek监控告警设置的核心价值与落地挑战 在大模型推理服务规模化部署的背景下,DeepSeek系列模型(如DeepSeek-V2、DeepSeek-Coder)对资源稳定性、延迟敏感性及异常响应时效…...

Google 广告场景下 Uniswap 钓鱼攻击机理与 Web3 防御体系研究

摘要 2026 年 5 月 22 日,GoPlus 安全团队发布预警,针对 Web3 领域头部去中心化交易平台 Uniswap 的搜索引擎钓鱼攻击呈规模化爆发态势。攻击者通过购买 Google Ads 关键词广告,将高仿钓鱼网站置顶于搜索结果前列,结合视觉相似域名…...

人机协同闭环:AI 时代邮件安全 “人在回路” 防御体系研究

摘要 2026 年,生成式 AI 全面渗透网络钓鱼攻击链,攻击从批量群发转向精准定制、从静态模板转向动态逃逸,传统纯技术防护出现显著盲区。数据显示,AI 自动化鱼叉式钓鱼点击率达 54%,攻击从投放至全面入侵的窗口压缩至秒级…...

高校邮件安全体系升级与 Proofpoint 部署实践研究 —— 以特拉华大学为例

摘要:随着网络钓鱼、垃圾邮件与恶意邮件攻击持续威胁高校信息系统,电子邮件安全已成为校园网络防护的核心环节。特拉华大学自 2026 年 6 月 1 日起全面启用 Proofpoint 邮件安全平台,构建覆盖邮件过滤、威胁隔离、用户自助处置与安全运营的全…...

Kali365 设备代码钓鱼攻击机理、危害及防御体系研究

摘要 2026 年 5 月 FBI 发布预警,新型钓鱼即服务平台 Kali365 通过滥用 Microsoft 365 OAuth 2.0 设备代码授权流程,可在不窃取密码、不伪造登录页面的前提下绕过多因素认证,获取长期有效访问令牌,实现账户持久化控制。该平台依托…...

基于 OAuth 设备码流滥用的 Kali365 钓鱼攻击机理与防御体系研究

摘要 2026 年 5 月,美国联邦调查局(FBI)发布安全预警,披露针对 Microsoft 365 环境的 PhaaS 平台 Kali365 正通过滥用 OAuth 设备码认证流程实施规模化钓鱼攻击,可绕过多因素认证(MFA)窃取合法访…...

为什么92%的DeepSeek微调失败?资深架构师拆解3类致命配置错误及实时诊断命令

更多请点击: https://kaifayun.com 第一章:DeepSeek模型微调失败率的行业现状与根本归因 近年来,DeepSeek系列大模型(如DeepSeek-V2、DeepSeek-Coder)在开源社区和企业私有化部署中广泛应用,但实证调研显示…...

【ChatGPT故事化表达黄金法则】:20年AI内容专家亲授3步叙事框架,让提示词转化率提升300%

更多请点击: https://intelliparadigm.com 第一章:ChatGPT故事化表达的底层认知革命 传统人机交互长期受限于指令式范式——用户需精确编码意图,系统则机械匹配关键词或规则。ChatGPT 的突破性不在于参数规模,而在于其将语言建模…...

C++学习笔记26:static 静态成员

目录 一、为什么需要静态成员? 二、静态成员变量 三、静态成员变量需要类外定义 四、用静态成员变量统计对象个数 五、静态成员变量不占对象空间 六、静态成员函数 七、静态成员函数没有 this 指针 八、静态成员函数可以访问静态成员 九、调用方式 1. 通过…...

【限时解锁】Gemini深度研究模式私有化部署方案:仅3家头部科研机构掌握的本地化推理链配置

更多请点击: https://codechina.net 第一章:Gemini深度研究模式的核心原理与能力边界 Gemini深度研究模式并非简单增强上下文长度的推理机制,而是一种面向复杂知识密集型任务的分层式认知架构。其核心原理在于动态构建“问题-证据-推理”三元…...

【Gemini生命周期价值深度解码】:20年AI架构师亲授5大阶段ROI测算模型与避坑指南

更多请点击: https://intelliparadigm.com 第一章:Gemini生命周期价值分析 Gemini 模型的生命周期价值(LTV)不仅体现在其推理性能与多模态能力上,更贯穿于从模型部署、持续微调、监控反馈到迭代升级的完整闭环。相较于…...

【ChatGPT投资人邮件撰写黄金法则】:20年FA/VC顾问亲授——3类高回复率模板+5个致命话术雷区

更多请点击: https://codechina.net 第一章:ChatGPT投资人邮件撰写的核心认知与底层逻辑 投资人邮件不是信息的简单堆砌,而是认知对齐、信任构建与决策催化三重目标的高度凝练表达。其底层逻辑根植于风险投资行业的决策机制——LP关注资金效…...

ChatGPT移动端隐私红线报告(2024Q2):麦克风/剪贴板/位置数据采集路径全曝光,3步彻底锁死敏感权限

更多请点击: https://intelliparadigm.com 第一章:ChatGPT移动端隐私红线报告(2024Q2)核心发现与风险定级 高危数据外泄通道实证 本季度对iOS与Android平台主流ChatGPT客户端(含官方App v6.12.1及第三方封装SDK集成应…...

【小红书算法偏爱的文案结构】:ChatGPT无法自学的3层语义嵌套技巧(含2024Q2平台最新流量权重白皮书节选)

更多请点击: https://kaifayun.com 第一章:小红书算法偏爱的文案结构本质解构 小红书的推荐算法并非仅依赖关键词或标签匹配,其核心是通过多模态语义理解与用户行为反馈闭环,对文案的信息密度、情绪节奏和结构可读性进行加权评估…...

新手注册Taotoken后第一步如何获取并测试API Key

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 新手注册Taotoken后第一步如何获取并测试API Key 注册Taotoken平台后,您已经拥有了一个统一的入口来调用多种大模型。接…...

Taotoken的Token Plan套餐如何帮助初创公司控制AI实验成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken的Token Plan套餐如何帮助初创公司控制AI实验成本 1. 成本不可预测:初创AI实验的常见困境 在产品原型和早期开…...

如何为嵌入式项目配置大模型API调用使用Taotoken与Python

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 如何为嵌入式项目配置大模型API调用使用Taotoken与Python 对于嵌入式或物联网开发者而言,在资源受限的开发环境中集成A…...

创业团队如何利用Taotoken统一管理多个AI应用API成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 创业团队如何利用Taotoken统一管理多个AI应用API成本 对于同时开发多个集成AI功能的初创公司而言,技术选型与快速迭代是…...