当前位置: 首页 > article >正文

图文全对竟是假新闻!CVPR2026 开源方案识破 AI 伪造陷阱

本文约2000字建议阅读5分钟 本文介绍了 AI 多模态伪造陷阱、MDSM 数据集及 AMD 检测框架。AI 换脸、AI 造谣早已无孔不入一张篡改的图片、一段 AI 大模型写的通顺文案就能造出一条以假乱真的新闻搅动舆论、误导公众可现有检测系统却常常“视而不见”问题核心在于当前的假新闻检测技术像个只会找“图文错别字”的新手——它只认图文不匹配的低级伪造却对 AI 大模型打造的语义严丝合缝、逻辑毫无破绽的高欺骗性假内容彻底束手无策。政客换脸伪造的现场新闻、名人表情篡改搭配的虚假声明、真实画面搭配 AI 大模型编造的误导叙事…… 这些关键场景的识别与拦截正是多模态内容安全的“最后一公里”痛点。现有技术对此力不从心急需能识破“一致性陷阱”的新一代智能检测方案。西安交通大学、合肥工业大学和澳门大学的研究团队在 CVPR 2026 上提出从数据集构建到跨模态建模的全流程解决方案。论文、代码、数据集已全部开源立即探索多模态内容安全新范式论文名称The Coherence Trap: When MLLM-Crafted Narratives Exploit Manipulated Visual Contexts论文链接https://arxiv.org/abs/2505.17476代码 数据集https://github.com/YcZhangSing/AMD1、新挑战AI 大模型带来的「一致性陷阱」传统检测失灵不止找图文不匹配更要识破「看起来全对实则全假」的完美骗局〓 新挑战——图文一致的伪造右与传统的图文错位的伪造左的⽐较传统方案把视觉篡改和文本编辑拆成两个独立步骤造出来的假内容满是图文错位的破绽普通人都能一眼看穿上图左。而真实世界的恶意攻击早已用上了更隐蔽的套路先精准篡改图像再用 AI 大模型生成和篡改画面完全对齐、语境通顺的虚假叙事彻底抹平所有显性破绽上图右。这种“一致性陷阱”直接戳中了现有研究的两大致命短板低估 AI 大模型的欺骗风险主流方案只针对规则化的文本篡改完全忽视了 AI 大模型能生成高连贯、高迷惑性虚假内容的能力对新型攻击毫无防备与真实场景严重脱节现有数据集大多是人工制造的图文不匹配样本欺骗性极低训练出的模型在真实攻防中完全“水土不服”。2、44万图文基准MDSM 数据集发布还原真实世界的 AI 假新闻〓 新基准——大模型驱动的多模态伪造数据集MDSM与现有数据集的综合比较规模空前包含超 44.1 万高质量图文对源数据覆盖《卫报》《纽约时报》等五大主流媒体是目前多模态伪造检测领域规模最大的基准数据集。高度语义对齐业界首个全量样本实现图文语义完全对齐的基准完美复刻真实攻击场景检测难度指数级提升彻底告别“过家家”式的低难度训练。场景真实全面涵盖人脸换脸、属性篡改、文本伪造等 5 类核心伪造类型同时支持虚假内容检测、伪造类型识别、篡改区域定位三大核心任务。〓 大模型驱动的多模态伪造数据集MDSM的构建流程〓 大模型驱动的多模态伪造数据集MDSM的数据统计3、「伪影捕手」AMD 框架一眼看穿 AI 大模型的伪造套路〓 操纵诊断模型 (AMD) 的框架概述看懂“伪影”辨真假创新设计伪影预感知编码机制给模型装上“伪造雷达”专门捕捉篡改内容留下的隐性痕迹在保留海量世界知识的同时注入极强的伪造感知能力。“双路找茬”精准定位采用面向伪造的推理模块双分支交叉捕捉视觉、文本双模态的伪造线索同时精准定位图像中的篡改区域实现“是否造假哪里造假造了什么假”的端到端全流程识别。轻量化高效率仅用 0.27B 参数量就实现了超百亿级通用大模型的检测效果兼顾顶尖性能与极快推理速度极具风控场景应用落地潜力。4、实验结果性能全面领跑 SOTA效果惊艳核心性能拉满如表 2 所示在 MDSM 跨域测试中AMD 实现平均 88.18% ACC、60.25 mAP、61.02 mIoU 的顶尖成绩全面碾压 ViLT、HAMMER、FKA-Owl 等现有 SOTA 方案通用大模型集体失灵GPT-4o、Gemini 2.0、Qwen3-VL 等通用大模型在该场景下零样本检测效果几乎失效进一步印证了 AMD 的针对性优势超强泛化能力如表 3 所示在跨数据集 DGM4 测试中AMD 依然拿下平均 74.47% ACC 的最优成绩适配各类伪造场景落地性拉满小参数高性能如表 4 所示仅 0.27B 参数量在 RTX 4090 上推理速度可达 13.38 pairs/s兼顾精度与效率。5、为什么这很重要内容安全全面升级为社交媒体风控、新闻真实性核验、舆情防控等场景装上 “AI 假新闻识别引擎”精准拦截 AI 时代的高欺骗性虚假信息筑牢数字内容安全防线。行业研究破局拐点首次系统性揭示了 AI 驱动的一致性伪造风险填补了该领域的研究空白MDSM 数据集更是解决了长期以来“数据与真实场景脱节”的核心瓶颈推动整个领域的技术迭代。落地效率倍增轻量化、端到端的统一架构无需复杂的多模块组合即可实现全维度的伪造检测大幅降低产业落地门槛让 AI 内容安全技术真正能用、好用。编辑于腾凯校对龚力关于我们数据派THU作为数据科学类公众号背靠清华大学大数据研究中心分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识努力建设数据人才聚集平台、打造中国大数据最强集团军。新浪微博数据派THU微信视频号数据派THU今日头条数据派THU

相关文章:

图文全对竟是假新闻!CVPR2026 开源方案识破 AI 伪造陷阱

本文约2000字,建议阅读5分钟 本文介绍了 AI 多模态伪造陷阱、MDSM 数据集及 AMD 检测框架。AI 换脸、AI 造谣早已无孔不入,一张篡改的图片、一段 AI 大模型写的通顺文案,就能造出一条以假乱真的新闻,搅动舆论、误导公众&#xff0…...

开源工具赋能旧设备:使用OpenCore Legacy Patcher实现Mac系统升级

开源工具赋能旧设备:使用OpenCore Legacy Patcher实现Mac系统升级 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 价值呈现:旧Mac设备的重生之旅 …...

.NET反编译神器ILSpy:免费开源工具完整使用教程与实战指南

.NET反编译神器ILSpy:免费开源工具完整使用教程与实战指南 【免费下载链接】ILSpy .NET Decompiler with support for PDB generation, ReadyToRun, Metadata (&more) - cross-platform! 项目地址: https://gitcode.com/gh_mirrors/il/ILSpy 你是否曾经遇…...

从零构建Twitter数据应用:掌握Tweepy库的核心能力

从零构建Twitter数据应用:掌握Tweepy库的核心能力 【免费下载链接】tweepy tweepy/tweepy: Tweepy 是一个 Python 库,用于访问 Twitter API,使得在 Python 应用程序中集成 Twitter 功能变得容易。 项目地址: https://gitcode.com/gh_mirror…...

SPIRAN ART SUMMONER基础教程:本地化部署中PyTorch CUDA版本兼容性避坑

SPIRAN ART SUMMONER基础教程:本地化部署中PyTorch CUDA版本兼容性避坑 想在自己的电脑上搭建一个充满《最终幻想10》幻光虫氛围的AI艺术创作平台吗?SPIRAN ART SUMMONER确实很酷,但很多朋友在第一步——本地部署时,就卡在了PyTo…...

【华为OD机试真题】堆内存申请 · 堆内存最佳分配(C语言)

一、真题题目描述:有一个总空间为100字节的堆,现要从中申请一块内存,内存分配原则为:优先紧接着前一块已使用内存,分配空间足够且最接近申请大小的空闲内存。输入描述:第1行是1个整数,表示期望申…...

春秋云境CVE-2013-2251

1.阅读靶场介绍 这里得到的有用信息是Apache Struts 2.启动靶场 如下所示 3.poc 尝试在路径后构造.action的url 这里我试出来的是 https://eci-2ze7xm2tms3a876w7wv3.cloudeci1.ichunqiu.com:8080/index.action 发现能正常使用 下一步启动天狐工具箱(想要的请…...

UniApp多环境配置实战:Vite插件实现微信/支付宝小程序动态切换

UniApp多环境配置实战:Vite插件实现动态切换的工程化方案 在跨平台小程序开发中,经常遇到需要为不同客户定制不同版本的需求。每次手动修改配置不仅效率低下,还容易出错。本文将分享一套基于Vite插件的自动化解决方案,实现UniApp项…...

COMSOL三次谐波与光学仿真:探索光学性能与电磁场相互作用

comsol三次谐波仿真,光学仿真最近在折腾非线性光学仿真的时候,第三次被三次谐波生成的问题卡脖子了。COMSOL这玩意儿就像个傲娇的猫主子,参数调不对分分钟给你摆烂。今天就跟大伙唠唠怎么用波动方程模块驯服这个磨人的小妖精。先打开电磁波频…...

Socket.IO vs WebSocket:如何为你的项目选择最佳实时通信方案?

Socket.IO与WebSocket深度对比:从技术本质到选型决策 实时通信技术已经成为现代Web应用的标配能力,但面对琳琅满目的技术方案,开发者常常陷入选择困境。当项目需要实现聊天室、实时数据看板或多人在线协作等功能时,Socket.IO和原生…...

原神智能助手BetterGI:自动化游戏体验创新方案

原神智能助手BetterGI:自动化游戏体验创新方案 【免费下载链接】better-genshin-impact 🍨BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动派遣 | 一键强化 - UI Automation Testing Tools For Genshi…...

结合aibiye爱毕业等8款AI工具,论文写作与程序开发效率显著提高,AI技术为毕业设计提供智能化支持

文章总结表格(工具排名对比) 工具名称 核心优势 aibiye 精准降AIGC率检测,适配知网/维普等平台 aicheck 专注文本AI痕迹识别,优化人类表达风格 askpaper 快速降AI痕迹,保留学术规范 秒篇 高效处理混AIGC内容&…...

leetcode 困难题 耗时100内存100 1483. Kth Ancestor of a Tree Node 树节点的第 K 个祖先

Problem: 1483. Kth Ancestor of a Tree Node 树节点的第 K 个祖先 耗时100%,内存100%,parent列表里面都不是叶子节点,用状态数组标记非叶子节点,对所有叶子节点,用数组tmp记录当前叶子节点到根节点0的路径&#xff0c…...

GinCdn内容分发系统V1.0.3更新内容

GinCdn内容分发系统GinCdn是一款基于Go语言Gin框架自研的轻量高效内容分发系统,专为中小型企业/个人搭建CDN打造。依托Go高性能特性,采用主控边缘节点分布式架构,实现智能调度、高效缓存、精准监控的一体化解决方案。无需复杂命令行&#xff…...

3分钟激活微信消息自动转发:零门槛配置实现跨群智能流转

3分钟激活微信消息自动转发:零门槛配置实现跨群智能流转 【免费下载链接】wechat-forwarding 在微信群之间转发消息 项目地址: https://gitcode.com/gh_mirrors/we/wechat-forwarding 在信息爆炸的今天,微信群消息的高效管理成为团队协作的关键。…...

解锁声音魔法:Voice Changer创意应用全攻略

解锁声音魔法:Voice Changer创意应用全攻略 【免费下载链接】voice-changer リアルタイムボイスチェンジャー Realtime Voice Changer 项目地址: https://gitcode.com/gh_mirrors/vo/voice-changer 在数字创意领域,实时语音变换技术正成为内容创作…...

LFM2.5-1.2B-Thinking-GGUF部署案例:Docker Compose编排+GPU显存隔离实践

LFM2.5-1.2B-Thinking-GGUF部署案例:Docker Compose编排GPU显存隔离实践 1. 平台简介 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型,特别适合在资源有限的环境中快速部署。该镜像内置了GGUF模型文件和llama.cpp运行时,提…...

LFM2.5-1.2B-Thinking-GGUF保姆级教程:max_tokens=512防空响应设置法

LFM2.5-1.2B-Thinking-GGUF保姆级教程:max_tokens512防空响应设置法 1. 模型简介 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型,专为低资源环境优化设计。这个1.2B参数的模型采用GGUF格式,配合llama.cpp运行时&#xff0…...

TOGAF企业架构师认证:从入门到精通的全景指南

1. TOGAF认证的核心价值与职业红利 第一次接触TOGAF是在2015年参与某银行系统改造项目时,甲方架构团队全员佩戴着TOGAF徽章。当时作为开发负责人的我,深刻感受到这套方法论在大型企业转型中的实际威力——它让原本混乱的需求讨论变得条理清晰。如今八年过…...

因果推断利器:用Stata实战断点回归(RDD)的政策效应评估

1. 断点回归:政策评估的黄金标准 第一次接触断点回归(RDD)是在评估某地助学金政策时。当地教育局规定:家庭人均收入低于1200元的学生自动获得助学金。这个明确的"分数线"让我意识到,这简直就是天然的实验设计——就像在实验室里随…...

OpenClaw本地模型省钱方案:GLM-4.7-Flash自部署与API调用对比

OpenClaw本地模型省钱方案:GLM-4.7-Flash自部署与API调用对比 1. 为什么需要关注OpenClaw的模型成本? 当我第一次用OpenClaw自动整理电脑上的2000多份PDF文献时,第二天查看账单发现消耗了价值37元的API Token——这还只是单次任务。作为长期…...

OpCore Simplify:开源智能配置工具重塑黑苹果EFI生成体验

OpCore Simplify:开源智能配置工具重塑黑苹果EFI生成体验 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 黑苹果配置过程中,硬…...

KeySim:如何通过3D虚拟设计打造你的梦想键盘?

KeySim:如何通过3D虚拟设计打造你的梦想键盘? 【免费下载链接】keysim design and test virtual 3d keyboards. 项目地址: https://gitcode.com/gh_mirrors/ke/keysim 在键盘爱好者的世界里,每一款键盘都是个性与功能的完美结合&#…...

Qwen3.5-4B-Claude-Opus入门指南:理解‘Opus-Reasoning-Distilled’命名含义

Qwen3.5-4B-Claude-Opus入门指南:理解Opus-Reasoning-Distilled命名含义 1. 模型概述 Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF是一个基于Qwen3.5-4B的推理蒸馏模型,特别强化了结构化分析、分步骤回答、代码与逻辑类问题的处理能力。这个…...

Agent-S深度解析:首个超越人类性能的智能体框架实战指南

Agent-S深度解析:首个超越人类性能的智能体框架实战指南 【免费下载链接】Agent-S Agent S: an open agentic framework that uses computers like a human 项目地址: https://gitcode.com/GitHub_Trending/ag/Agent-S Agent-S作为开源智能体框架&#xff0c…...

Beyond Compare在Ubuntu/Debian上的终极配置指南:过期处理+菜单修复

Beyond Compare在Ubuntu/Debian上的深度配置与疑难排解 作为一款强大的文件对比工具,Beyond Compare在Linux环境下常遇到两个高频问题:许可证过期提示和右键菜单缺失。本文将深入解析问题根源,并提供多种解决方案,同时分享一些提升…...

123页PPT华为IPD流程体系建设与运营方案:流程体系、指标体系、卓越运营、业务转型与数字化、流程管理、流程成熟度评估模型

华为IPD流程体系建设与运营方案》是华为流程管理体系建设的全景式指南,系统阐述了华为如何以IPD(集成产品开发)为核心,构建端到端的流程体系、指标体系、卓越运营机制、流程型组织与数字化转型体系,支撑其全球业务高速…...

微信小程序人脸核身功能避坑指南:从申请到调用的完整流程

微信小程序人脸核身功能深度解析:从资质审核到性能优化的全链路实践 在数字化身份验证领域,人脸核身技术已成为中小企业和独立开发者构建安全认证体系的首选方案。微信小程序提供的wx.startFacialRecognitionVerify接口,将公安部权威数据源与…...

LabVIEW新手必看:NI-DAQmx驱动安装全攻略(2021/2022版通用)

LabVIEW数据采集实战:NI-DAQmx驱动安装与版本适配指南 刚接触LabVIEW的工程师们,是否曾被数据采集项目的硬件驱动问题困扰?作为NI生态的核心组件,NI-DAQmx驱动的正确安装直接决定了后续数据采集的稳定性和功能完整性。不同于普通…...

Phi-3-mini-128k-instruct面试模拟器:基于Java八股文题库的实战应用

Phi-3-mini-128k-instruct面试模拟器:基于Java八股文题库的实战应用 最近跟几个做Java开发的朋友聊天,发现大家都有个共同的烦恼:面试准备太痛苦了。网上的八股文题库动辄几百上千道,自己看吧,枯燥又记不住&#xff1…...