当前位置: 首页 > news >正文

全网招募P图高手!阿里巴巴持续训练鉴假AI

P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。

为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶会ICDAR在天池平台举办截图篡改检测比赛,并开辟“寻找全网最厉害的P图高手”特别赛道,以此完善假图检测算法模型,提升假图检测准确率。

华中科技大学电子信息与通信学院副教授周瑜指出,证件信息、截屏信息等都是易受到恶意篡改的主要对象,对个人、社会产生了严重的安全威胁。被篡改的图片真假难辨,给业界提出了一个困难而意义重大的研究任务。

图说:“寻找全网最厉害的P图高手”特别赛道部分玩法介绍

生活场景中的痛点是这个比赛十分看重的。为此,阿里高级安全专家渡明介绍:“特别赛道旨在降低技术迭代的参与门槛,提高趣味性,并为专业赛道提供丰富的样本,因此我们将投稿比赛图片分为截图区、证件区和其他区,希望更贴近真实生活中可能遇到的P图诈骗场景,让训练AI的样本更真实,从而提升它的识别能力。”

华中科技大学电子信息与通信学院副教授周瑜则认为,与企业合作,从真实应用中提炼关键问题,并将问题融入到竞赛中,可以让贴近真实的篡改样本为学术界和工业界提供帮助,推动图像鉴伪技术的研究与应用。

对于想体验鉴假技术的大众,比赛开放“假图粉碎机”公众体验入口:通过上传一张图,让AI识别图像是否被篡改,并以热力图形式呈现识别可能被篡改的区域结果。

“假图粉碎机”是由阿里安全与澳门大学的研究人员研发,在2022年6月推出的技术,旨在提升网民的网络安全意识,包含了多项图像篡改检测技术。

据介绍,图像篡改检测技术对图像进行全方位的分析和统计,根据不同图像像素区域的特性,分析图像中各个区域是否被压缩、重采样、引入新特征像素等,通过对比分析,标记不同图像区域的差异点,从而找出图像被篡改的部分。

整套图像篡改检测系统会经过原图识别、内容篡改检测和内容篡改定位三个步骤,完成对图像是否为篡改图像以及哪里经过篡改的识别和判断。

在原图识别阶段,图像篡改检测系统会对图像的文件信息进行原始性判断。图像的修改与传输往往会在头文件信息上留下痕迹,因此进行原图识别的第一步需要对图像的头文件信息进行原始性判断。

例如图像头文件中存储着各类时间信息表,原始图像中的时间信息基本一致,而经过PS等软件篡改图像的时间信息可能出现矛盾,由此可以判断出图像在拍摄之后是否经过修改;此外部分非原始图像会出现实际尺寸与头文件记录尺寸不一致的情况,某些重压缩(图像修改之后通常会经过转存重压)会改变图像实际宽高,而有时头文件所记录的宽高并未进行修改,导致图像头文件中的尺寸信息矛盾。

在内容篡改检测阶段,图像篡改检测系统会对图像内容层面上有无经过修改进行检测。例如可以通过对图像的压缩特性、重采样痕迹进行检测,追溯图像的压缩另存历史和估计图像的缩放因子。

例如,图像修改或者转存都会使JPG图像经过二次压缩,通过检测图像是否有二次压缩痕迹即可判断图像是否经过修改或转存。二次压缩痕迹肉眼难以发现,而二次压缩的DCT系数,由于前后两次量化系数的差异,直方图会呈现的周期性变化。需要通过提取图像中的DCT系数统计特性,对二次压缩进行学习和分类。

图说:从左到右依次为原图、二次压缩图像、二次压缩DCT系数统计特性

另外,图像篡改检测系统还可以对图像局部物体边缘一致性和内容连续性进行统计分析,判断图像中的内容有无经过修改。

在内容篡改定位阶段,通过上一阶段的判断,图像篡改检测系统结合端到端的AI算法对图像内容和特征进行分析,进一步标记出图像哪些区域经过修改。

不同于原图识别,图像内容篡改检测和定位需要具有较高的鲁棒性。在实际场景中,进行内容篡改的操作往往五花八门,包括马赛克、区域拼接、复制-粘贴、擦除、添加文字等。需要检测的图像类型也多种多样,包括资质、证件、软件截图、商品图、门脸图等各类图像。此外图像篡改定位还需要在图像经过全局的后处理之后仍能将图像的内容改动检测出来。常见的后处理操作包括裁剪、缩放、重压缩、模糊、滤波、翻拍等。针对不同篡改操作,检测的手段也有所不同。以下是抹除类型的篡改示例。

以抹除篡改为例,图像抹除的区域通常会经过平滑处理,因此对篡改图像各个区域进行平滑特征提取,再通过像素变化的幅度、梯度等特征进行分析,以确定图像哪些区域存在篡改。常见的技术手段包括基于传统的图像处理方法检测,如差分、模板匹配、边缘检测等,以及基于深度学习的方法,如卷积神经网络(CNN)。其中,深度学习方法因其能够自动学习特征并适应多种篡改类型而备受关注。

图说:抹除文字类型篡改示例

图像篡改检测技术在当今数字化时代具有重要的应用价值。通过对图像内容层面、局部物体边缘一致性和内容连续性的检测分析,以及结合端到端的AI算法进行内容篡改定位,可以有效地识别和定位图像是否被篡改,保障图像内容的真实性和可信度。随着技术的不断发展和应用场景的不断扩大,图像篡改检测技术将持续优化和完善,为各行各业提供更加精准和可靠的图像信息防伪和篡改检测识别服务。

渡明表示,好技术一定要沿着社会真实需求出发,聚焦真问题,解决真问题。借助这样一场比赛,将参赛样本与比赛产生的优秀检测算法模型一起吸收进来改进算法,有助于帮助解决社会真实场景面临的问题。他强调:“打造负责任的好科技是阿里巴巴科技伦理治理的重要目标。”

附比赛地址:假图粉碎机挑战赛 (aliyun.com)

相关文章:

全网招募P图高手!阿里巴巴持续训练鉴假AI

P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。 为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶…...

webrtc QOS笔记一 Neteq直方图算法浅读

webrtc QOS笔记一 Neteq直方图算法浅读 文章目录webrtc QOS笔记一 Neteq直方图算法浅读Histogram Algorithm获取目标延迟遗忘因子曲线Histogram Algorithm DelayManager::Update()->Histogram::Add() 会根据计算的iat_packet(inter arrival times, 实际包间间隔 / 打包时长…...

细分和切入点

本文重点介绍做SEO网站细分和切入点的方法:当我们的行业和关键词竞争性比较大的时候,我们可以考虑对行业或者产品做细分,从而找到切入点。可以按照以下三个方面进行细分。1、按城市细分例如:A:餐饮培训,当前…...

iOS创建Universal Link

iOS 9之前,一直使用的是URL Schemes技术来从外部对App进行跳转,但是iOS系统中进行URL Schemes跳转的时候如果没有安装App,会提示无法打开页面的提示。 iOS 9之后起可以使用Universal Links技术进行跳转页面,这是一种体验更加完美的…...

RuoYi-Vue搭建(若依)

项目简介 RuoYi-Vue基于SpringBootVue前后端分离的Java快速开发框架1.前端采用Vue、Element UI2.后端采用Spring Boot、Spring Security、Redis & Jwt3.权限认证使用Jwt,支持多终端认证系统4.支持加载动态权限菜单,多方式轻松权限控制5.高效率开发&a…...

进程组和用处

进程组:一个或多个进程的集合,进程组id是一个正整数。组长进程:进程组id 进程id组长进程可以创建一个进程组,创建该进程组的进程,终止了,只要进程组有一个进程存在,进程组就存在,与…...

Nacos集群+Nginx负载均衡

搭建Nacos集群 注意: 3个或3个以上Nacos节点才能构成集群。要求服务器内存分配最好大于6G以上(如果不够则需修改nacos启动脚本中的默认内存配置)根据nacos自带的mysql建库脚本建立对应数据库(/conf/nacos-mysql.sql)如果是三台服…...

TypeScript 学习之类型兼容

TypeScript 的类型兼容性是基于结构子类型的。 结构类型是一种只使用其成员来描述类型的方式。 interface Named {name: string; }class Person {name: string; }let p: Named; p new Person();// 赋值成功,因为都是结构类型,只要Person 类型的包含 Nam…...

Linux软件管理RPM

目录 前言 RPM软件管理程序:rpm RPM默认安装的路径 PRM讲解前准备工作 RPM安装(install) RPM查询(query) RPM卸载(erase) RPM升级与更新(upgrade/freshen) RPM重…...

01背包问题

背包问题的递归解决过程如下: 第一步明确思路 在解决问题之前,为描述方便,首先定义一些变量:Vi表示第 i 个物品的价值,Wi表示第 i 个物品的体积,定义V(i,j):当前背包容量 j,前 i 个…...

14_FreeRTOS二值信号量

目录 信号量的简介 队列与信号量的对比 二值信号量 二值信号量相关API函数 实验源码 信号量的简介 信号量是一种解决同步问题的机制,可以实现对共享资源的有序访问。 假设有一个人需要在停车场停车 1.首先判断停车场是否还有空车位(判断信号量是否有资源) 2.停车场正好…...

JavaScript随手笔记---轮播图(点击切换)

💌 所属专栏:【JavaScript随手笔记】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! &#…...

机器人学 markdown数学公式常用语法

参考链接1 本文包含了markdown常用的数学公式,按照目录可查询选用 初始类 行内数学公式均用两个符号包裹行间数学公式均用两个符号包裹 行间数学公式均用两个符号包裹行间数学公式均用两个符号包裹,用于表示重要的、需在行间单独列出的公式 $行内数学…...

如何使用 Python 语言来编码和解码 JSON 对象

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。 JSON 函数 使用 JSON 函数需要导入 json 库:import json。 函数 描述 json.dumps 将 Python 对象编码成 JSON 字符串 json.loads 将已编码的 JSON 字符串解码为 Pyth…...

【蓝桥云课】求正整数的约数个数

一、求正整数n的约数个数 方法一(常用算法):从1到n逐一判断其能否整除n,若能整除n即为n的约数,否则不是n的约数。 方法二:从1到n\sqrt{n}n​逐一判断是否为n的约数,当n\sqrt{n}n​为n的约数时,个数加1&…...

刷题记录: wannafly25 E 牛客NC19469 01串 [线段树维护动态dp]

传送门:牛客 题目描述: Bieber拥有一个长度为n的01 串,他每次会选出这个串的一个子串作为曲谱唱歌,考虑该子串从左 往右读所组成的二进制数P。 Bieber每一秒歌唱可以让P增加或减少 2 的 k次方(k由Bieber选 定),但必须…...

懂九转大肠的微软New Bing 内测申请教程

最近微软的New Bing开放内测了,网上已经有拿到内测资格的大佬们对比了ChatGPT和New Bing。对比结果是New Bing比ChatGPT更强大。来看看具体对比例子吧 1.时效性更强 ChatGPT的库比较老,跟不上时事,比如你问它九转大肠的梗,ChatG…...

WRAN翻译

基于小波的图像超分辨残差注意力网络 Wavelet-based residual attention network for image super-resolution 代码: https://github.com/xueshengke/WRANSR-keras 摘要: 图像超分辨率技术是图像处理和计算机视觉领域的一项基础技术。近年来&#xff0c…...

ROS学习笔记——第二章 ROS通信机制

主要跟着[1]学习ros::Rate r(1); //错误,应改为ros::Rate r(10);[2]对Topic通信打的比方很形象,便于理解记忆。[3]有整个过程的图片,对于初学者更加友好[4]对发布者的代码注释非常好,方便进一步学习此外CMake官方文档可以查询相关…...

MacOS Pytorch 机器学习环境搭建

学习 Pytorch ,首先要搭建好环境,这里将采用 Anoconda Pytorch PyCharm 来一起构建 Pytorch 学习环境。 1. Anoconda 安装与环境创建 Anoconda 官方介绍:提供了在一台机器上执行 Python/R 数据科学和机器学习的最简单方法。 为什么最简单…...

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分: 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析: CTR…...

循环冗余码校验CRC码 算法步骤+详细实例计算

通信过程:(白话解释) 我们将原始待发送的消息称为 M M M,依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)(意思就是 G ( x ) G(x) G(x) 是已知的)&#xff0…...

Day131 | 灵神 | 回溯算法 | 子集型 子集

Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣(LeetCode) 思路: 笔者写过很多次这道题了,不想写题解了,大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

前端导出带有合并单元格的列表

// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放

简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...

深入解析C++中的extern关键字:跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析:跨文件编程的终极指南 📅 更新时间:2025年6月5日 🏷️ 标签:C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录 前言🔥一、extern 是什么?&…...

基于Springboot+Vue的办公管理系统

角色: 管理员、员工 技术: 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能: 该办公管理系统是一个综合性的企业内部管理平台,旨在提升企业运营效率和员工管理水…...

【从零开始学习JVM | 第四篇】类加载器和双亲委派机制(高频面试题)

前言: 双亲委派机制对于面试这块来说非常重要,在实际开发中也是经常遇见需要打破双亲委派的需求,今天我们一起来探索一下什么是双亲委派机制,在此之前我们先介绍一下类的加载器。 目录 ​编辑 前言: 类加载器 1. …...

WebRTC调研

WebRTC是什么,为什么,如何使用 WebRTC有什么优势 WebRTC Architecture Amazon KVS WebRTC 其它厂商WebRTC 海康门禁WebRTC 海康门禁其他界面整理 威视通WebRTC 局域网 Google浏览器 Microsoft Edge 公网 RTSP RTMP NVR ONVIF SIP SRT WebRTC协…...

JDK 17 序列化是怎么回事

如何序列化?其实很简单,就是根据每个类型,用工厂类调用。逐个完成。 没什么漂亮的代码,只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...