当前位置: 首页 > news >正文

全网招募P图高手!阿里巴巴持续训练鉴假AI

P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。

为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶会ICDAR在天池平台举办截图篡改检测比赛,并开辟“寻找全网最厉害的P图高手”特别赛道,以此完善假图检测算法模型,提升假图检测准确率。

华中科技大学电子信息与通信学院副教授周瑜指出,证件信息、截屏信息等都是易受到恶意篡改的主要对象,对个人、社会产生了严重的安全威胁。被篡改的图片真假难辨,给业界提出了一个困难而意义重大的研究任务。

图说:“寻找全网最厉害的P图高手”特别赛道部分玩法介绍

生活场景中的痛点是这个比赛十分看重的。为此,阿里高级安全专家渡明介绍:“特别赛道旨在降低技术迭代的参与门槛,提高趣味性,并为专业赛道提供丰富的样本,因此我们将投稿比赛图片分为截图区、证件区和其他区,希望更贴近真实生活中可能遇到的P图诈骗场景,让训练AI的样本更真实,从而提升它的识别能力。”

华中科技大学电子信息与通信学院副教授周瑜则认为,与企业合作,从真实应用中提炼关键问题,并将问题融入到竞赛中,可以让贴近真实的篡改样本为学术界和工业界提供帮助,推动图像鉴伪技术的研究与应用。

对于想体验鉴假技术的大众,比赛开放“假图粉碎机”公众体验入口:通过上传一张图,让AI识别图像是否被篡改,并以热力图形式呈现识别可能被篡改的区域结果。

“假图粉碎机”是由阿里安全与澳门大学的研究人员研发,在2022年6月推出的技术,旨在提升网民的网络安全意识,包含了多项图像篡改检测技术。

据介绍,图像篡改检测技术对图像进行全方位的分析和统计,根据不同图像像素区域的特性,分析图像中各个区域是否被压缩、重采样、引入新特征像素等,通过对比分析,标记不同图像区域的差异点,从而找出图像被篡改的部分。

整套图像篡改检测系统会经过原图识别、内容篡改检测和内容篡改定位三个步骤,完成对图像是否为篡改图像以及哪里经过篡改的识别和判断。

在原图识别阶段,图像篡改检测系统会对图像的文件信息进行原始性判断。图像的修改与传输往往会在头文件信息上留下痕迹,因此进行原图识别的第一步需要对图像的头文件信息进行原始性判断。

例如图像头文件中存储着各类时间信息表,原始图像中的时间信息基本一致,而经过PS等软件篡改图像的时间信息可能出现矛盾,由此可以判断出图像在拍摄之后是否经过修改;此外部分非原始图像会出现实际尺寸与头文件记录尺寸不一致的情况,某些重压缩(图像修改之后通常会经过转存重压)会改变图像实际宽高,而有时头文件所记录的宽高并未进行修改,导致图像头文件中的尺寸信息矛盾。

在内容篡改检测阶段,图像篡改检测系统会对图像内容层面上有无经过修改进行检测。例如可以通过对图像的压缩特性、重采样痕迹进行检测,追溯图像的压缩另存历史和估计图像的缩放因子。

例如,图像修改或者转存都会使JPG图像经过二次压缩,通过检测图像是否有二次压缩痕迹即可判断图像是否经过修改或转存。二次压缩痕迹肉眼难以发现,而二次压缩的DCT系数,由于前后两次量化系数的差异,直方图会呈现的周期性变化。需要通过提取图像中的DCT系数统计特性,对二次压缩进行学习和分类。

图说:从左到右依次为原图、二次压缩图像、二次压缩DCT系数统计特性

另外,图像篡改检测系统还可以对图像局部物体边缘一致性和内容连续性进行统计分析,判断图像中的内容有无经过修改。

在内容篡改定位阶段,通过上一阶段的判断,图像篡改检测系统结合端到端的AI算法对图像内容和特征进行分析,进一步标记出图像哪些区域经过修改。

不同于原图识别,图像内容篡改检测和定位需要具有较高的鲁棒性。在实际场景中,进行内容篡改的操作往往五花八门,包括马赛克、区域拼接、复制-粘贴、擦除、添加文字等。需要检测的图像类型也多种多样,包括资质、证件、软件截图、商品图、门脸图等各类图像。此外图像篡改定位还需要在图像经过全局的后处理之后仍能将图像的内容改动检测出来。常见的后处理操作包括裁剪、缩放、重压缩、模糊、滤波、翻拍等。针对不同篡改操作,检测的手段也有所不同。以下是抹除类型的篡改示例。

以抹除篡改为例,图像抹除的区域通常会经过平滑处理,因此对篡改图像各个区域进行平滑特征提取,再通过像素变化的幅度、梯度等特征进行分析,以确定图像哪些区域存在篡改。常见的技术手段包括基于传统的图像处理方法检测,如差分、模板匹配、边缘检测等,以及基于深度学习的方法,如卷积神经网络(CNN)。其中,深度学习方法因其能够自动学习特征并适应多种篡改类型而备受关注。

图说:抹除文字类型篡改示例

图像篡改检测技术在当今数字化时代具有重要的应用价值。通过对图像内容层面、局部物体边缘一致性和内容连续性的检测分析,以及结合端到端的AI算法进行内容篡改定位,可以有效地识别和定位图像是否被篡改,保障图像内容的真实性和可信度。随着技术的不断发展和应用场景的不断扩大,图像篡改检测技术将持续优化和完善,为各行各业提供更加精准和可靠的图像信息防伪和篡改检测识别服务。

渡明表示,好技术一定要沿着社会真实需求出发,聚焦真问题,解决真问题。借助这样一场比赛,将参赛样本与比赛产生的优秀检测算法模型一起吸收进来改进算法,有助于帮助解决社会真实场景面临的问题。他强调:“打造负责任的好科技是阿里巴巴科技伦理治理的重要目标。”

附比赛地址:假图粉碎机挑战赛 (aliyun.com)

相关文章:

全网招募P图高手!阿里巴巴持续训练鉴假AI

P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。 为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶…...

webrtc QOS笔记一 Neteq直方图算法浅读

webrtc QOS笔记一 Neteq直方图算法浅读 文章目录webrtc QOS笔记一 Neteq直方图算法浅读Histogram Algorithm获取目标延迟遗忘因子曲线Histogram Algorithm DelayManager::Update()->Histogram::Add() 会根据计算的iat_packet(inter arrival times, 实际包间间隔 / 打包时长…...

细分和切入点

本文重点介绍做SEO网站细分和切入点的方法:当我们的行业和关键词竞争性比较大的时候,我们可以考虑对行业或者产品做细分,从而找到切入点。可以按照以下三个方面进行细分。1、按城市细分例如:A:餐饮培训,当前…...

iOS创建Universal Link

iOS 9之前,一直使用的是URL Schemes技术来从外部对App进行跳转,但是iOS系统中进行URL Schemes跳转的时候如果没有安装App,会提示无法打开页面的提示。 iOS 9之后起可以使用Universal Links技术进行跳转页面,这是一种体验更加完美的…...

RuoYi-Vue搭建(若依)

项目简介 RuoYi-Vue基于SpringBootVue前后端分离的Java快速开发框架1.前端采用Vue、Element UI2.后端采用Spring Boot、Spring Security、Redis & Jwt3.权限认证使用Jwt,支持多终端认证系统4.支持加载动态权限菜单,多方式轻松权限控制5.高效率开发&a…...

进程组和用处

进程组:一个或多个进程的集合,进程组id是一个正整数。组长进程:进程组id 进程id组长进程可以创建一个进程组,创建该进程组的进程,终止了,只要进程组有一个进程存在,进程组就存在,与…...

Nacos集群+Nginx负载均衡

搭建Nacos集群 注意: 3个或3个以上Nacos节点才能构成集群。要求服务器内存分配最好大于6G以上(如果不够则需修改nacos启动脚本中的默认内存配置)根据nacos自带的mysql建库脚本建立对应数据库(/conf/nacos-mysql.sql)如果是三台服…...

TypeScript 学习之类型兼容

TypeScript 的类型兼容性是基于结构子类型的。 结构类型是一种只使用其成员来描述类型的方式。 interface Named {name: string; }class Person {name: string; }let p: Named; p new Person();// 赋值成功,因为都是结构类型,只要Person 类型的包含 Nam…...

Linux软件管理RPM

目录 前言 RPM软件管理程序:rpm RPM默认安装的路径 PRM讲解前准备工作 RPM安装(install) RPM查询(query) RPM卸载(erase) RPM升级与更新(upgrade/freshen) RPM重…...

01背包问题

背包问题的递归解决过程如下: 第一步明确思路 在解决问题之前,为描述方便,首先定义一些变量:Vi表示第 i 个物品的价值,Wi表示第 i 个物品的体积,定义V(i,j):当前背包容量 j,前 i 个…...

14_FreeRTOS二值信号量

目录 信号量的简介 队列与信号量的对比 二值信号量 二值信号量相关API函数 实验源码 信号量的简介 信号量是一种解决同步问题的机制,可以实现对共享资源的有序访问。 假设有一个人需要在停车场停车 1.首先判断停车场是否还有空车位(判断信号量是否有资源) 2.停车场正好…...

JavaScript随手笔记---轮播图(点击切换)

💌 所属专栏:【JavaScript随手笔记】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! &#…...

机器人学 markdown数学公式常用语法

参考链接1 本文包含了markdown常用的数学公式,按照目录可查询选用 初始类 行内数学公式均用两个符号包裹行间数学公式均用两个符号包裹 行间数学公式均用两个符号包裹行间数学公式均用两个符号包裹,用于表示重要的、需在行间单独列出的公式 $行内数学…...

如何使用 Python 语言来编码和解码 JSON 对象

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。 JSON 函数 使用 JSON 函数需要导入 json 库:import json。 函数 描述 json.dumps 将 Python 对象编码成 JSON 字符串 json.loads 将已编码的 JSON 字符串解码为 Pyth…...

【蓝桥云课】求正整数的约数个数

一、求正整数n的约数个数 方法一(常用算法):从1到n逐一判断其能否整除n,若能整除n即为n的约数,否则不是n的约数。 方法二:从1到n\sqrt{n}n​逐一判断是否为n的约数,当n\sqrt{n}n​为n的约数时,个数加1&…...

刷题记录: wannafly25 E 牛客NC19469 01串 [线段树维护动态dp]

传送门:牛客 题目描述: Bieber拥有一个长度为n的01 串,他每次会选出这个串的一个子串作为曲谱唱歌,考虑该子串从左 往右读所组成的二进制数P。 Bieber每一秒歌唱可以让P增加或减少 2 的 k次方(k由Bieber选 定),但必须…...

懂九转大肠的微软New Bing 内测申请教程

最近微软的New Bing开放内测了,网上已经有拿到内测资格的大佬们对比了ChatGPT和New Bing。对比结果是New Bing比ChatGPT更强大。来看看具体对比例子吧 1.时效性更强 ChatGPT的库比较老,跟不上时事,比如你问它九转大肠的梗,ChatG…...

WRAN翻译

基于小波的图像超分辨残差注意力网络 Wavelet-based residual attention network for image super-resolution 代码: https://github.com/xueshengke/WRANSR-keras 摘要: 图像超分辨率技术是图像处理和计算机视觉领域的一项基础技术。近年来&#xff0c…...

ROS学习笔记——第二章 ROS通信机制

主要跟着[1]学习ros::Rate r(1); //错误,应改为ros::Rate r(10);[2]对Topic通信打的比方很形象,便于理解记忆。[3]有整个过程的图片,对于初学者更加友好[4]对发布者的代码注释非常好,方便进一步学习此外CMake官方文档可以查询相关…...

MacOS Pytorch 机器学习环境搭建

学习 Pytorch ,首先要搭建好环境,这里将采用 Anoconda Pytorch PyCharm 来一起构建 Pytorch 学习环境。 1. Anoconda 安装与环境创建 Anoconda 官方介绍:提供了在一台机器上执行 Python/R 数据科学和机器学习的最简单方法。 为什么最简单…...

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中,时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志,到供应链系统的物流节点时间戳,时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库,其日期时间类型的…...

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践

6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...

OpenLayers 分屏对比(地图联动)

注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能,和卷帘图层不一样的是,分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

Web 架构之 CDN 加速原理与落地实践

文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

初学 pytest 记录

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

【Android】Android 开发 ADB 常用指令

查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...

【 java 虚拟机知识 第一篇 】

目录 1.内存模型 1.1.JVM内存模型的介绍 1.2.堆和栈的区别 1.3.栈的存储细节 1.4.堆的部分 1.5.程序计数器的作用 1.6.方法区的内容 1.7.字符串池 1.8.引用类型 1.9.内存泄漏与内存溢出 1.10.会出现内存溢出的结构 1.内存模型 1.1.JVM内存模型的介绍 内存模型主要分…...

【Linux】Linux安装并配置RabbitMQ

目录 1. 安装 Erlang 2. 安装 RabbitMQ 2.1.添加 RabbitMQ 仓库 2.2.安装 RabbitMQ 3.配置 3.1.启动和管理服务 4. 访问管理界面 5.安装问题 6.修改密码 7.修改端口 7.1.找到文件 7.2.修改文件 1. 安装 Erlang 由于 RabbitMQ 是用 Erlang 编写的,需要先安…...

负载均衡器》》LVS、Nginx、HAproxy 区别

虚拟主机 先4,后7...

SQL进阶之旅 Day 22:批处理与游标优化

【SQL进阶之旅 Day 22】批处理与游标优化 文章简述(300字左右) 在数据库开发中,面对大量数据的处理任务时,单条SQL语句往往无法满足性能需求。本篇文章聚焦“批处理与游标优化”,深入探讨如何通过批量操作和游标技术提…...