当前位置：首页 > news >正文

内容安全复习 7 - 对抗攻击与防御

news 2026/2/10 1:02:48

文章目录

概述
攻击
- 对抗性攻击的目的
- 攻击的损失函数
- 如何攻击
- FGSM
- 黑盒与白盒
- 真实世界的攻击
防御
- 被动防御
- 主动防御

概述

动机
（1）不仅要在实验室中部署机器学习分类器，也要在现实世界中部署；实际应用
（2）分类器对噪声具有鲁棒性和在“大多数情况下”有效是不够的。
（3）想要鲁棒的分类器用来对付用户愚弄分类器的输入；面对人类的恶意
（4）特别适用于垃圾邮件分类、恶意软件检测、网络入侵检测等。
攻击 AI

上图描述了一些攻击 AI 的方式以及后果。
（1）对抗攻击会导致破坏模型完整性；
（2）漏洞挖掘和利用会导致破坏模型可用性；
（3）模型萃取和数据窃取会导致破坏模型机密性。
逃逸攻击
指攻击者在不改变目标机器学习系统的情况下，通过构造特定输入样本以完成欺骗目标系统的攻击
投毒攻击
攻击者通过篡改训练数据或添加恶意数据来影响模型训练过程,最终降低其在预测阶段的准确性。

攻击

对抗性攻击的目的

对抗性攻击的目的是通过在原始图像中添加人眼无法察觉的扰动，使得模型的预测结果出错。

攻击的损失函数

在这里插入图片描述

训练损失： $L_{train}(\theta)=C(y^0,y^{true})$ 。这个公式表示训练神经网络的损失函数，其中 $y^0$ 是神经网络对原始输入 $x^0$ 的输出， $y^{true}$ 是该输入的真实标签例如，猫。 $C$ 衡量 $y^0$ 和 $y^{true}$ 之间的差异。
无目标攻击损失： $L(x')=-C(y',y^{true})$ 。在这种情况下， $y^{'}$ 是对 $x^{'}$ 的输出。无目标攻击的目的是使 $y^{'}$ 偏离 $y^{true}$ ，即使预测与真实标签差异增大。因此我们取负的 $C$ ，最大化估计差异。
有目标攻击损失： $L(x')=-C(y',y^{true})+C(y',y^{false})$ 。有目标攻击的目的是使 $y^{'}$ 更接近一个错误的估计 $y^{false}$ ，不同与无目标，有目标攻击多了“目的地”例如，把猫的图片分类为鱼。第一项 $C(y',y^{true})$ 希望输出值远离真实标签、第二项 $C(y',y^{false})$ 希望输出接近错误标签。
约束： $d(x^0, x') \le \epsilon$ 。具体如下图，右上角展示了 $x^{'}$ 和 $x^0$ 之间的距离 $\Delta x$ 。图中下方展示了两种衡量距离的方法。 $L 2 -$ 范数和 $L-\infty$ 范数。

如何攻击

就像训练一个神经网络，但是网络参数 $\theta$ 被 $x^{'}$ 替代。
在这里插入图片描述

$x^*=arg \min_{d(x^0, x') \le \epsilon} L(x')$ ，这个公式指：在约束条件下 $d(x^0, x') \le \epsilon$ 原始输入与扰动图像之间的距离不超过ϵ下，找到使 $L (x^{'})$ 最小的 $x^{'}$ 。
由此可以看出，在对抗性攻击种，我们的目标是：希望生成一个扰动图像，在这个扰动图像接近原始图像且满足约束条件的前提下，最小化损失。最小化损失L(x')在上面的有目标攻击和无目标攻击中，都体现为C更大，即更加偏离真实标签，攻击的效果越好。
下方展示了 $fix(x^t)$ 中距离的计算方法。

FGSM

FGSM 全称 Fast Gradient Sign Method，快速梯度逐步算法。
在这里插入图片描述

黑盒与白盒

在前面的攻击中，我们固定网络参数 $\theta$ 而寻找最优的输入 $x^{'}$ 。如果攻击时，我们需要知道 $\theta$ ，那么这就叫做白盒攻击。
白盒攻击需要 $\theta$ ，那么如果我们不公布（绝大多数 API 都不提供网络参数），是否安全呢？
不会，因为存在黑盒攻击。
在黑盒攻击中：
（1）如果我们有目标网络的训练数据，可以使用这些数据训练一个代理网络 (proxy network)。这个代理网络模仿目标网络的行为，攻击者可以在代理网络上进行对抗样本生成，然后将这些对抗样本应用于目标网络。用目标的网络数据生成网络，在网络上模拟，然后在模拟网络上生成AE（对抗性样例）。
（2）如果我们没有目标网络的训练数据，则需要获取一些目标网络的输入和预测输出，以此来构建代理网络，然后进行和训练数据生成代理网络后一样的攻击。和（1）的区别就是，是用目标网络的输入和预测输出生成的代理网络。

真实世界的攻击

单像素攻击

防御

对抗性攻击无法通过正则化，dropout 和模型集成来防御。

防御可以分为两种：主动防御和被动防御。

被动防御

在不修改模型的情况下找到攻击图像。

去噪
除非对手不知道去噪的存在，否则还是可能受到白盒攻击。
随机化
（1）如果攻击者不知道随机化存在，则效果最佳；
（2）如果知道，由于随机模式过多，防御依然有效。
梯度掩码/隐藏
治标不治本，本质是提高了攻击者搞清楚弱点的难度，模型本身稳定性并未提高。

主动防御

训练一个对对抗性攻击具有鲁棒性的模型。

对抗训练
这种方法对训练目标算法 A 有效，但对未被训练的目标算法 B 无效。
防御性蒸馏
（1）通过梯度生成的对抗性样例攻击性降低；
（2）随蒸馏温度提升，对抗性样例生成困难，提升模型鲁棒性；
（3）对黑盒攻击无能为力；
（4）仅适用于基于概率分布的 DNN 模型。

内容安全复习 7 - 对抗攻击与防御

文章目录概述攻击对抗性攻击的目的攻击的损失函数如何攻击FGSM黑盒与白盒真实世界的攻击防御被动防御主动防御概述动机 （1）不仅要在实验室中部署机器学习分类器，也要在现实世界中部署；实际应用 （2）分类…...

编程日记 2024/6/26 16:07:40

淘宝店铺商家订单API-接入ERP，多平台订单同步的利器

淘宝开放平台给商家们提供了丰富的API，以方便大家扩展业务流程。但是需要调用这些API，商家们要提交资质审核，审核条件也是很严格的。第三方数据公司的存在可以为大家解决这个问题。 custom-自定义API操作请求参数请求参数：ap…...

编程日记 2024/6/26 16:06:39

【微前端-Single-SPA、qiankun的基本原理和使用】

背景在实际项目中，随着日常跌倒导致的必然墒增，项目会越来越冗余不好维护，而且有时候一个项目会使用的其他团队的功能，这种跨团队不好维护和管理等等问题，所以基于解决这些问题，出现了微前端的解决方案。…...

编程日记 2024/6/26 16:05:38

多元化功能空间，打造影像产业生态圈

国际数字影像产业园的多元化功能空间定位涵盖了从产业实训、研发创新、资产交易、集群发展到孵化服务、大数据支持、产学研合作以及人力资源服务等多个方面，旨在为数字影像产业提供全方位的支持和服务，推动产业的升级和发展。 1、产业实训空间&#xff1…...

编程日记 2024/6/26 16:04:36

华为鸿蒙正式杀入工业自动化，反攻开始了！

导语大家好，我是社长，老K。专注分享智能制造和智能仓储物流等内容。新书《智能物流系统构成与技术实践》在近日举行的2024华为开发者大会上，华龙讯达与华为共同发布了基于鸿蒙内核技术的“HualongOS 华龙工业操作系统”，这一里…...

编程日记 2024/6/26 16:03:35

学历优先还是专业优先？高考志愿填报的抉择

学历优先还是专业优先？高考志愿填报的抉择 2024年高考帷幕落下，新一轮的思考与选择悄然来临。对于每一位高考考生，选择学校和专业是开启大学新生活的两个前置必选项。然而，有时候“鱼与熊掌不可兼得”，在分数受限的情…...

编程日记 2024/6/26 16:02:34

1. 导入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId> </dependency> 2. 核心通知 package com.example.aspect;import lombok.SneakyThrows; import org.aspectj.l…...

编程日记 2024/6/26 16:01:32

Java基础的重点知识-04-封装

文章目录面向对象思想封装面向对象思想在计算机程序设计过程中，参照现实中事物，将事物的属性特征、行为特征抽象出来，描述成计算机事件的设计思想。面向对象思想的三大基本特征: 封装、继承、多态 1.类和对象类是对象的抽象&#xff…...

编程日记 2024/6/26 16:00:31

win7 的 vmware tools 安装失败

没有安装vmware tools的系统屏幕显示异常。桌面是比较小的图像，四周是黑边在 vmware 软件里方法1，下补丁 https://www.catalog.update.microsoft.com/Search.aspx?qkb4474419 方法2，使用老版vm tools http://softwareupdate.vmware.com/c…...

编程日记 2024/6/26 15:59:30

【杂记-浅谈OSPF协议之IR、ABR、ASBR、BR】

OSPF协议之IR、ABR、ASBR、BR 一、内部路由器 IR二、骨干路由器 BR三、边界路由器 ABR四、自治系统边界路由器 ASBR 一、内部路由器 IR 概念 IR，Internal Router，即内部路由器，指的是所有接口都属于同一个OSPF区域的路由器。这类路由器只维…...

编程日记 2024/6/26 15:58:27

element 问题整合

没关系，凡事发生必有利于我文章目录一、el-table 同级数据对齐及展开图标的位置问题二、el-table 勾选框为圆角及只能勾选一个一、el-table 同级数据对齐及展开图标的位置问题 element 官方提供的扩展tree型数据在表格里默认是靠左边对齐，项目需求需要…...

编程日记 2024/6/26 15:57:26

Linux下vi文件的时候替换指定的内容

需要将nginx.conf中的192.168.222.188，替换为178.21.120.225 操作步骤： 1、vi 文件 vi nginx.conf2、输入 :%s/192.168.222.188/178.21.120.225/g3、最后保存 :wq...

编程日记 2024/6/26 15:56:25

【知识学习】阐述Unity3D中MaterialTexture的概念及使用方法示例

在Unity3D中，Material和Texture是渲染过程中非常重要的两个概念，它们共同工作以实现丰富的视觉效果。 Material Material是Unity中的一个组件，用于定义物体表面的视觉属性。一个Material可以包含多种属性，如颜色、纹理、反射率等…...

编程日记 2024/6/26 15:55:23

java创建0byte的空文件

在Java中，使用File类创建一个文件通常不会自动创建一个0字节的文件，它只是用来表示文件系统中的一个文件或目录。如果你想要创建一个0字节的文件，你需要使用FileOutputStream来写入文件。以下是创建一个0字节文件的示例代码： imp…...

编程日记 2024/6/26 15:54:22

Qt 实战（6）事件 | 6.2、事件过滤器

文章目录一、事件过滤器1、什么是事件过滤器？2、如何实现事件过滤器？3、应用示例4、总结前言： 在Qt的事件处理机制中，事件过滤器（Event Filter）是一种非常强大且灵活的工具，它允许开发者在一个…...

编程日记 2024/6/26 15:53:20

【PyTorch】【机器学习】图片张量、通道分解合成和裁剪

一、导入所需库 from PIL import Image import torch import numpy as np import matplotlib.pyplot as plt二、读取图片 pic np.array(Image.open(venice-boat.jpg))上述代码解释：先用Image.open()方法读取jpg格式图片，再用np.array()方法将图片转成…...

编程日记 2024/6/26 15:52:19

如何提高工业交换机的电源功耗？

工业交换机的电源功耗是指在工作状态下所消耗的能量。随着工业自动化技术的发展，工业交换机在生产和制造领域中扮演着至关重要的角色。它们通过连接各种设备和系统，实现信息的传输和处理，提高生产效率和质量。然而，工业交换机的大…...

编程日记 2024/6/26 15:50:16

源站静态文件更新后，CDN会自动刷新吗

源站静态文件更新后，CDN不会自动刷新缓存，而是在缓存时间过期后，才会经由用户触发回源获取最新文件。如希望在缓存过期时间之前，实现CDN节点与源站静态文件同步更新，则需要通过CDN控制台-【刷新预取】菜单，…...

编程日记 2024/6/26 15:49:16

Token的应用场景

JWT JWT由三部分组成：头部（Header）、有效载荷（Payload）和签名（Signature）头部通常指定了Token的类型和使用的哈希算法；有效载荷包含了一系列的声明，例如用户的ID、Token…...

编程日记 2024/6/26 15:48:14

机器学习课程复习——奇异值分解

1. 三种奇异值分解奇异值分解（Singular Value Decomposition, SVD）包含了： 完全奇异值分解（Complete Singular Value Decomposition, CSVD）紧奇异值分解（Tight Singular Value Decomposition, TSVD&…...

编程日记 2024/6/26 15:47:13

简易版抽奖活动的设计技术方案

1.前言本技术方案旨在设计一套完整且可靠的抽奖活动逻辑，确保抽奖活动能够公平、公正、公开地进行，同时满足高并发访问、数据安全存储与高效处理等需求，为用户提供流畅的抽奖体验，助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

编程新知 2026/2/7 17:41:40

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2026/1/24 14:59:08

Python爬虫实战：研究feedparser库相关技术

1. 引言 1.1 研究背景与意义在当今信息爆炸的时代，互联网上存在着海量的信息资源。RSS（Really Simple Syndication）作为一种标准化的信息聚合技术，被广泛用于网站内容的发布和订阅。通过 RSS，用户可以方便地获取网站更新的内容，而无需频繁访问各个网站。然而，互联网…...

编程新知 2025/8/18 9:54:31

ETLCloud可能遇到的问题有哪些？常见坑位解析

数据集成平台ETLCloud，主要用于支持数据的抽取（Extract）、转换（Transform）和加载（Load）过程。提供了一个简洁直观的界面，以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

编程新知 2026/2/3 12:56:31

Psychopy音频的使用

Psychopy音频的使用本文主要解决以下问题： 指定音频引擎与设备；播放音频文件本文所使用的环境： Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...

编程新知 2026/1/31 15:09:31