【论文阅读】SPARK:针对视觉跟踪的空间感知在线增量攻击
SPARK: Spatial-Aware Online Incremental Attack Against Visual Tracking
introduction
在本文中,我们确定了视觉跟踪对抗性攻击的一个新任务:在线生成难以察觉的扰动,误导跟踪器沿着不正确的(无目标攻击,UA)或指定的轨迹(有针对性的攻击,TA)。为此,我们首先采用现有的攻击方法,即FGSM、BIM和C&W,提出了一种空间感知的基本攻击,并综合分析了攻击性能。我们发现在线对象跟踪带来了两个新的挑战:1)很难生成可以跨帧传输的难以察觉的扰动,2)实时跟踪器要求攻击满足一定的效率水平。为了应对这些挑战,我们进一步提出了空间感知在线增量攻击(SPARK),它在线执行时空稀疏增量扰动,并使对抗性攻击不易被察觉。此外,作为一种基于优化的方法,SPARK通过考虑历史增量扰动,在多次迭代内快速收敛到非常小的损失,使其比基本攻击更加有效。对 OTB100、VOT2018、UAV123 和 LaSOT 上最先进的跟踪器(即 SiamRPN with Alex、MobileNetv2 和 ResNet-50)的深入评估证明了 SPARK 在两种情况下误导跟踪器的有效性和可转移性UA 和 TA 有轻微扰动。
与图像、语音和自然语言处理任务不同,在线目标跟踪对对抗性攻击技术提出了一些新的挑战。 首先,与现有的顺序输入相关任务(例如用于分类的音频 [ 4 ]、自然语言 [ 19 ]或视频 [ 43 ]相比,它们可以访问完整的顺序数据),对象跟踪在其中逐一处理输入帧。令当当前帧t受到攻击,所有先前的帧(即)仍然不可用,也无法立即受到攻击。由于时间数据片段和动态场景变化有限,生成可随时间转移的难以察觉但有效的对抗性扰动(即多个连续帧)更加困难。 此外,对象跟踪通常依赖于从视频的第一帧中裁剪的目标指定对象模板 [ 2 , 24 ]以进行进一步分析。不同的初始指定对象可能会导致不同的跟踪分析,这使得通用对抗性扰动 [ 31 ]通常无效。
此外,在线对象跟踪通常以实时速度运行。因此,它要求攻击足够有效,以便在下一帧到达之前完成当前帧的对抗性扰动。尽管基于梯度下降的方法(例如,FGSM [ 13 ],BIM [ 22 ])被证明可以有效地攻击图像分类器,但当多帧时,它们仍然遇到欺骗最先进的跟踪器的效率问题很快到达。实时攻击多个帧的成本也相当高,即稀疏性 [ 43 ]。
为了更好地理解攻击 VOT 的挑战和独特性,我们首先通过适应用于攻击每个帧的现有最先进的攻击技术(即 FGSM、BIM、C&W),提出了一种空间感知的基本攻击方法单独。我们的实证研究证实,由于实时的连续时间帧,基本攻击对于攻击 VOT 确实无效。在此基础上,我们进一步提出了空间感知在线增量攻击(SPARK)方法,该方法可以在有效性和效率方面产生更多难以察觉的在线扰动。
本文的主要贡献如下:
-
我们将 VOT 的对抗性攻击问题形式化,即在线生成难以察觉的扰动,以误导跟踪对象的视觉跟踪器进入不正确的(非目标攻击,UA)或指定的(目标攻击,TA)轨迹。
-
我们通过调整现有攻击(即 FGSM、BIM、C&W)提出了几种基本攻击,并进一步进行实证研究,以更好地理解对抗性攻击对实时对象跟踪的挑战。
-
我们提出了一种新的空间感知在线增量攻击(SPARK)方法,可以有效地为实时 VOT 生成更多难以察觉的扰动。
-
与基本方法一致,我们的深入评估证明 了SPARK在UA和TA。SPARK 生成的攻击还表现出对 SiamRPN 跟踪器在线更新变体的强大可转移性。
相关工作
与这些作品不同,我们的攻击旨在通过有限的在线数据访问来误导视觉跟踪器,即未来的帧不可用,过去的帧也不能被攻击。在与我们最相关的工作中, [ 43 ]提出了在整个视频数据可用并且多个帧的扰动可以联合调整的情况下,基于范数的攻击生成用于动作识别的稀疏扰动。为了进一步显示差异,我们使用[ 43 ]实现了跟踪攻击,并将其与我们的评估方法进行比较。 [ 25 ]攻击了SiamRPN跟踪器 [ 24 ]中也使用的区域提议网络(RPN) 。然而,这种攻击的重点是欺骗图像检测器来预测不准确的边界框,因此不能直接用于攻击旨在通过在线视频误导错误轨迹的跟踪器。 [ 42 ]提出了通过独立寻址每一帧的视频对象检测攻击,这不适合跟踪器通常以实时速度运行的在线跟踪。另一项相关工作[ 26 ]研究了在强化学习环境中何时攻击代理,并使用对动作的偏好程度来决定关键攻击时间。相比之下,这项工作主要探讨如何利用时间约束在线生成难以察觉的有效扰动来误导实时跟踪器。
据我们所知,到目前为止,关于攻击在线对象跟踪的研究还很有限。 [ 44 ]生成物理对抗纹理,使 GOTURN 跟踪器 [ 17 ]始终错误地跟踪对象。与这项工作不同的是,我们打算对对象跟踪的对抗性攻击进行全面的研究,并提出有效的攻击来误导在线实时跟踪器沿指定的轨迹移动,并产生较小的扰动。由于目标跟踪器通常嵌入在移动控制系统中,因此对 VOT 特定领域对抗问题的深入分析和理解可能是加速实际应用的关键。此外,我们研究的主题模型,即基于SiamRPN 的跟踪器,在各种基准[ 10、45、20 ]上实现了最先进的性能, 并且获得了比 GOTURN 跟踪器更高的精度,因此将更具挑战性攻击时。
https://arxiv.org/abs/1904.11042

实证研究
1)对每个帧应用基本攻击的攻击效果如何?2)视频中时间帧的影响如何?为了回答这些问题,我们对最先进的跟踪器(例如 SiamRPN-Alex * )执行两种基本的有针对性的攻击:
表 1显示了 BA-E、BA-R1 和 BA-R2 在 TA 下攻击 OTB100 上基于 SiamRPN-Alex 的跟踪器的成功率、平均绝对扰动和每帧平均迭代次数。我们看到:1)通过 BIM 和 C&W 的 BA-E 方法通过攻击每一帧获得了很高的成功率。然而,它们的扰动很大,并且用 10 次迭代来攻击每一帧非常耗时,并且超出了实时跟踪器的范围。FGSM虽然高效,但成功率却低得多。2)随机攻击10%帧,即BA-R1,比BA-E快10倍左右。然而,成功率显着下降。3)BA-R2方法每10帧攻击一次,效率较高,但牺牲了成功率。与BA-R1相比,在相同的攻击率,即10%帧数的情况下,BA-R2的成功率高于BA-R1。例如,基于BIM,BA-R2的成功率是原来的两倍以上。它推断,由于时间平滑性,相邻 10 帧的扰动具有一定的可传递性。
基于 BIM 的案例研究如图1所示 ,其中我们使用三种 BA 攻击来误导基于 SiamRPN-Alex 的跟踪器来定位场景左上角的感兴趣对象(图 1 中的目标位置 ( c ))。我们没有遵循标准的 Siamese 跟踪管道,而是根据地面实况裁剪搜索区域,并确保对象始终位于搜索区域的中心。我们显示了目标位置(图1 (a))和跟踪结果之间的距离 ,以及 帧级别的 平均绝对扰动(MAP)(图 1 (b))。我们得出与表 1一致的结论。BA-E是最简单的解决方案,在某个时刻(距目标位置距离小于20)MAP在5左右时可以成功攻击跟踪器,但攻击效率较低,不适合实时跟踪。此外,根据图 1 (c),扰动很大并且是可察觉的。结果回答了第一个问题:对每一帧进行攻击并不有效,即耗时且MAP较大。
考虑帧之间的时间特性,如果攻击可以在相邻帧之间转移,我们可以只攻击某些帧,同时减少开销,例如BA-R1和BA-R2。不幸的是,表1和图 1中的结果 表明BA-R1和BA-R2仅在执行攻击的特定帧上工作。
结果回答了第二个问题:由于视频中的动态场景,BA 产生的扰动很难直接转移到下一帧(参见 BA-R1 和 BA-R2 的结果)。
在线增量攻击
根据基本攻击的实证研究结果,我们发现直接针对每一帧进行攻击是无效的。由于帧是连续的并且附近的帧非常相似,我们的深入分析发现附近的帧之间存在可转移性。然而,如何有效地利用先前帧的扰动,同时在攻击新的帧时保持不易察觉,这是值得怀疑的。一种直接的方法是将以前的扰动添加到新的计算扰动中,这将提高攻击的成功率,但会导致严重的扭曲。为了解决这个问题,我们提出了在线增量攻击(SPARK),它可以更有效地生成更多难以察觉的对抗性示例以进行跟踪。SPARK 的直觉是,我们仍然攻击每一帧,但通过优化将先前的扰动应用于新帧,并结合小但有效的增量扰动。
增量扰动的时空稀疏性: 增量扰动沿着空间和时间逐渐变得稀疏(见图 1 (d))。与 BA 方法相比,这有助于产生更多难以察觉的扰动。此外,SPARK在所有帧中获得最小的MAP,并且在OTB100上比BA-E更高的成功率(见图 1 (b))。


相关文章:
【论文阅读】SPARK:针对视觉跟踪的空间感知在线增量攻击
SPARK: Spatial-Aware Online Incremental Attack Against Visual Tracking introduction 在本文中,我们确定了视觉跟踪对抗性攻击的一个新任务:在线生成难以察觉的扰动,误导跟踪器沿着不正确的(无目标攻击,UA&#x…...
MR混合现实教学系统在汽车检修与维护课堂教学中的应用
传统的汽车检修与维护课堂教学主要依赖教师口头讲解和黑板演示,这种方式存在一定的局限性。首先,对于一些复杂的机械结构和操作过程,教师难以生动形象地展示给学生。其次,学生无法直接观察到实际操作中的细节和注意事项࿰…...
CentOS7安装xvfb,解决服务器没有X-Server的问题
Linux服务器上一般没有图形界面,但是有时候有些软件又需要图形界面.比如oracle,自动化测试(puppeteer).运行的时候会提示没有没有X服务. 这时候一般不会去特地装图形界面.这个时候就要用xvfb来创建虚拟图形窗口. xvfb介绍 Xvfb(X Virtual Frame Buffer)是基于X Window的虚拟服…...
快速集成Skywalking 9(Windows系统、JavaAgent、Logback)
目录 一、Skywalking简介二、下载Skywalking服务端三、安装Skywalking服务端3.1 解压安装包3.2 启动Skywalking 四、关于Skywalking服务端更多配置五、Java应用集成skywalking-agent.jar5.1 下载SkyWalking Java Agent5.2 集成JavaAgent5.3 Logback集成Skywalking5.4 集成效果 …...
起立科技(起鸿)在第25届高交会上展示透明OLED技术创新
第二十五届中国国际高新技术成果交易会 日期:2023年11月15日 地点:福田会展中心7号馆 深圳,2023年11月15日 — 起鸿科技,作为透明OLED领域的引领者,于今日参展了第二十五届中国国际高新技术成果交易会。这一展会将汇…...
大模型LLM 在线量化;GPTQ\AWQ量化
1、大模型LLM 在线量化 参考:https://www.cnblogs.com/bruceleely/p/17348782.html ##8bit model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half(...
记一次线上bug排查-----SpringCloud Gateway组件 请求头accept-encoding导致响应结果乱码
基于公司的业务需求,在SpringCloud Gateway组件的基础上,写了一个转发服务,测试开发阶段运行正常,并实现初步使用。但三个月后,PostMan请求接口,返回异常,经排查,从日志中获取到转发…...
复杂数据统计与R语言程序设计实验一
1.下载并安装R语言软件,熟悉基本操作的命令及操作界面,掌握软件的使用方法(提供学号加姓名的截图)。 2.下载并安装Rstudio, (提供运行代码及运行结果的截图)。 3.下载并安装R包DT,…...
UEFI实战——键盘操作
一、键盘操作 UEFI下如何获取键盘键值,用户输入按键方式分两种:一种是单个按键,另外一种是组合按键。两种方式对应两个Protocol服务,接下来分步讲解。 二、单个按键 单个按键使用Protocol服务是EFI_SIMPLE_TEXT_INPUT_PROTOCOL,它定义在MdePkg/Include/Protocol/Simple…...
苹果CMS首涂第30套可装修DIY主题模板免授权版
这是一款可以装修的主题,类似淘宝店装修一样,可以针对首页、栏目页、详情页、播放页进行自定义装修,内置10个模块自由选择、添加、修改、删除、排序操作,后续升级还会增加更多实用和个性模块供选择,主题内包含的导航、…...
C#每天复习一个重要小知识day2:有参与无参构造函数
using System;public class MyClass {private int value;// 有参构造函数public MyClass(int v){this.value v;}// 无参构造函数public MyClass(){this.value 0;}public static void Main(string[] args){// 使用有参构造函数实例化对象MyClass obj1 new MyClass(10);Consol…...
大语言模型的三阶段训练
为了训练专有领域模型,选择LLaMA2-7B作为基座模型,由于LLaMA模型中文词表有限,因此首先进行中文词表的扩展,然后进行三阶段训练(增量预训练,有监督微调,强化学习)。 代码将全部上传…...
面试题c/c++ --STL 算法与数据结构
1.6 STL 模板 模板底层实现:编译器会对函数模板进行两次编译, 在声明的地方对模板代码本身进行编译, 在调用的地方对参数替换后的代码进行编译。 模板传参分析 模板重载 vector 是动态空间, 随着元素的加入, 它的内…...
云原生微服务-理论篇
文章目录 分布式应用的需求分布式架构治理模式演进ESB 是什么?微服务架构 MSA微服务实践细节微服务治理框架sidercar 什么是service mesh?康威定律微服务的扩展性什么是MSA 架构?中台战略和微服务微服务总体架构组件微服务网关服务发现与路由…...
Unity模拟薄膜干涉效果
Unity制作薄膜干涉效果,色彩斑斓的黑色石头 大家好,我是阿赵。 这次来做一个模拟薄膜干涉的彩色效果,Shader是使用ASE来连接,也算是ASE做复杂一点的效果的一个例子吧。 一、什么是薄膜干涉 以下解释来源于百度百科࿱…...
AIGC ChatGPT4对Gbase数据库进行总结
ChatGPT4 用一个Prompt完成Gbase数据库的总结。 AIGC ChatGPT 职场案例 AI 绘画 与 短视频制作 PowerBI 商业智能 68集 数据库Mysql 8.0 54集 数据库Oracle 21C 142集 Office 2021实战应用 Python 数据分析实战, ETL Informatica 数据仓库案例实战 Excel 2021实操 …...
OSI网络模型与TCP/IP协议
OSI, Open system Interconnection Reference Model 开放式系统互联通信参考模型。是国际标准化组织在1984年定义的一个概念框架,用于协调制定进程间通信标准。OSI作为一个协议规范集,定义了七个层次,包括层次之间的相互关系及各层…...
C语言的5个内存段你了解吗?( 代码段/数据段/栈/堆)
前言:这些内存段在程序运行时起着不同的作用,有不同的分配方式和存储内容。对于 C 语言程序员来说,了解这些内存段的特性和用途有助于更好地理解内存管理、变量的存储位置以及程序执行过程中的内存分配情况 1. 代码段 (Code Segment) 内容&a…...
智能合约检测:新一代区块链技术的安全守护
目录 1、智能合约检测:新一代区块链技术的安全守护 2、智能合约性能检测步骤...
Flutter笔记:缩放手势
Flutter笔记 缩放手势 作者:李俊才 (jcLee95):https://blog.csdn.net/qq_28550263 邮箱 :291148484163.com 本文地址:https://blog.csdn.net/qq_28550263/article/details/134485138 目 录 1. 概述2. 缩放手…...
国防科技大学计算机基础课程笔记02信息编码
1.机内码和国标码 国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制,因此这个了16进制的数据既可以翻译成为这个机器码,也可以翻译成为这个国标码,所以这个时候很容易会出现这个歧义的情况; 因此,我们的这个国…...
Android Wi-Fi 连接失败日志分析
1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分: 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析: CTR…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】
微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...
UDP(Echoserver)
网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...
CentOS下的分布式内存计算Spark环境部署
一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...
什么是库存周转?如何用进销存系统提高库存周转率?
你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:
根据万维钢精英日课6的内容,使用AI(2025)可以参考以下方法: 四个洞见 模型已经比人聪明:以ChatGPT o3为代表的AI非常强大,能运用高级理论解释道理、引用最新学术论文,生成对顶尖科学家都有用的…...
大学生职业发展与就业创业指导教学评价
这里是引用 作为软工2203/2204班的学生,我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要,而您认真负责的教学态度,让课程的每一部分都充满了实用价值。 尤其让我…...
