当前位置：首页 > news >正文

（论文阅读22/100）Learning a Deep Compact Image Representation for Visual Tracking

news 2026/2/10 14:20:56

文献阅读笔记
简介	题目	Learning a Deep Compact Image Representation for Visual Tracking
	作者	N Wang, DY Yeung
	原文链接	Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc)
	关键词	Object tracking、DLT、SDAE
	研究问题	tracking the trajectory of a moving object in a video with possibly very complex background 在尽可能复杂背景的视频中跟踪目标的移动轨迹
	研究方法	DLT：deep learning tracker 试图结合生成性跟踪器和判别性跟踪器的思想，开发一个鲁棒的判别性跟踪器。更强调无监督的特征学习问题； Specifically, by using auxiliary natural images, we train a stacked denoising autoencoder （SDAE） offline to learn generic image features that are more robust against variations. 通过使用辅助的自然图像，我们离线训练一个堆叠的去噪自编码器，以学习对变化更稳定的通用图像特征。 This is then followed by knowledge transfer from offline training to the online tracking process. 随后是知识转移从线下培训到线上跟踪的过程。 Online tracking involves a classification neural network which is constructed from the encoder part of the trained autoencoder as a feature extractor and an additional classification layer. 在线跟踪涉及一个分类神经网络，该网络由训练好的自编码器的编码器部分作为特征提取器和一个额外的分类层构建而成。 Both the feature extractor and the classifier can be further tuned to adapt to appearance changes of the moving object. 特征提取器和分类器都可以进行进一步的调整以适应移动对象的外观变化。
	研究结论	相比其他跟踪器，在保持低计算成本和实时性的情况下更准确
	创新不足	it would be an interesting direction to investigate a shift-variant CNN. 目前的跟踪器中的分类层只是一个线性分类器。将其扩展到更强大的分类器中，就像在其他判别跟踪器中一样，可能会为进一步的性能提升提供更大的空间。
	额外知识	生成式和判别式方法：生成式：假设被跟踪的对象可以用某种生成式过程来描述，因此跟踪相当于在可能无限多的候选对象中找到最可能的候选对象。关键是开发更加稳定的图像表示。灵感来源于robust estimation and sparse coding，such as the alternating direction method of multipliers (ADMM) and accelerated gradient methods。Some popular generative trackers include incremental visual tracking (IVT) , which represents the tracked object based on principal component analysis (PCA), and the l1 tracker (L1T)。判别式：，判别式方法将跟踪视为一个二分类问题，学习将被跟踪对象与其背景明确区分开来。Some representative trackers in this category are the online AdaBoost (OAB) tracker [6], multiple instance learning (MIL) tracker [3], and structured output tracker (Struck). 对比：由于使用了更丰富的图像表示，生成式跟踪器通常在较不复杂的环境下产生更准确的结果，而判别式跟踪器由于明确地将背景考虑在内，因此对强遮挡和变化具有更强的鲁棒性。 The particle filter framework：粒子滤波框架一种基于序列观测值估计动力系统潜在状态变量的序贯蒙特卡洛重要性采样方法。它通过一组粒子来近似后验状态分布，而不仅仅是像模式这样的单点。对于视觉跟踪而言，这一特性使得跟踪器更容易从错误的跟踪结果中恢复 Kalman filter卡尔曼滤波：比较先进的跟踪器：MTT, CT , VTD , MIL, a latest variant of L1T, TLD, and IVT.

（论文阅读22/100）Learning a Deep Compact Image Representation for Visual Tracking

文献阅读笔记简介题目 Learning a Deep Compact Image Representation for Visual Tracking 作者 N Wang, DY Yeung 原文链接 Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc) 关键词 Object tracking、DLT、SDAE 研究问题 track…...

编程日记 2023/11/11 6:49:49

浅谈设计模式

文章目录一、单例模式 1.饿汉模式 2.懒汉模式二、工厂模式三、建造者模式四、代理模式设计模式是前辈们对代码开发的总结，是解决特定问题的一系列套路。它不是语法规定，而是一套用来提高代码可复用性、可维护性、可读性、稳健性以及安全性的解…...

编程日记 2023/11/11 6:48:48

企业年会/年终活动如何邀请媒体记者报道?

媒体邀约是企业或组织进行宣传的重要手段之一。通过邀请媒体参加活动，可以增加活动的曝光度和知名度，吸引更多的关注和参与。同时，媒体报道还可以提高企业或组织的权威性和可信度，从而让公众更容易接受其传达的信息。企业年会或…...

编程日记 2023/11/11 6:47:47

C语言如何执行HTTP GET请求

在现代互联网时代，网络数据的获取和分析变得越来越重要。无论是为了研究市场趋势，还是为了收集信息进行数据分析，编写一个网络爬虫可以帮助我们自动化这一过程。在这篇文章中，我们将使用C语言和libcurl库来编写一个简单的网络爬虫…...

编程日记 2023/11/11 6:45:45

.Net 6 Nacos日志控制台疯狂发输出+Log4Net日志过滤

我们的项目配置了Log4Net 作为日志输出工具，在引入Nacos后，控制台和日志里疯狂输出nacos心跳日志和其他相关信息，导致自己记录的信息被淹没了，找了很多解决办法： 1、提高nacos日志级别，然后再屏蔽相应级别…...

编程日记 2023/11/11 6:43:43

Libra R-CNN: Towards Balanced Learning for Object Detection（2019.4）

文章目录 AbstractIntroduction引入问题1） Sample level imbalance2) Feature level imbalance3) Objective level imbalance进行解决贡献 Related Work（他人的work，捎带与我们的对比）Model architectures for object detection&a…...

编程日记 2023/11/11 6:42:42

Redis的内存淘汰策略分析

概念 LRU 是按访问时间排序，发生淘汰的时候，把访问时间最久的淘汰掉。LFU 是按频次排序，一个数据被访问过，把它的频次 1，发生淘汰的时候，把频次低的淘汰掉。几种LRU策略以下集中LRU测率网上有很多&am…...

编程日记 2023/11/11 6:41:41

git命令之遭遇 ignore罕见问题解决

我先来讲讲背景我的一些文件在ignore了，不会被提交到远程仓库，这时候我的远程仓库中是没有这几个文件的，这时候我如果使用 git reset 的话这时候除了那几个 ignore 的文件以外都被更新的，但是如果我不需要这几个被 ignore 的文件…...

编程日记 2023/11/11 6:40:40

torch DDP多卡训练教程记录

参考简明教程看这里 --> pytorch分布式训练和这篇： [PyTorch]> DDP系列第一篇：入门教程 --》详细解答了pipeline DDP原理篇 --> DDP系列第二篇：实现原理与源代码解析 --》主要讲 all_reduce 和 sample 的实现减少GPU占用看这里…...

编程日记 2023/11/11 6:39:39

Jenkins CICD过程常见异常

1 Status [126] Exception when publishing, exception message [Exec exit status not zero. Status [126] 1.1 报错日志 SSH: EXEC: STDOUT/STDERR from command [/app/***/publish.sh] ... bash: /app/***/publish.sh: Permission denied SSH: EXEC: completed after 200…...

编程日记 2023/11/11 6:38:38

Java11新增特性

前言在前面的文章中，我们已经介绍了 Java9的新增特性和 Java10的新增特性 ,下面我们书接上文，来介绍一下Java11的新增特性版本简介 Java 11 是 Java 平台的最新版本，于2018年9月25日发布。这个版本是自Java 8以来最重要的更新之一&…...

编程日记 2023/11/11 6:37:37

安卓常见设计模式13------过滤器模式（Kotlin版）

W1 是什么，什么是过滤器模式？ 过滤器模式（Filter Pattern）是一种常用的结构型设计模式，用于根据特定条件过滤和筛选数据。 2. W2 为什么，为什么需要使用过滤器模式，能给我们编码带来什么好处…...

编程日记 2023/11/11 6:36:36

使用spark进行递归的可行方案

在实际工作中会遇到，最近有需求将产品炸开bom到底层，但是ERP中bom数据在一张表中递归存储的，不循环展开，是无法知道最底层原材料是什么。在ERP中使用pl/sql甚至sql是可以进行炸BOM的，但是怎么使用spark展开&#xff0…...

编程日记 2023/11/11 6:35:35

Spring -Spring之依赖注入源码解析（下）--实践（流程图）

IOC依赖注入流程图注入的顺序及优先级：type-->Qualifier-->Primary-->PriOriry-->name...

编程日记 2023/11/11 6:34:33

前端设计模式之【单例模式】

文章目录前言介绍实现单例模式优缺点？后言前言 hello world欢迎来到前端的新世界 😜当前文章系列专栏：前端设计模式 🐱‍👓博主在前端领域还有很多知识和技术需要掌握，正在不断努力填补技术短板。(如果出…...

编程日记 2023/11/11 6:33:33

设备零部件更换ar远程指导系统加强培训效果

随着科技的发展，AR技术已经成为了一种广泛应用的新型技术。AR远程指导系统作为AR技术的一种应用，具有非常广泛的应用前景。一、应用场景气象监测AR教学软件适用于多个领域，包括气象、环境、地理等。在教学过程中，软件可以帮助学…...

编程日记 2023/11/11 6:32:32

文本生成高精准3D模型，北京智源AI研究院等出品—3D-GPT

北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT，通过文本问答方式就能创建高精准3D模型。据悉，3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块，简化了3D建模的开发流程…...

编程日记 2023/11/11 6:31:31

Netty入门指南之NIO 网络编程

作者简介：☕️大家好，我是Aomsir，一个爱折腾的开发者！ 个人主页：Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客当前专栏：Netty应用专栏_Aomsir的博客-CSDN博客文章目录参考文献前言基础扫…...

编程日记 2023/11/11 6:30:30

LeetCode（6）轮转数组【数组/字符串】【中等】

目录 1.题目2.答案3.提交结果截图链接： 189. 轮转数组 1.题目给定一个整数数组 nums，将数组中的元素向右轮转 k 个位置，其中 k 是非负数。示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1…...

编程日记 2023/11/11 6:29:30

华为云Ascend310服务器使用

使用华为云服务器 cpu: 16vCPUs Kunpeng 920 内存：16GiB gpu：4* HUAWEI Ascend 310 cann: 20.1.rc1 操作系统：Ubuntu aarch64目的使用该服务器进行docker镜像编译，测试模型。已知生产环境：mindx版本为3.0.rc3&a…...

编程日记 2023/11/11 6:28:29

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/8 20:42:41

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2026/1/21 9:20:07

Day131 | 灵神 | 回溯算法 | 子集型子集

Day131 | 灵神 | 回溯算法 | 子集型子集 78.子集 78. 子集 - 力扣（LeetCode） 思路： 笔者写过很多次这道题了，不想写题解了，大家看灵神讲解吧回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

编程新知 2026/1/23 12:37:51

高危文件识别的常用算法：原理、应用与企业场景

高危文件识别的常用算法：原理、应用与企业场景高危文件识别旨在检测可能导致安全威胁的文件，如包含恶意代码、敏感数据或欺诈内容的文档，在企业协同办公环境中（如Teams、Google Workspace）尤为重要。结合大模型技术&…...

编程新知 2026/2/8 10:51:42

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南：从入门到实战一、Grunt 是什么？ Grunt是一个基于 Node.js 的前端自动化任务运行器，主要用于自动化执行项目开发中重复性高的任务，例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

编程新知 2026/1/25 11:52:39

【Nginx】使用 Nginx+Lua 实现基于 IP 的访问频率限制

使用 NginxLua 实现基于 IP 的访问频率限制在高并发场景下，限制某个 IP 的访问频率是非常重要的，可以有效防止恶意攻击或错误配置导致的服务宕机。以下是一个详细的实现方案，使用 Nginx 和 Lua 脚本结合 Redis 来实现基于 IP 的访问频率限制…...

编程新知 2025/10/22 6:06:44

LabVIEW双光子成像系统技术

双光子成像技术的核心特性双光子成像通过双低能量光子协同激发机制，展现出显著的技术优势： 深层组织穿透能力：适用于活体组织深度成像高分辨率观测性能：满足微观结构的精细研究需求低光毒性特点：减少对样本的损伤…...

编程新知 2026/1/31 13:04:44

WebRTC从入门到实践 - 零基础教程

WebRTC从入门到实践 - 零基础教程目录 WebRTC简介基础概念工作原理开发环境搭建基础实践三个实战案例常见问题解答 1. WebRTC简介 1.1 什么是WebRTC？ WebRTC（Web Real-Time Communication）是一个支持网页浏览器进行实时语音…...

编程新知 2026/1/5 0:33:43

windows系统MySQL安装文档

概览：本文讨论了MySQL的安装、使用过程中涉及的解压、配置、初始化、注册服务、启动、修改密码、登录、退出以及卸载等相关内容，为学习者提供全面的操作指导。关键要点包括： 解压 ：下载完成后解压压缩包，得到MySQL 8.…...

编程新知 2026/2/6 10:22:29

相关文章：