当前位置: 首页 > news >正文

(论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking

文献阅读笔记

简介

题目

Learning a Deep Compact Image Representation for Visual Tracking

作者

N Wang, DY Yeung

原文链接

Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc)

关键词

Object tracking、DLT、SDAE

研究问题

tracking the trajectory of a moving object in a video with possibly very complex background

在尽可能复杂背景的视频中跟踪目标的移动轨迹

研究方法

DLT:deep learning tracker

试图结合生成性跟踪器和判别性跟踪器的思想,开发一个鲁棒的判别性跟踪器。

更强调无监督的特征学习问题;

Specifically, by using auxiliary natural images, we train a stacked denoising autoencoder (SDAE) offline to learn generic image features that are more robust against variations.

通过使用辅助的自然图像,我们离线训练一个堆叠的去噪自编码器,以学习对变化更稳定的通用图像特征。

This is then followed by knowledge transfer from offline training to the online tracking process.

随后是知识转移从线下培训到线上跟踪的过程。

Online tracking involves a classification neural network which is constructed from the encoder part of the trained autoencoder as a feature extractor and an additional classification layer.

在线跟踪涉及一个分类神经网络,该网络由训练好的自编码器的编码器部分作为特征提取器和一个额外的分类层构建而成。

Both the feature extractor and the classifier can be further tuned to adapt to appearance changes of the moving object.

特征提取器和分类器都可以进行进一步的调整以适应移动对象的外观变化。

研究结论

相比其他跟踪器,在保持低计算成本和实时性的情况下更准确

创新不足

it would be an interesting direction to investigate a shift-variant CNN.

目前的跟踪器中的分类层只是一个线性分类器。将其扩展到更强大的分类器中,就像在其他判别跟踪器中一样,可能会为进一步的性能提升提供更大的空间。

额外知识

生成式和判别式方法:

生成式:假设被跟踪的对象可以用某种生成式过程来描述,因此跟踪相当于在可能无限多的候选对象中找到最可能的候选对象。关键是开发更加稳定的图像表示。灵感来源于robust estimation and sparse coding,such as the alternating direction method of multipliers (ADMM) and accelerated gradient methods。Some popular generative trackers include incremental visual tracking (IVT) , which represents the tracked object based on principal component analysis (PCA), and the l1 tracker (L1T)。

判别式:,判别式方法将跟踪视为一个二分类问题,学习将被跟踪对象与其背景明确区分开来。Some representative trackers in this category are the online AdaBoost (OAB) tracker [6], multiple instance learning (MIL) tracker [3], and structured output tracker (Struck).

对比:由于使用了更丰富的图像表示,生成式跟踪器通常在较不复杂的环境下产生更准确的结果,而判别式跟踪器由于明确地将背景考虑在内,因此对强遮挡和变化具有更强的鲁棒性。

The particle filter framework:粒子滤波框架

一种基于序列观测值估计动力系统潜在状态变量的序贯蒙特卡洛重要性采样方法。它通过一组粒子来近似后验状态分布,而不仅仅是像模式这样的单点。对于视觉跟踪而言,这一特性使得跟踪器更容易从错误的跟踪结果中恢复

Kalman filter卡尔曼滤波:

比较先进的跟踪器:MTT, CT , VTD , MIL, a latest variant of L1T, TLD, and IVT.

相关文章:

(论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking

文献阅读笔记 简介 题目 Learning a Deep Compact Image Representation for Visual Tracking 作者 N Wang, DY Yeung 原文链接 Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc) 关键词 Object tracking、DLT、SDAE 研究问题 track…...

浅谈设计模式

文章目录 一、单例模式 1.饿汉模式 2.懒汉模式 二、工厂模式 三、建造者模式 四、代理模式 设计模式是前辈们对代码开发的总结,是解决特定问题的一系列套路。它不是语法规定,而是一套用来提高代码可复用性、可维护性、可读性、稳健性以及安全性的解…...

企业年会/年终活动如何邀请媒体记者报道?

​媒体邀约是企业或组织进行宣传的重要手段之一。通过邀请媒体参加活动,可以增加活动的曝光度和知名度,吸引更多的关注和参与。同时,媒体报道还可以提高企业或组织的权威性和可信度,从而让公众更容易接受其传达的信息。 企业年会或…...

C语言如何执行HTTP GET请求

在现代互联网时代,网络数据的获取和分析变得越来越重要。无论是为了研究市场趋势,还是为了收集信息进行数据分析,编写一个网络爬虫可以帮助我们自动化这一过程。在这篇文章中,我们将使用C语言和libcurl库来编写一个简单的网络爬虫…...

.Net 6 Nacos日志控制台疯狂发输出+Log4Net日志过滤

我们的项目配置了Log4Net 作为日志输出工具,在引入Nacos后,控制台和日志里疯狂输出nacos心跳日志和其他相关信息,导致自己记录的信息被淹没了,找了很多解决办法: 1、提高nacos日志级别,然后再屏蔽相应级别…...

Libra R-CNN: Towards Balanced Learning for Object Detection(2019.4)

文章目录 AbstractIntroduction引入问题1) Sample level imbalance2) Feature level imbalance3) Objective level imbalance进行解决贡献 Related Work(他人的work,捎带与我们的对比)Model architectures for object detection&a…...

Redis的内存淘汰策略分析

概念 LRU 是按访问时间排序,发生淘汰的时候,把访问时间最久的淘汰掉。LFU 是按频次排序,一个数据被访问过,把它的频次 1,发生淘汰的时候,把频次低的淘汰掉。 几种LRU策略 以下集中LRU测率网上有很多&am…...

git命令之遭遇 ignore罕见问题解决

我先来讲讲背景 我的一些文件在ignore了,不会被提交到远程仓库,这时候我的远程仓库中是没有这几个文件的,这时候我如果使用 git reset 的话这时候除了那几个 ignore 的文件以外都被更新的,但是如果我不需要这几个被 ignore 的文件…...

torch DDP多卡训练教程记录

参考 简明教程看这里 --> pytorch分布式训练 和这篇: [PyTorch]> DDP系列第一篇:入门教程 --》 详细解答了pipeline DDP原理篇 --> DDP系列第二篇:实现原理与源代码解析 --》 主要讲 all_reduce 和 sample 的实现 减少GPU占用看这里…...

Jenkins CICD过程常见异常

1 Status [126] Exception when publishing, exception message [Exec exit status not zero. Status [126] 1.1 报错日志 SSH: EXEC: STDOUT/STDERR from command [/app/***/publish.sh] ... bash: /app/***/publish.sh: Permission denied SSH: EXEC: completed after 200…...

Java11新增特性

前言 在前面的文章中,我们已经介绍了 Java9的新增特性 和 Java10的新增特性 ,下面我们书接上文,来介绍一下Java11的新增特性 版本简介 Java 11 是 Java 平台的最新版本,于2018年9月25日发布。这个版本是自Java 8以来最重要的更新之一&…...

安卓常见设计模式13------过滤器模式(Kotlin版)

W1 是什么,什么是过滤器模式?​ 过滤器模式(Filter Pattern)是一种常用的结构型设计模式,用于根据特定条件过滤和筛选数据。 2. W2 为什么,为什么需要使用过滤器模式,能给我们编码带来什么好处…...

使用spark进行递归的可行方案

在实际工作中会遇到,最近有需求将产品炸开bom到底层,但是ERP中bom数据在一张表中递归存储的,不循环展开,是无法知道最底层原材料是什么。 在ERP中使用pl/sql甚至sql是可以进行炸BOM的,但是怎么使用spark展开&#xff0…...

Spring -Spring之依赖注入源码解析(下)--实践(流程图)

IOC依赖注入流程图 注入的顺序及优先级:type-->Qualifier-->Primary-->PriOriry-->name...

前端设计模式之【单例模式】

文章目录 前言介绍实现单例模式优缺点?后言 前言 hello world欢迎来到前端的新世界 😜当前文章系列专栏:前端设计模式 🐱‍👓博主在前端领域还有很多知识和技术需要掌握,正在不断努力填补技术短板。(如果出…...

设备零部件更换ar远程指导系统加强培训效果

随着科技的发展,AR技术已经成为了一种广泛应用的新型技术。AR远程指导系统作为AR技术的一种应用,具有非常广泛的应用前景。 一、应用场景 气象监测AR教学软件适用于多个领域,包括气象、环境、地理等。在教学过程中,软件可以帮助学…...

文本生成高精准3D模型,北京智源AI研究院等出品—3D-GPT

北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。 据悉,3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块,简化了3D建模的开发流程…...

Netty入门指南之NIO 网络编程

作者简介:☕️大家好,我是Aomsir,一个爱折腾的开发者! 个人主页:Aomsir_Spring5应用专栏,Netty应用专栏,RPC应用专栏-CSDN博客 当前专栏:Netty应用专栏_Aomsir的博客-CSDN博客 文章目录 参考文献前言基础扫…...

LeetCode(6)轮转数组【数组/字符串】【中等】

目录 1.题目2.答案3.提交结果截图 链接: 189. 轮转数组 1.题目 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1…...

华为云Ascend310服务器使用

使用华为云服务器 cpu: 16vCPUs Kunpeng 920 内存:16GiB gpu:4* HUAWEI Ascend 310 cann: 20.1.rc1 操作系统:Ubuntu aarch64目的 使用该服务器进行docker镜像编译,测试模型。 已知生产环境:mindx版本为3.0.rc3&a…...

从字节码注入到运行时遥测:Spring Boot 4.0 Agent-Ready架构的4层技术栈图谱,你的团队卡在第几层?

第一章:从字节码注入到运行时遥测:Spring Boot 4.0 Agent-Ready架构的4层技术栈图谱,你的团队卡在第几层?Spring Boot 4.0 首次将 JVM Agent 集成能力深度内置于启动生命周期中,形成“编译→加载→运行→观测”闭环的四…...

M2LOrder开源大模型部署案例:中小企业低成本构建自有情感分析平台

M2LOrder开源大模型部署案例:中小企业低成本构建自有情感分析平台 1. 项目概述 在当今的商业环境中,情感分析已经成为企业了解客户反馈、优化产品体验、提升服务质量的重要工具。然而,传统的情感分析解决方案往往价格昂贵,部署复…...

Codex的安装和初步使用

前言 Codex是ChatGpt的AI编程框架。如果有chatgpt的账号的话,可以免费使用Codex 。 一、安装 1.1、打开Codex对应的网页 打开ChatGpt的网页:点击这个左边栏位的内容中Codex:然后进入如下的页面:可以看到三种应用的方式 第一种Code…...

Android MediaRecorder独占锁揭秘:为什么你的录音和系统通话录音会互相打架?

Android音频独占锁机制:破解MediaRecorder与系统通话录音的资源争夺战 当你在开发一款需要后台录音的Android应用时,是否遇到过这样的尴尬场景:用户接听电话时,你的应用正在录音,结果系统通话录音功能要么完全失效&…...

数字视频录像机(DVR):从技术革新到行业应用的全面解析

目录 一、技术演进 1. 基础架构的革新 2. 编码技术的迭代 3. 智能化与云化融合 二、市场格局 1. 全球市场规模与区域分布 2. 竞争格局:头部企业技术壁垒深厚 3. 替代风险与差异化竞争 三、应用场景 1. 传统安防领域 2. 工业与能源领域 3. 智能家居与消费级市场 …...

高效Markdown浏览器插件:轻松预览本地与在线文档的完整解决方案

高效Markdown浏览器插件:轻松预览本地与在线文档的完整解决方案 【免费下载链接】markdown-viewer Markdown Viewer / Browser Extension 项目地址: https://gitcode.com/gh_mirrors/ma/markdown-viewer 还在寻找一款能够优雅渲染Markdown文档的浏览器扩展吗…...

Windows 10变身简易服务器:低成本搭建多用户远程开发/测试环境全记录

Windows 10变身简易服务器:低成本搭建多用户远程开发/测试环境全记录 在当今快节奏的开发环境中,团队协作和资源共享变得越来越重要。对于小型团队、学生项目组或个人开发者来说,购买专业服务器设备往往意味着高昂的成本投入。而实际上&#…...

【原创代码】基于贝叶斯优化的PatchTST综合能源负荷多变量时间序列预测

​✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书…...

告别嗡嗡声与异常发热:深入解读PWM整流器在电网不平衡时的两种主流控制方案

告别嗡嗡声与异常发热:深入解读PWM整流器在电网不平衡时的两种主流控制方案 光伏逆变器突然发出刺耳的蜂鸣声,充电桩散热风扇狂转不止——这些现象背后,往往隐藏着电网电压不平衡时PWM整流器的控制难题。当三相电压幅值出现差异,…...

思源宋体TTF:7种字重深度解析与实战应用完全指南

思源宋体TTF:7种字重深度解析与实战应用完全指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为中文排版寻找完美的字体方案而苦恼吗?Source Han Serif …...