[TPAMI‘21] Heatmap Regression via Randomized Rounding
paper: https://arxiv.org/pdf/2009.00225.pdf
code: https://github.com/baoshengyu/H3R
- 总结:本文提出一套编解码方法:
- 编码:random-round整数化 + 激活点响应值表征小数部分,使得GT可以通过编码后的heatmap解码得到;
- 解码:提出两种激活点选择,最终预测值为激活点坐标 * 激活值的加权和。
- WFLW上结果非常好
- 该方法是2021年8月26日挂载arxiv上,早于Local Soft-max(Subpixel Heatmap Regression for Facial Landmark Localization),两篇文章都是想解决热图的量化误差问题,解码思路很相近。
beyond the scope of this paper;
目录
摘要
方法
量化系统
量化误差
激活点的选择
实验
人脸关键点检测编辑
全身位姿检测
消融实验
摘要
- 本文探索了热图回归中的量化误差问题;
- 本文提出了一个简单但有效的系统randomized rounding operation,包含两个部分:
- 在训练时,用一种概率方法,将坐标小数部分编码到GT heatmap中;
- 在测试时,从激活点集合中解码预测坐标
- 本文在人脸关键点数据集(WFLW、300W、COFW和AFLW)和人体位姿检测数据集(MPII和COCO)上实验验证了本文方法的有效性。
方法
- 介绍热图回归中的量化系统;
- 在该系统中公式化描述量化误差;
- 通过随机近似(randomized rounding)设计了新的量化系统。
量化系统
现有方法:1)编码:针对浮点坐标,计算Gaussian kernel matrix开销大,现有方法是将坐标整数化后,使用kernel模型填充;2)解码:最大激活点。
本文从误差出发,将误差拆分为热图误差和量化误差:
其中,x^p是预测值,x_q是GT,x_opt则是自设GT,自设GT是指根据GT坐标编码后的热图,解码得到的坐标值。本文只考虑量化误差。
量化误差
首先定义误差,其中s为放缩倍数,例如原图大小为256,热图为64,则放缩倍数为4。

其次定义坐标整数化,其中t为整数化阈值,对round来说,t=0.5。
量化偏差(quantization bias)为:

因此,当t=0.5,也即整数化方法是round时,编码方法是无偏的。对于t的其他取值,可以在解码时加入偏移量,使它无偏:
![]()
虽然,上述编码系统是无偏的,但是它会导致non-invertible localization error,也即当整数化后,误差就不可避免了。
定理1:当量化系统是无偏时,量化误差的上限是:![]()
由定理1可知,当s越大,误差也即越大。
Randomized Rounding

本文提出Randomized Rounding,通过多个激活点去表示整数化误差,

并提出random-round:

希望预测热图为:
最后的解码为:
激活点为四个:
定理2:当为上述编解码操作时,量化系统是无偏的,且没有量化误差。
激活点的选择

包含两套方案:
1)取得极值点后,包围近邻点都是激活点,例如上图;
2)选择tok p个点,这些点为激活点。
实验
人脸关键点检测

全身位姿检测

消融实验
当使用高斯热图时,sigma越大,需要的激活点越多,最好效果在sigma=1.0/1.5时取得。
相关文章:
[TPAMI‘21] Heatmap Regression via Randomized Rounding
paper: https://arxiv.org/pdf/2009.00225.pdf code: https://github.com/baoshengyu/H3R 总结:本文提出一套编解码方法: 编码:random-round整数化 激活点响应值表征小数部分,使得GT可以通过编码后的heatmap解码得到;…...
pytorch下tensorboard使用[远程服务器]
** 1、安装tensorboard ** pip install tensorboard可以不安装tensorflow,后续会有提示: TensorFlow installation not found - running with reduced feature set. 但是没有影响。 2、创建环境,导出数据 这一步由代码中的writer完成。 …...
CentOS下安装Nginx的详细步骤
1.安装依赖:yum -y install gcc gcc-c make libtool zlib zlib-devel openssl openssl-devel pcre pcre-devel 2.下载Nginx安装包:wget -c https://nginx.org/download/nginx-1.18.0.tar.gz 3.解压,进入解压目录: tar -zxvf nginx-1.18.0.…...
CSS编码规范
本篇文章是基于王叨叨大佬师父维护的文档梳理的,有兴趣可以去看一下原文CSS编码规范。 其实不管是HTML也好,还是CSS也好,有些规范其实是共通的。 1. 命名 class的命名应该偏向语义化,不是为了样式而去命名,而是通过…...
Linux下makefile 编译项目
文章目录1、规划makefile编写2、makefile文件2.1、根目录下common.mk2.2、config.mk2.3、根目录makefile2.4、其他目录下1、规划makefile编写 a、根目录下放三个文件: 1、makefile:是咱们编译项目的入口脚本,编译项目从这里开始,…...
Linux磁盘查看,使用(分区、格式化、挂载)
目录 0、观察磁盘分区状态:lsblk、blkid、parted 0.1 lsblk列出系统上的所有磁盘列表 0.2 blkid列出设备的UUID等参数 0.3 parted列出磁盘的分区表类型与分区信息 1、磁盘分区:gdisk、fdisk 1.1 fdisk 2、磁盘格式化(创建文件系统…...
走进WebGL
什么是 WebGL? WebGL 是一种跨平台、免版税的 API,用于在 Web 浏览器中创建 3D 图形。基于 OpenGL ES 2.0,WebGL 使用 OpenGL 着色语言 GLSL,并提供熟悉的标准 OpenGL API。因为它在 HTML5 Canvas 元素中运行,所以 We…...
Unity 中 Awake 和 Start 时机与 GameObject的关系
Awake和Start很相似,都是在脚本的初始阶段执行 但是有两点重要不同: Awake先执行Awake即便在脚本 disabled (即enabled false)时,也会执行,但是Start就不会执行了 对一个物体: 当初始没有激…...
1月份 GameFi 行业报告
Jan. 2023, DanielData Source: January Monthly GameFi Report在经历了艰难的一年之后,1 月是对加密货币市场最有利的月份。虽然可以说的大部分内容适用于其他看涨周期,但有几个统计数据令 1 月在区块链领域非常有趣。例如&#…...
JVM - 调优
目录 调什么,如何调 内存方面 线程方面 如何调优 调优的目标,策略和冷思考 JVM调优的目标 常见调优策略 JVM调优冷思考 调优经验与内存泄漏分析 JVM调优经验 内存泄露 调什么,如何调 内存方面 JVM需要的内存总大小各块内存分配,新生代、老年代、存活区选…...
flask配置https协议
感谢https://blog.csdn.net/qq_33934427/article/details/127456673,文中多有参考再实践一、要用https协议需要有ca证书,在windows10先下载windows版本openssl,地址如下https://share.weiyun.com/vfjVrMAb我是64位的选择下载完毕安装后配置环…...
Springboot 我随手封装了一个万能的导出excel工具,传什么都能导出
前言 如题,这个小玩意,就是不限制你查的是哪张表,用的是什么类。 我直接一把梭,嘎嘎给你一顿导出。 我知道,这是很多人都想过的, 至少我就收到很多人问过我这个类似的问题。 我也跟他们说了,但…...
【Linux详解】——进程控制(创建、终止、等待、替换)
📖 前言:本期介绍进程控制(创建、终止、等待、替换)。 目录🕒 1. 进程创建🕘 1.1 fork函数初识🕘 1.2 fork的返回值问题🕘 1.3 写时拷贝🕘 1.4 创建多个进程🕒…...
HummerRisk V0.9.1:操作审计增加百度云,增加主机检测规则及多处优化
HummerRisk V0.9.0发布:增加RBAC 资源拓扑图,首页新增检查的统计数据,云检测、漏洞、主机等模块增加规则,对象存储增加京东云,操作审计增加金山云,镜像仓库新增设置别名。 感谢社区中小伙伴们的反馈&#…...
Rust入门(十六):手写web服务器和线程池
这一章将实现一个手写的 web server 和 多线程的服务器,用到之前学到的所有特性 简单的web server 作为一个 web 服务器,我们首先要能接收到请求,目前市面上的 web 服务大多数都是基于 HTTP 和 HTTPS 协议的,而他们有是基于 TCP…...
数据结构——第二章 线性表(1)——顺序结构
线性表1. 线性表1.1 线性表的定义1.1.1 访问型操作1.1.2 加工型操作1.2 线性表的顺序存储结构1.2.1 定义顺序表数据类型方法11.2.2 定义顺序表数据类型方法21.3 顺序表的基本操作实现1.3.1 顺序表的初始化操作1.3.2 顺序表的插入操作1.3.3 顺序表的删除操作1.3.4 顺序表的更新操…...
YOLO 格式数据集制作
目录 1. YOLO简介 2.分割数据集准备 3.代码展示 整理不易,欢迎一键三连!!! 1. YOLO简介 YOLO(You Only Look Once)是一种流行的目标检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Al…...
基于linux内核的驱动开发
1 字符设备驱动框架 1.1字符设备 定义:只能以一个字节一个字节的方式读写的设备,不能随机的读取设备中中的某一段数据,读取数据需要按照先后顺序。(字符设备是面向字节流的) 常见的字…...
找不到工作的测试员一大把,大厂却招不到优秀软件测试员?高薪难寻测试工程师。
测试工程师招了快一个月了,实在招不到合适的,已经在被解雇的边缘了。。。” 初级测试工程师非常多,但真正掌握测试思维、能力强的优秀测试太少了! 据我所知, 当下的测试人员不少状态都是这样的: 在工作中…...
buuctf Basic
buuctf Basic 1.Linux Labs 根据提示我们可以知道需要远程连接linux服务器,这里使用xshell进行如下配置 输入ssh的用户名root,密码123456 连接成功 构造命令 ls …/ 查看文件 查看flag cat …/flag.txt 为flag{8fee8783-1ed5-4b67-90eb-a1d603a0208…...
Silvaco TCAD新手必看:迁移率模型到底怎么选?从CONMOB到ANALYTIC的保姆级指南
Silvaco TCAD迁移率模型选择指南:从理论到实践的完整决策框架 半导体器件仿真中,迁移率模型的选择往往让初学者感到无从下手。我第一次接触Silvaco TCAD时,面对CONMOB、ANALYTIC、KLAASSEN等十几种模型选项,花了整整两周时间才弄明…...
跨境电商独立站技术搭建指南
跨境电商独立站技术搭建指南 学习主题:独立站建站技术全流程 建议时长:1~2 周 学习目标:掌握域名配置、建站工具、支付接入、物流对接与数据追踪的核心技术操作 一、适合读者与学习目标 本文适合有一定电脑操作基础、想从技术层面了解跨境电商独立站搭建的开发者或技术从业…...
中兴光猫工厂模式解锁工具:zteOnu深度技术解析与实战指南
中兴光猫工厂模式解锁工具:zteOnu深度技术解析与实战指南 【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 中兴光猫作为广泛部署的终端设备,其工厂模式提供了对底…...
解析2026年三星SDI化学价格趋势与一级代理市场定位优势
2026年三星SDI化学工程塑料价格预计整体稳中有升,涨幅在5%-8%区间,主要受高端产能集中、环保成本增加及新能源需求拉动影响。作为华南区域一级代理商,宏裕塑胶凭借源头直采与技术赋能双优势,可为下游企业提供稳定供应与15%-20%的采…...
使用 TaoToken CLI 工具一键为团队配置统一的开发环境
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 使用 TaoToken CLI 工具一键为团队配置统一的开发环境 为团队统一接入大模型服务时,常会遇到配置分散、环境不一致的问…...
SITS 2026议程背后隐藏的3条技术演进红线(附Gartner/IEEE双认证时间轴对比图)
更多请点击: https://intelliparadigm.com 第一章:2026奇点智能技术大会完整议程曝光:SITS 2026四大看点抢先看 全球瞩目的奇点智能技术大会(Singularity Intelligence Technology Summit, SITS)将于2026年5月12–15日…...
别再傻傻用Word翻译论文了!实测4款文档翻译工具,翻译狗和搜狗谁更香?
论文翻译工具终极对决:如何高效处理英文文献而不踩坑? 凌晨三点,电脑屏幕的蓝光打在脸上,眼前的英文文献仿佛天书。距离课程论文提交只剩12小时,而导师要求的文献综述还一字未动——这场景对研究生来说再熟悉不过。传统…...
期刊名称缩写标准化工具journal-abbrev:提升科研文献管理效率
1. 项目概述与核心价值如果你和我一样,长期在学术圈子里摸爬滚打,或者需要处理大量的文献引用,那你一定对期刊名称缩写这件事又爱又恨。爱的是,它能让你的参考文献列表变得紧凑、专业;恨的是,你永远记不住“…...
避坑指南:CPAL脚本中diagGenerateKeyFromSeed与diagSetParameterRaw的常见使用误区
CPAL脚本诊断安全解锁:密钥生成与参数设置的深度避坑指南 在汽车电子测试领域,诊断安全解锁是ECU自动化测试中的关键环节。许多工程师在使用CPAL脚本时,往往会在diagGenerateKeyFromSeed和diagSetParameterRaw这两个核心函数上栽跟头。本文将…...
保姆级教程:在NanoPi NEO上点亮ST7735S SPI小屏幕(全志H3主线内核)
全志H3主线内核下ST7735S屏幕驱动移植实战指南 当你第一次拿到NanoPi NEO和ST7735S屏幕时,可能会被SPI接口、设备树、内核模块这些概念搞得一头雾水。别担心,这篇教程将带你从零开始,用主线内核(Mainline)一步步点亮这…...
