当前位置：首页 > news >正文

论文笔记：Image Anaimation经典论文-运动关键点模型（Monkey-Net）

news 2026/2/9 2:15:39

在这里插入图片描述
Monkey-Net（MOviNg KEYpoints）
paper: https://arxiv.org/pdf/1812.08861, CVPR 2019
code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master

本文贡献

结合下图，贡献如下：

设计了一个无监督关键点检测模块，用于提取物体关键点。
- KeyPoint Detector: 输入为参考图像和驱动视频帧，输出为稀疏关键点。
- 由于训练过程是无监督的，因此不需要标注关键点信息。
- 实际上，两帧之间稀疏关键点差异可以看做一种紧致的运动表征。
设计了密集运动估计网络：用于从稀疏关键点中重建运动热图（motion heatmaps），热图用于更好地表征运动信息。
- Dense Motion prediction network：输入为1中的稀疏关键点，输出为运动热图。以此来估计参考图像和驱动图像之间的光流。
- 这样做有两个动机：
  1. 使得1中关键点检测网络不仅关注物体的结构信息，也关注运动信息。使得自监督的关键点检测网络检测到的关键点必需落在运动大的位置。
  2. 传统encoder-decoder密集预测模型未考虑到输出输出之间较大的像素不对齐问题。增加光流信息希望促进输入输出之间差异比较大时的对齐。
设计了一个运动迁移网络：使用运动热图，和从从参考图像中提取的内容表征生成视频帧图像。
Motion Transfer network：输入为参考图像和运动热图，输出为重构后的视频帧。经典encoder-decoder结构。

训练过程核心思路：

生成器G需要根据参考图像、参考图像关键点、驱动图像关键点三个部分重建出驱动图像( $x^{'}$ )；通过这个过程，参考图像( $x$ )和驱动图像之间( $x^{'}$ )的关系被隐式建模。

实现细节

无监督关键点检测网络：

encoder-decoder结构，输出为K个HxW的heatmap，每个heatmap对应一个关键点，使用softmax将输出归一化至[0, 1]。
使用heatmap的动机：更好地适配卷积网络。
为了学习关键点位置信息，将每个heatmap拟合至一个高斯分布，使得模型间接学习关键点。
模型不仅拟合了关键点的位置信息，还拟合了关键点的协方差矩阵。目的是同时学习关键点的位置和方向信息。以人的腿为例，关键点不仅包括腿部关键点的位置信息，还可以学习到腿的运动信息。

运动迁移网络：

主干网络还是U-Net like 的encoder-decoder结构，增加了变形模块(Deformation module)融入光流信息。
核心内容：使用一个warp function将光流信息和encoder中特征进行融合。本质是一个可微的非线性变换，具体操作看代码吧：

def deform_input(self, inp, deformations_absolute):# 获取 deformations_absolute 的形状bs, d, h_old, w_old, _ = deformations_absolute.shape# 获取 inp 的形状_, _, _, h, w = inp.shape# 调整 deformations_absolute 的维度顺序，从 (bs, d, h_old, w_old, _) 变为 (bs, _, d, h_old, w_old)deformations_absolute = deformations_absolute.permute(0, 4, 1, 2, 3)# 使用插值方法调整 deformations_absolute 的大小，使其与 inp 的大小匹配deformation = F.interpolate(deformations_absolute, size=(d, h, w), mode=self.interpolation_mode)# 再次调整 deformation 的维度顺序，从 (bs, _, d, h, w) 变为 (bs, d, h, w, _)deformation = deformation.permute(0, 2, 3, 4, 1)# 使用 grid_sample 函数对 inp 进行变形deformed_inp = F.grid_sample(inp, deformation)# 返回变形后的输入return deformed_inp

从稀疏关键点到密集光流

密集运动估计网络M输入包括两个：1. 参考图像关键点和驱动图像关键点map的差值。2. 参考图像本身。
假设在每个物体上的关键点是局部刚性的，那么光流预测问题就变为：根据关键点预测掩模，这些掩模根据关键点信息将物体刚性的分成不同部分。
预测的密集光流可根据预测的刚性掩模和光流信息点乘得到。
注意：最终预测的光流信息，有一个粗粒度结果和一个残差结果相加得到。

在这里插入图片描述

网络训练

整个网络训练是一个端到端的过程
损失函数包括：对抗损失、特征匹配损失

结果

定量指标就不放了。这里自监督的可学习关键点很有意思，每个物体的关键点都不一样，即使是类内的关键点也会有差异。
在这里插入图片描述

论文笔记：Image Anaimation经典论文-运动关键点模型（Monkey-Net）

Monkey-Net（MOviNg KEYpoints） paper: https://arxiv.org/pdf/1812.08861, CVPR 2019 code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master 相关工作视频生成演变过程： spatio-temporal network: 如基于GAN网络的生成模…...

编程日记 2024/6/4 17:45:43

Kibana创建ElasticSearch 用户角色

文章目录 1, ES 权限参考2, 某应用的管理员权限：可以open/close/delete/cat/read/write 索引3, 某应用的读写权限：可以cat/read/write 索引 （不能删除索引或数据）4, 某应用的只读权限 1, ES 权限参考 https://www.elastic.co/gui…...

编程日记 2024/6/4 17:42:39

Vue基础（2）响应式基础

一. reactive() 在 Vue3 中，可以使用 reactive() 创建一个响应式对象或数组： <script setup> import { reactive } from vueconst state reactive({ count: 0 }) </script><template><button click"state.count">{…...

编程日记 2024/6/4 17:41:37

Mysql基础教程（15）：别名

MySQL 别名在本文中，我们讨论了 MySQL 中的列别名，表别名和派生表别名，以及使用别名来简化 SQL 和提高 SQL 的可读性。如果在一个 SQL 中涉及到多个表，我们需要使用 table_name.column_name 这样的方式来引用每个表的字段&…...

编程日记 2024/6/4 17:38:34

SpringCloud 微服务中网关如何记录请求响应日志？

在基于SpringCloud开发的微服务中，我们一般会选择在网关层记录请求和响应日志，并将其收集到ELK中用作查询和分析。今天我们就来看看如何实现此功能。日志实体类首先我们在网关中定义一个日志实体，用于组装日志对象 Data public class …...

编程日记 2024/6/4 17:37:33

【运维项目经历|028】Cobbler自动化部署平台构建项目

🍁博主简介： 🏅云计算领域优质创作者 🏅2022年CSDN新星计划python赛道第一名 🏅2022年CSDN原力计划优质作者 🏅阿里云ACE认证高级工程师 🏅阿里云开发者社区专…...

编程日记 2024/6/4 17:34:29

“物联网安全：万物互联背景下的隐私保护与数据安全策略“

在物联网（IoT）时代，随着智能设备的普及和万物互联的加速，隐私保护与数据安全成为了亟待解决的关键问题。以下是一些重要的隐私保护与数据安全策略，以确保在万物互联背景下信息的安全： 1. 加强设备安全&…...

编程日记 2024/6/4 17:33:28

LeetCode216组合总和3

题目描述找出所有相加之和为 n 的 k 个数的组合，且满足下列条件：只使用数字1到9。每个数字最多使用一次。返回所有可能的有效组合的列表。该列表不能包含相同的组合两次，组合可以以任何顺序返回。解析递归加剪枝，搜索长度达…...

编程日记 2024/6/4 17:31:26

微软找腾讯接盘，Windows直接安装手机APP体验起飞了

熟悉微软的同学都知道微软有个传统艺能——什么好用砍什么。比如 Win10 砍掉了还算方便的小娜，推出 Win11 砍掉了 Win10 上面好用的磁贴功能等。上一秒用户还在夸奖点赞。下一秒就给你砍掉，顺带还塞一堆 BUG 给你。但没办法，PC 近乎垄断…...

编程日记 2024/6/4 17:30:25

【Springcloud微服务】MybatisPlus下篇

🔥 本文由程序喵正在路上原创，CSDN首发！ 💖 系列专栏：Springcloud微服务 🌠 首发时间：2024年6月4日 🦋 欢迎关注🖱点赞👍收藏🌟留言&#x1f43…...

编程日记 2024/6/4 17:28:22

i18n-demo

一、demo 1、资源文件准备如我需要对menu、logMsg内容做国际化。 resources下放各个语言文件，直接放resources下都行。我是新建了一个myi18n文件夹， （1）然后在myi18n上点击New--Resource Bundle （2）在…...

编程日记 2024/6/4 17:27:21

[Leetcode] 0-1背包和完全背包

46. 携带研究材料纯01背包（非应用）：只能选择一次物品 dp[j]：容量为j的背包所能装的最大容量容量需要倒序 416. 分割等和子集能否装满 dp[j]：容量为j的背包所能装的最大容量 1049. 最后一块石头的重量 II 尽可…...

编程日记 2024/6/4 17:26:19

自定义类型:联合体和枚举

1. 联合体类型的声明 2. 联合体的特点 3. 联合体大小的计算 4. 枚举类型的声明 5. 枚举类型的优点 6. 枚举类型的使用欢迎关注熬夜学编程创作不易，请多多支持感谢大家的阅读、点赞、收藏和关注如有问题，欢迎指正 1. 联合体 1.1 联合体类型的声…...

编程日记 2024/6/4 17:25:18

【Cityengine】Cityengine生产带纹理的建筑模型导入UE4/UE5（下）

【Cityengine】Cityengine生产带纹理的建筑模型导入UE4/UE5（下） 一、导出数据（2022中文版案例）二、安装datasmith插件三、导入数据四、检查导入材质是否正常五、编辑替换材质六、安装模型编辑插件七、编辑替换建筑规则一、导出数…...

编程日记 2024/6/4 17:24:17

详解51种企业应用架构模式

导读：企业应用包括哪些？它们又分别有哪些架构模式？世界著名软件开发大师Martin Fowler给你答案 01、什么是企业应用我的职业生涯专注于企业应用，因此，这里所谈及的模式也都是关于企业应用的。（企业应用还…...

编程日记 2024/6/4 17:23:14

【十年java搬砖路】Jumpserver docker版安装及配置Ldap登陆认证

Jumpserver docker 安装启动教程拉取镜像 docker pull JumpServer启动进行前确保有Redis 和Mysql 创建jumperServer数据库在MYSQL上执行创建数据库登陆MYSQL mysql -u root -p 创建Jumperserveri库 create database jumpserver default charset utf8mb4;可以为jumperSe…...

编程日记 2024/6/4 17:22:12

C\C++内存管理（未完结）

文章目录一.C\C内存分布二.C语言中动态内存管理方式：malloc/calloc/realloc/free三.C内存管理方式3.1.new/delete操作内置类型3.2.new和delete操作自定义类型四.operator new与operator delete函数（重要点进行讲解）4.1. operator new与oper…...

编程日记 2024/6/4 17:19:08

一个小时搞定JAVA面向对象（5）——抽象与接口

文章目录抽象抽象的注意事项static\final\private是否可以修饰抽象方法继承和抽象知识点回顾接口接口实现总结抽象方法默认方法静态方法成员变量接口的特点接口和抽象类的区别抽象关键字: abstract 抽象方法: 修饰符 abstract 返回值类型方法名(参数); 抽象类: public a…...

编程日记 2024/6/4 17:18:05

图像关键特征描述方法-小目标

图像关键特征描述方法主要包括以下几种： SIFT（尺度不变特征变换）: SIFT是一种广泛使用的特征描述方法，它通过尺度空间和梯度方向直方图来描述图像中的关键点。SIFT特征描述具有尺度不变性和旋转不变性，对于光照和视角变化也具有一定的鲁棒性。 SURF（加速稳健特征）: SURF…...

编程日记 2024/6/4 17:17:03

【qt15】windeployqt 安装依赖

debug模式vs可以使用qt插件新建qt文件 D:\Qt15\5.15.2\msvc2019\bin\windeployqt.exe Warning: Cannot find Visual Studio installation directory, VCINSTALLDIR is not set.D:\Qt15\5.15.2\msvc2019\bin\windeployqt.exe .\filecopier.exeWindows PowerShell Copyright (C) …...

编程日记 2024/6/4 17:15:01

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中，可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行，可以在脚本开头添加 set e 命令来取消该设置。举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令，并忽略错误 rm somefile…...

编程新知 2025/9/11 15:27:32

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/12/11 18:28:17

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2026/1/28 2:18:42

黑马Mybatis

Mybatis 表现层：页面展示业务层：逻辑处理持久层：持久数据化保存在这里插入图片描述 Mybatis快速入门 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6501c2109c4442118ceb6014725e48e4.png //logback.xml <?xml ver…...

编程新知 2026/1/22 14:22:27

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件： 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

编程新知 2026/2/7 19:53:11

Cesium1.95中高性能加载1500个点

一、基本方式： 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...

编程新知 2025/12/17 2:10:10

DBAPI如何优雅的获取单条数据

API如何优雅的获取单条数据案例一对于查询类API，查询的是单条数据，比如根据主键ID查询用户信息，sql如下： select id, name, age from user where id #{id}API默认返回的数据格式是多条的，如下： {&qu…...

编程新知 2026/2/2 22:06:13

C# SqlSugar：依赖注入与仓储模式实践

C# SqlSugar：依赖注入与仓储模式实践在 C# 的应用开发中，数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护，许多开发者会选择成熟的 ORM（对象关系映射）框架，SqlSugar 就是其中备受…...

编程新知 2025/11/25 6:49:02

Xen Server服务器释放磁盘空间

disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

编程新知 2025/11/19 6:04:18

技术栈RabbitMq的介绍和使用

目录 1. 什么是消息队列？2. 消息队列的优点3. RabbitMQ 消息队列概述4. RabbitMQ 安装5. Exchange 四种类型5.1 direct 精准匹配5.2 fanout 广播5.3 topic 正则匹配 6. RabbitMQ 队列模式6.1 简单队列模式6.2 工作队列模式6.3 发布/订阅模式6.4 路由模式6.5 主题模式…...

编程新知 2026/1/23 10:10:53

相关工作

视频生成演变过程：

Image Anaimation:*