当前位置：首页 > news >正文

【Deformable Convolution】可变形卷积记录

news 2026/2/9 1:36:04

every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog

0. 前言

可变形卷积记录

1. 正文

预印版：
Deformable Convolutional Networks v1
Deformable ConvNets v2: More Deformable, Better Results
发表版：
Deformable Convolutional Networks

1.1 简介

在这里插入图片描述

a普通卷积
b,c,d 可变卷积
在图a标准卷积核参数中添加一个方向参数（图b绿色箭头），使得卷积核可以变为任意形状。
其中，b,c是可变卷积的特殊形式。

1.2 为什么要用可变形卷积

我们知道，卷积核的目的是为了提取输入的特征，在传统卷积中卷积核通常是固定尺寸。这种卷积核存在的最大问题是对未知变化的适应性，泛化能力不强。

在这里插入图片描述

最上层的图像是大小不同物体的激活单元
中间层是为了得到顶层激活单元所进行的采样过程。
- 左图是标准的3*3采样
- 右图是非标准的采样，依然是3*3
最下层是为了得到中间层进行的采样。

可以发现，可变形卷积在采样时更贴近物体的形状和尺寸，而标准卷积无法做到。

1.3 实现

如前所述，可变形卷积在传统卷积的基础上增加了卷积核的方向向量，使得卷积核的形态更贴近物体，那么该过程是如何实现的？

开始和正常卷积一样，利用传统卷积提取特征图
把得到的特在图作为输入，对特征图再施加一个卷积，这么做的目的是为了得到可变形卷积的偏移量
上面两个特在图相加
偏移层是2N，是因为在平面上做移动，需要改变x和y两个方向。
在训练时，用于生成特征图的卷积核和用于生成偏移量的卷积核是同步学习的

注意： 特征图里面的值是浮点数，而坐标是整数。这里面需要涉及到类型转换，具体参考后面链接

请添加图片描述

参考9中，介绍了v2版本增加了对偏移增加权重，比较有意思，有兴趣的可以看下。

v1中引入的offset是要寻找有效信息的区域位置
v2中引入权重系数是要给找到的这个位置赋予权重，这两方面保证了有效信息的准确提取。

参考

[1] Deformable Convolutional Networks v1
[2] Deformable ConvNets v2: More Deformable, Better Results
[3] Deformable Convolutional Networks
[4] https://blog.csdn.net/LEEANG121/article/details/104234927
[5] https://blog.csdn.net/scut_salmon/article/details/97050908
[6] https://blog.csdn.net/mykeylock/article/details/77746499
[7] https://blog.csdn.net/kevin_zhao_zl/article/details/89319756
[8] https://blog.csdn.net/jiangqixing0728/article/details/126269423
[9] https://www.jianshu.com/p/55ddeb498c65

【Deformable Convolution】可变形卷积记录

0. 前言

1. 正文

1.1 简介

1.2 为什么要用可变形卷积

1.3 实现

参考

相关文章：

【Deformable Convolution】可变形卷积记录

Oracle-Mysql 函数转换

【Kafka】一.认识Kafka

Linux软件管理YUM

【自学MYSQL】MySQL Windows安装

Linux c编程之常用技巧

21- 朴素贝叶斯 (NLP自然语言算法) (算法)

设计模式第七讲-外观模式、适配器模式、模板方法模式详解

flutter-第1章-配置环境

“消息驱动、事件驱动、流 ”的消息模型

量化股票配对交易可以用Python语言实现吗？

机器学习洞察 | 一文带你“讲透” JAX

OpenFaaS介绍

【算法设计与分析】STL容器、递归算法、分治法、蛮力法、回溯法、分支限界法、贪心法、动态规划；各类算法代码汇总

vue初识

火山引擎入选《2022 爱分析 · DataOps 厂商全景报告》，旗下 DataLeap 产品能力获认可

java-spring_bean的生命周期

微服务相关概念

论文解读：（TransA）TransA: An Adaptive Approach for Knowledge Graph Embedding

js将数字转十进制+十六进制（联动el-ui下拉选择框）

国防科技大学计算机基础课程笔记02信息编码

label-studio的使用教程(导入本地路径)

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

Python实现prophet 理论及参数优化

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现，论文初版实现

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

以光量子为例，详解量子获取方式

VM虚拟机网络配置（ubuntu24桥接模式）：配置静态IP

Web中间件--tomcat学习