【Deformable Convolution】可变形卷积记录
every blog every motto: You can do more than you think.
https://blog.csdn.net/weixin_39190382?type=blog
0. 前言
可变形卷积记录
1. 正文
预印版:
Deformable Convolutional Networks v1
Deformable ConvNets v2: More Deformable, Better Results
发表版:
Deformable Convolutional Networks
1.1 简介

- a普通卷积
- b,c,d 可变卷积
在图a标准卷积核参数中添加一个方向参数(图b绿色箭头),使得卷积核可以变为任意形状。
其中,b,c是可变卷积的特殊形式。
1.2 为什么要用可变形卷积
我们知道,卷积核的目的是为了提取输入的特征,在传统卷积中卷积核通常是固定尺寸。这种卷积核存在的最大问题是对未知变化的适应性,泛化能力不强。

- 最上层的图像是大小不同物体的激活单元
- 中间层是为了得到顶层激活单元所进行的采样过程。
- 左图是标准的3*3采样
- 右图是非标准的采样,依然是3*3
- 最下层是为了得到中间层进行的采样。
可以发现,可变形卷积在采样时更贴近物体的形状和尺寸,而标准卷积无法做到。
1.3 实现
如前所述,可变形卷积在传统卷积的基础上增加了卷积核的方向向量,使得卷积核的形态更贴近物体,那么该过程是如何实现的?
- 开始和正常卷积一样,利用传统卷积提取特征图
- 把得到的特在图作为输入,对特征图再施加一个卷积,这么做的目的是为了得到可变形卷积的偏移量
- 上面两个特在图相加
- 偏移层是2N,是因为在平面上做移动,需要改变x和y两个方向。
- 在训练时,用于生成特征图的卷积核和用于生成偏移量的卷积核是同步学习的
注意: 特征图里面的值是浮点数,而坐标是整数。这里面需要涉及到类型转换,具体参考后面链接


参考9中,介绍了v2版本增加了对偏移增加权重,比较有意思,有兴趣的可以看下。
- v1中引入的offset是要寻找有效信息的区域位置
- v2中引入权重系数是要给找到的这个位置赋予权重,这两方面保证了有效信息的准确提取。
参考
[1] Deformable Convolutional Networks v1
[2] Deformable ConvNets v2: More Deformable, Better Results
[3] Deformable Convolutional Networks
[4] https://blog.csdn.net/LEEANG121/article/details/104234927
[5] https://blog.csdn.net/scut_salmon/article/details/97050908
[6] https://blog.csdn.net/mykeylock/article/details/77746499
[7] https://blog.csdn.net/kevin_zhao_zl/article/details/89319756
[8] https://blog.csdn.net/jiangqixing0728/article/details/126269423
[9] https://www.jianshu.com/p/55ddeb498c65
相关文章:
【Deformable Convolution】可变形卷积记录
every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言 可变形卷积记录 1. 正文 预印版: Deformable Convolutional Networks v1 Deformable ConvNets v2: More Deformable, Better Results 发表版…...
Oracle-Mysql 函数转换
Oracle-Mysql 函数转换limit <> ROWNUMcast <> TO_NUMBERcast as signedcast as unsignedregexp a_\\d <> REGEXP_LIKEschema() <> SELECT USER FROM DUALinformation_schema.COLUMNS表 <> ALL_TAB_COLUMNS表unix_timestampfrom_unixtime <&g…...
【Kafka】一.认识Kafka
kafka是一个分布式消息队列。由 Scala 开发的高性能跨语言分布式消息队列,单机吞吐量可以到达 10w 级,消息延迟在 ms 级。具有高性能、持久化、多副本备份、横向扩展能力。 生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。 一般在…...
Linux软件管理YUM
目录 yum配置文件 创建仓库 yum查询功能 yum安装与升级功能 yum删除功能 yum仓库产生的问题和解决之道 yum与dnf 网络源 YUM就是通过分析RPM的标头数据后,根据各软件的相关性制作出属性依赖时的解决方案,然后可以自动处理软件的依赖属性问题&…...
【自学MYSQL】MySQL Windows安装
MySQL Windows安装 MySQL Windows下载 首先,我们打开 MySQL 的官网,网址如下: https://dev.mysql.com/downloads/mysql/在官网的主页,我们首先根据我们的操作系统,选择对应的系统,这里我们选择 Windows&…...
Linux c编程之常用技巧
一、说明 在Linux C的实际编程应用中,有很多有用的实践技巧,编程中掌握这些知识,会对编程有事半功倍的效果。 二、常用技巧 2.1 if 变量条件的写法 main.c: #include <stdio.h>int main(int argc, char *argv[]) {int a =...
21- 朴素贝叶斯 (NLP自然语言算法) (算法)
朴素贝叶斯要点 概率图模型算法往往应用于NLP自然语言处理领域。根据文本内容判定 分类 。 概率密度公式: 高斯朴素贝叶斯算法: from sklearn.naive_bayes import GaussianNB model GaussianNB() model.fit(X_train,y_train) 伯努利分布朴素贝叶斯算法 fro…...
设计模式第七讲-外观模式、适配器模式、模板方法模式详解
一. 外观模式 1. 背景 在现实生活中,常常存在办事较复杂的例子,如办房产证或注册一家公司,有时要同多个部门联系,这时要是有一个综合部门能解决一切手续问题就好了。 软件设计也是这样,当一个系统的功能越来越强&…...
flutter-第1章-配置环境
flutter-第1章-配置环境 本文针对Windows系统。 一、安装Android Studio 从Android Studio官网下载最新版本,一直默认安装就行。 安装完成要下载SDK,可能会需要科学上网。 打开AS,随便创建一个新项目。 点击右上角的SDK Manager 找到SDK…...
“消息驱动、事件驱动、流 ”的消息模型
文章目录背景消息驱动 Message-Driven事件驱动 Event-Driven流 Streaming事件规范标准简介: 本文旨在帮助大家对近期消息领域的高频词“消息驱动(Message-Driven),事件驱动(Event-Driven)和流(S…...
量化股票配对交易可以用Python语言实现吗?
量化股票配对交易可以用Python语言实现吗?Python 是一种流行的编程语言,可用于所有类型的领域,包括数据科学。有大量软件包可以帮助您实现目标,许多公司使用 Python 来开发与金融界相关的以数据为中心的应用程序和科学计算。 最重…...
机器学习洞察 | 一文带你“讲透” JAX
在上篇文章中,我们详细分享了 JAX 这一新兴的机器学习模型的发展和优势,本文我们将通过 Amazon SageMaker 示例展示如何部署并使用 JAX。JAX 的工作机制JAX 的完整工作机制可以用下面这幅图详细解释:图片来源:“Intro to JAX” video on YouT…...
OpenFaaS介绍
FaaS 云计算时代出现了大量XaaS形式的概念,从IaaS(Infrastructure as a Service)、PaaS(Platform as a Service)、SaaS(Software as a Service)到容器云引领的CaaS(Containers as a Service),再到火热的微服务架构,它们都在试着将各种软、硬…...
【算法设计与分析】STL容器、递归算法、分治法、蛮力法、回溯法、分支限界法、贪心法、动态规划;各类算法代码汇总
文章目录前言一、STL容器二、递归算法三、分治法四、蛮力法五、回溯法六、分支限界法七、贪心法八、动态规划前言 本篇共为8类算法(STL容器、递归算法、分治法、蛮力法、回溯法、分支限界法、贪心法、动态规划),则各取每类算法中的几例经典示例进行展示。 一、STL容…...
vue初识
第一次接触vue,前端的html,css,jquery,js学习也有段时间了,就照着B站的视频简单看了一些,了解了一些简单的用法,这边做一个记录。 官网 工具:使用VSCode以及Live Server插件(能够实时预览) 第…...
火山引擎入选《2022 爱分析 · DataOps 厂商全景报告》,旗下 DataLeap 产品能力获认可
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 2 月 9 日,国内领先的数字化市场研究与咨询机构爱分析发布了《2022 爱分析DataOps 厂商全景报告》(以下简称报告),报…...
java-spring_bean的生命周期
生命周期:从创建到消亡的完整过程初始化容器 1. 创建对象(内存分配 ) 2. 执行构造方法 3. 执行属性注入(set操作) 4. 执行bean初始化方法 使用bean 执行业务操作 关闭/销毁容器 1.执行bean销毁方法 bean销毁时机 容…...
微服务相关概念
一、谈谈你对微服务的理解,微服务有哪些优缺点?微服务是由Martin Fowler大师提出的。微服务是一种架构风格,通过将大型的单体应用划分为比较小的服务单元,从而降低整个系统的复杂度。优点:1、服务部署更灵活࿱…...
论文解读:(TransA)TransA: An Adaptive Approach for Knowledge Graph Embedding
简介 先前的知识表示方法:TransE、TransH、TransR、TransD、TranSparse等。的损失函数仅单纯的考虑hrh rhr和ttt在某个语义空间的欧氏距离,认为只要欧式距离最小,就认为h和th和th和t的关系为r。显然这种度量指标过于简单,虽然先…...
js将数字转十进制+十六进制(联动el-ui下拉选择框)
十进制与十六进制的整数转化一、十进制转十六进制二、十六进制转十进制三、联动demo一、十进制转十六进制 正则表达式: /^([0-9]||([1-9][0-9]{0,}))$/解析:[0-9]代表个位数,([1-9][0-9]{0,})代表十位及以上 二、十六进制转十进制 正则表达…...
基于MCP协议的智能文档处理工具simdoc-mcp:从RAG原理到Claude集成实战
1. 项目概述:从“文档理解”到“智能交互”的范式跃迁最近在折腾一个挺有意思的开源项目,叫simdoc-mcp。乍一看这个名字,可能有点摸不着头脑,svd-ai-lab是背后的团队,simdoc是核心,mcp是关键协议。简单来说…...
Transmission密码安全加固:从配置文件到命令行实战
1. Transmission密码安全加固的必要性 最近在帮朋友排查一个奇怪的网络问题时,意外发现他路由器上的Transmission客户端竟然还在使用默认密码。这让我惊出一身冷汗——这相当于把家门钥匙插在门锁上啊!作为一款广泛使用的BT客户端,Transmiss…...
【审计专栏-监督监管领域】【信息科学与工程学】【社会科学】第十篇 社会底层核心规则(核心权力、核心利益、核心资源绑定、私下运作、关键价值交换、上下博弈)04
模型046:企业复杂利益链与多方利益博弈模型 1. 模型概述 项目 内容 模型名称 企业复杂利益链与多方利益博弈模型 核心场景 一家大型建筑企业“宏建集团”中标某市的地铁延长线建设项目。项目涉及总包方(宏建)、多个分包商(土建、机电、装修等)、材料供应商、监理…...
量子计算在供应链风险模拟中的革命性应用
1. 量子计算在供应链风险模拟中的革命性突破零售供应链风险管理正面临前所未有的挑战。2021年全球半导体短缺导致汽车行业损失2100亿美元,而疫情期间超市缺货率超过15%——这些危机暴露了传统风险模型的根本缺陷:它们假设供应链节点故障是独立事件&#…...
CIPHR技术:硬件IP保护的密码学革新与实践
1. 硬件IP保护的技术挑战与CIPHR的创新价值在全球半导体产业链分工日益精细的今天,设计公司不得不将芯片制造环节外包给第三方代工厂,这种模式虽然降低了成本,却也带来了严重的安全隐患。想象一下,你花费数月精心设计的电路图&…...
基于Godot引擎的模块化RTS游戏框架开发实战指南
1. 项目概述:当开放世界RTS遇上Godot引擎如果你和我一样,是个对即时战略游戏(RTS)有情怀,同时又对Godot引擎的轻量与高效念念不忘的开发者,那么看到“lampe-games/godot-open-rts”这个项目标题时ÿ…...
Claude代码生成工具:AI编程协作新范式与工程实践
1. 项目概述:一个专为Claude设计的代码生成与协作工具最近在跟几个做AI应用开发的朋友聊天,大家普遍反映一个痛点:虽然像Claude这样的AI助手在代码理解和生成上表现不错,但实际工作流中还是存在不少摩擦点。比如,生成的…...
轻量级视频稳定技术:EfficientMotionPro与OnlineSmoother解析
1. 轻量级视频稳定技术概述视频稳定技术是现代计算机视觉领域的重要研究方向,其核心目标是消除因相机抖动导致的画面不稳定现象。传统视频稳定方法通常依赖于复杂的光流计算或3D场景重建,这些方法虽然效果稳定,但计算开销巨大,难以…...
AI代码助手评测体系构建:从原理到实践的完整指南
1. 项目概述:AI代码助手评测,到底在测什么?最近在GitHub上看到一个挺有意思的项目,叫ameerkhan9394/ide-ai-benchmark。光看名字,你大概能猜到,这是一个给集成开发环境(IDE)里的AI助…...
Switch游戏安装终极指南:Awoo Installer 让你的游戏体验更简单高效
Switch游戏安装终极指南:Awoo Installer 让你的游戏体验更简单高效 【免费下载链接】Awoo-Installer A No-Bullshit NSP, NSZ, XCI, and XCZ Installer for Nintendo Switch 项目地址: https://gitcode.com/gh_mirrors/aw/Awoo-Installer 还在为Switch游戏安…...
