改进YOLO系列 | CVPR 2021 | Involution:超越convolution和self-attention的神经网络算子
Involution:超越卷积和自注意力的新型神经网络算子(中文综述)
简介
Involuton是CVPR 2021上提出的新型神经网络算子,旨在超越卷积和自注意力,提供更高效、更具表达力的特征提取能力。
Involution原理
Involution的核心思想是将卷积核分解为多个核点,并通过注意力机制对这些核点进行加权融合。 这使得Involution能够捕获更复杂的特征信息,同时保持较低的计算复杂度。
Involution应用场景
Involution可以应用于各种计算机视觉任务,例如图像分类、目标检测、语义分割等。 它可以作为卷积或自注意力的替代或补充,以提高模型性能。
Involution算法实现
Involution的实现主要包括以下步骤:
- 特征提取: 使用标准卷积层提取输入图像的特征。
- 核点分解: 将卷积核分解为多个核点。
- 注意力计算: 对每个核点计算注意力权重。
- 特征融合: 使用注意力权重对核点进行加权融合。
- 输出: 生成最终的输出特征。
Involution代码实现
Involution:完整代码实现(中文解释)
依赖库
首先,我们需要导入必要的库:
import torch
import torch.nn as nn
import torch.nn.functional as F
定义核点分解函数
Involution核心的第一步是将卷积核分解为多个核点。 以下代码定义了一个简单的核点分解函数:
def kernel_decompose(kernel):# 将卷积核分解为多个核点kernel_points = kernel.view(-1, 1, 1, 1) # 将卷积核展开为一维向量return kernel_points
定义注意力计算模块
Involution使用注意力机制对核点进行加权融合。 以下代码定义了一个简单的注意力计算模块:
class AttentionModule(nn.Module):def __init__(self, channels):super(AttentionModule, self).__init__()self.query_conv = nn.Conv2d(channels, channels // 2, kernel_size=1)self.key_conv = nn.Conv2d(channels, channels // 2, kernel_size=1)self.value_conv = nn.Conv2d(channels, channels, kernel_size=1)def forward(self, feature, kernel_points):# 计算注意力权重q = self.query_conv(feature)k = self.key_conv(feature)v = self.value_conv(feature)attention = torch.bmm(q, k.transpose(0, 1)) # 计算注意力矩阵attention = F.softmax(attention, dim=1) # 计算注意力权重# 加权融合核点out = torch.bmm(attention, v) * kernel_pointsreturn out
定义Involution层
Involution层继承自 nn.Module
类,并实现了Involution操作。
class InvolutionLayer(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0):super(InvolutionLayer, self).__init__()self.kernel_decompose = kernel_decompose # 核点分解函数self.attention_module = AttentionModule(in_channels) # 注意力计算模块self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)def forward(self, feature):# 卷积核分解kernel_points = self.kernel_decompose(self.conv.weight)# 注意力计算out = self.attention_module(feature, kernel_points)# 残差连接out += self.conv(feature)return out
完整示例代码
以下代码展示了如何使用Involution层进行图像分类:
import torch
import torch.nn as nn
import torch.nn.functional as F# 定义Involution层
involution_layer = InvolutionLayer(3, 64, 3)# 输入图像
image = torch.randn(1, 3, 224, 224)# Involution操作
out = involution_layer(image)print(out.shape) # 输出特征图形状
代码解释
- 导入必要的库:
torch
、torch.nn
、torch.nn.functional
。 - 定义核点分解函数
kernel_decompose
,将卷积核分解为多个核点。 - 定义注意力计算模块
AttentionModule
,使用注意力机制对核点进行加权融合。 - 定义Involution层
InvolutionLayer
,继承自nn.Module
类,并实现了Involution操作。 - 创建Involution层实例
involution_layer
,指定输入通道数、输出通道数、卷积核大小、步长和填充。 - 创建输入图像
image
。 - 使用Involution层进行Involution操作,并输出结果
out
。
注意
- 以上代码仅供参考,实际应用中需要根据任务和数据集进行调整。
- Involution是一种较为复杂的模型,需要有一定的深度学习基础才能理解和实现。
Involution部署测试
Involution的部署测试可以参考以下步骤:
- 模型训练: 使用训练数据集训练Involution模型。
- 模型评估: 使用测试数据集评估模型的性能。
- 模型部署: 将模型部署到生产环境。
文献材料链接
- Involution: Involutions for Efficient and Accurate Vision
应用示例产品
Involution可以应用于各种基于计算机视觉的应用,例如:
- 智能视频监控
- 自动驾驶
- 医学图像分析
总结
Involution是一种很有潜力的新型神经网络算子,它有望在各种计算机视觉任务中发挥重要作用。
影响
Involution的提出为神经网络架构设计提供了新的思路,并有可能引发后续研究的热潮。
未来扩展
Involution可以进一步扩展到其他深度学习任务,例如自然语言处理、语音识别等。
注意: 以上内容仅供参考,具体实现可能需要根据实际情况进行调整。
参考资料
- Involution: Involutions for Efficient and Accurate Vision
相关文章:
改进YOLO系列 | CVPR 2021 | Involution:超越convolution和self-attention的神经网络算子
Involution:超越卷积和自注意力的新型神经网络算子(中文综述) 简介 Involuton是CVPR 2021上提出的新型神经网络算子,旨在超越卷积和自注意力,提供更高效、更具表达力的特征提取能力。 Involution原理 Involution的…...
落地速度与效果之争,通用VS垂直,我的观点和预测。
标题:AI大模型战场:通用VS垂直,谁将领跑落地新纪元? 摘要:随着人工智能技术的飞速发展,大模型的应用场景日益广泛。在这场竞赛中,通用大模型和垂直大模型各有优势,落地速度和可能性也…...
【Android面试八股文】在Android中,出现ClassNotFound的有可能的原因是什么?
在Android环境下类未找到的可能原因 在Android环境下,类未找到的可能原因包括但不限于以下几点: 类路径问题:Android应用使用的类通常存储在APK文件中。如果类所在的APK文件没有被正确加载,或者应用的类路径配置有误,就会导致类未找到的错误。 多DEX文件加载问题:在一些…...
模板引擎与 XSS 防御
在 View 层,可以解决 XSS 问题。在本书的“跨站脚本攻击”一章中,阐述了“输入检查” 与“输出编码”这两种方法在 XSS 防御效果上的差异。XSS 攻击是在用户的浏览器上执行的, 其形成过程则是在服务器端页面渲染时,注入了恶意的 H…...

vue3轮播图怎么做
先看效果 实现代码 <n-carouseleffect"card"dot-type"line"draggable:autoplay"!isHovered":current-index"currentIndex"prev-slide-style"transform: translateX(-150%) translateZ(-450px);opacity:1"next-slide-st…...

ubuntu中安装docker并换源
使用 Ubuntu 的仓库安装 Docker sudo apt update现在,你可以使用以下命令在 Ubuntu 中安装 Docker 以及 Docker Compose: sudo apt install docker.io docker-composeDocker 包被命名为 docker.io,因为在 Docker 出现之前就已经存在一个名为…...

HTML静态网页成品作业(HTML+CSS)—— 环保主题介绍网页(5个页面)
🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有5个页面。 二、作品演示 三、代…...

深入了解RSA加密算法
目录 前言 一、什么是RSA? 二、RSA加密的基本概念 1.非对称加密 2.密钥生成 3.加密和解密 三、RSA加密的工作原理 四、RSA的应用场景 五、RSA加密解密的实现 六、RSA算法的局限性及改进措施 前言 在当今的数字化时代,信息的安全性成为了人们关注…...
github基础使用
前言 将用到的github指令记录下来,持续更新,方便随时查找学习。 一、github用到的指令 1、我们从github克隆下来的代码版本一般都是master主分支,我们要建立自己的分支进行修改: //git branch //查看目前的分支/* * master /…...
Docker使用心得
Docker使用心得 最近使用Docker比较频繁,特此想记录一下,方便后续查找。 Docker常用命令Docker如何配置使用GPU环境?如何使用Dockerfile构建镜像?如何使用docker compose 实例化容器? Docker如何配置使用GPU环境 参…...

QListWidget 插入 item,item显示自定义界面
代码示意: class ItemWidget_action_cfg_w(QWidget):... # 如下方法是在指定item下插入新的item def __do_add_item(self, item):# 获取当前item rowrow self.__list_w.indexFromItem(item).row()# 注意这里没有父类,解释见后面说明new_item QList…...
Python写一个ERP系统和agent智能体协同仓库和订单的案例
这是一个关于使用Python编写一个简单的ERP系统,并与Agent智能体协同完成仓库和订单管理的案例。在这个案例中,我们将使用Python的第三方库sqlite3进行数据库操作,以及discord库实现与Agent智能体的通信。 1. 首先,安装所需库&…...

【计算机网络】已解决:“‘ping‘ 不是内部或外部命令,也不是可运行的程序或批处理文件”报错
文章目录 一、问题分析背景二、可能出错的原因三、错误代码示例四、正确解决方法与示例五、注意事项 已解决“‘ping’ 不是内部或外部命令,也不是可运行的程序或批处理文件”报错 一、问题分析背景 在Windows操作系统中,ping 命令是一个常用的网络诊断…...
Web前端学堂:深入探索前端开发的核心领域
Web前端学堂:深入探索前端开发的核心领域 在数字化时代的浪潮中,Web前端开发扮演着至关重要的角色。它不仅是连接用户与互联网世界的桥梁,更是创造丰富、互动网络体验的关键所在。本文将带领读者走进Web前端学堂,从四个方面、五个…...
Java数据结构与算法(0/1背包问题)
前言: 背包问题(Knapsack Problem)是组合优化问题中的一个经典问题,有多个变种。这里我们讨论的是 0/1 背包问题,这是最基本的一种形式。问题的描述如下: 给定 n 件物品,每件物品有一个重量 wi 和一个价值…...

LLVM 中 的 pass 及其管理机制
概述 LLVM 编译器框架的核心概念是任务调用和执行 编译器开发者将IR分解为不同的处理对象,并将其处理过程实现为单独的pass类型。在编译器初始化,pass被实例化,并被添加到pass管理中 pass 管理器(pass manager) 以流水线的方式将各个独立的…...
第 5 章 监控系统 | 入门案例 - 虚拟机监控
👉 本文目标:为 Linux 虚拟机/服务器安装 node_exporter,实现对虚拟机/服务器的监控。 👀 本文内容: 安装 Node Exporter,暴露 Linux 指标(比如 CPU、磁盘、IO 等)配置 Prometheus 抓取 Node Exporter 暴露的指标数据配置 Recording Rule,便于缓存/加速 Dashboard 频…...

教资认定报名照片要求小于190kb…
教资认定报名照片要求小于190kb…… 要求:文件小于190kb,宽度290-300,高度408-418 方法:vx搜随时照-教资认定 直接制作合规尺寸即可,还可以打印纸质版邮寄到家...

显示类控件——Calendar Widget
🐌博主主页:🐌倔强的大蜗牛🐌 📚专栏分类:QT ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录 一、Calendar Widget介绍核心属性重要信号代码示例: 获取选中的日期 一、Calendar Widget 介绍 …...

system与excel族函数区别
1.system #include<stdlib.h> int system(const char *command); comand是命令的路径,一般我们用绝对路径 system函数会创建新的进程,新的进程执行完返回原来的进程,原来的进程则继续执行后面的代码段。 如我们创建一个sys.cpp文件…...

华为云AI开发平台ModelArts
华为云ModelArts:重塑AI开发流程的“智能引擎”与“创新加速器”! 在人工智能浪潮席卷全球的2025年,企业拥抱AI的意愿空前高涨,但技术门槛高、流程复杂、资源投入巨大的现实,却让许多创新构想止步于实验室。数据科学家…...
OkHttp 中实现断点续传 demo
在 OkHttp 中实现断点续传主要通过以下步骤完成,核心是利用 HTTP 协议的 Range 请求头指定下载范围: 实现原理 Range 请求头:向服务器请求文件的特定字节范围(如 Range: bytes1024-) 本地文件记录:保存已…...

第一篇:Agent2Agent (A2A) 协议——协作式人工智能的黎明
AI 领域的快速发展正在催生一个新时代,智能代理(agents)不再是孤立的个体,而是能够像一个数字团队一样协作。然而,当前 AI 生态系统的碎片化阻碍了这一愿景的实现,导致了“AI 巴别塔问题”——不同代理之间…...

HBuilderX安装(uni-app和小程序开发)
下载HBuilderX 访问官方网站:https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本: Windows版(推荐下载标准版) Windows系统安装步骤 运行安装程序: 双击下载的.exe安装文件 如果出现安全提示&…...

mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包
文章目录 现象:mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时,可能是因为以下几个原因:1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...
【Go语言基础【13】】函数、闭包、方法
文章目录 零、概述一、函数基础1、函数基础概念2、参数传递机制3、返回值特性3.1. 多返回值3.2. 命名返回值3.3. 错误处理 二、函数类型与高阶函数1. 函数类型定义2. 高阶函数(函数作为参数、返回值) 三、匿名函数与闭包1. 匿名函数(Lambda函…...

JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...

PHP 8.5 即将发布:管道操作符、强力调试
前不久,PHP宣布了即将在 2025 年 11 月 20 日 正式发布的 PHP 8.5!作为 PHP 语言的又一次重要迭代,PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是,借助强大的本地开发环境 ServBay&am…...
掌握 HTTP 请求:理解 cURL GET 语法
cURL 是一个强大的命令行工具,用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中,cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...
Modbus RTU与Modbus TCP详解指南
目录 1. Modbus协议基础 1.1 什么是Modbus? 1.2 Modbus协议历史 1.3 Modbus协议族 1.4 Modbus通信模型 🎭 主从架构 🔄 请求响应模式 2. Modbus RTU详解 2.1 RTU是什么? 2.2 RTU物理层 🔌 连接方式 ⚡ 通信参数 2.3 RTU数据帧格式 📦 帧结构详解 🔍…...