当前位置：首页 > news >正文

改进YOLO系列 | CVPR 2021 | Involution：超越convolution和self-attention的神经网络算子

news 2026/2/11 2:50:25

Involution：超越卷积和自注意力的新型神经网络算子（中文综述）

简介

Involuton是CVPR 2021上提出的新型神经网络算子，旨在超越卷积和自注意力，提供更高效、更具表达力的特征提取能力。

Involution原理

Involution的核心思想是将卷积核分解为多个核点，并通过注意力机制对这些核点进行加权融合。这使得Involution能够捕获更复杂的特征信息，同时保持较低的计算复杂度。

Involution应用场景

Involution可以应用于各种计算机视觉任务，例如图像分类、目标检测、语义分割等。它可以作为卷积或自注意力的替代或补充，以提高模型性能。

Involution算法实现

Involution的实现主要包括以下步骤：

特征提取: 使用标准卷积层提取输入图像的特征。
核点分解: 将卷积核分解为多个核点。
注意力计算: 对每个核点计算注意力权重。
特征融合: 使用注意力权重对核点进行加权融合。
输出: 生成最终的输出特征。

Involution代码实现

Involution：完整代码实现（中文解释）

依赖库

首先，我们需要导入必要的库：

import torch
import torch.nn as nn
import torch.nn.functional as F

定义核点分解函数

Involution核心的第一步是将卷积核分解为多个核点。以下代码定义了一个简单的核点分解函数：

def kernel_decompose(kernel):# 将卷积核分解为多个核点kernel_points = kernel.view(-1, 1, 1, 1)  # 将卷积核展开为一维向量return kernel_points

定义注意力计算模块

Involution使用注意力机制对核点进行加权融合。以下代码定义了一个简单的注意力计算模块：

class AttentionModule(nn.Module):def __init__(self, channels):super(AttentionModule, self).__init__()self.query_conv = nn.Conv2d(channels, channels // 2, kernel_size=1)self.key_conv = nn.Conv2d(channels, channels // 2, kernel_size=1)self.value_conv = nn.Conv2d(channels, channels, kernel_size=1)def forward(self, feature, kernel_points):# 计算注意力权重q = self.query_conv(feature)k = self.key_conv(feature)v = self.value_conv(feature)attention = torch.bmm(q, k.transpose(0, 1))  # 计算注意力矩阵attention = F.softmax(attention, dim=1)  # 计算注意力权重# 加权融合核点out = torch.bmm(attention, v) * kernel_pointsreturn out

定义Involution层

Involution层继承自 nn.Module 类，并实现了Involution操作。

class InvolutionLayer(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0):super(InvolutionLayer, self).__init__()self.kernel_decompose = kernel_decompose  # 核点分解函数self.attention_module = AttentionModule(in_channels)  # 注意力计算模块self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)def forward(self, feature):# 卷积核分解kernel_points = self.kernel_decompose(self.conv.weight)# 注意力计算out = self.attention_module(feature, kernel_points)# 残差连接out += self.conv(feature)return out

完整示例代码

以下代码展示了如何使用Involution层进行图像分类：

import torch
import torch.nn as nn
import torch.nn.functional as F# 定义Involution层
involution_layer = InvolutionLayer(3, 64, 3)# 输入图像
image = torch.randn(1, 3, 224, 224)# Involution操作
out = involution_layer(image)print(out.shape)  # 输出特征图形状

代码解释

导入必要的库：torch、torch.nn、torch.nn.functional。
定义核点分解函数 kernel_decompose，将卷积核分解为多个核点。
定义注意力计算模块 AttentionModule，使用注意力机制对核点进行加权融合。
定义Involution层 InvolutionLayer，继承自 nn.Module 类，并实现了Involution操作。
创建Involution层实例 involution_layer，指定输入通道数、输出通道数、卷积核大小、步长和填充。
创建输入图像 image。
使用Involution层进行Involution操作，并输出结果 out。

注意

以上代码仅供参考，实际应用中需要根据任务和数据集进行调整。
Involution是一种较为复杂的模型，需要有一定的深度学习基础才能理解和实现。

Involution部署测试

Involution的部署测试可以参考以下步骤：

模型训练: 使用训练数据集训练Involution模型。
模型评估: 使用测试数据集评估模型的性能。
模型部署: 将模型部署到生产环境。

文献材料链接

Involution: Involutions for Efficient and Accurate Vision

应用示例产品

Involution可以应用于各种基于计算机视觉的应用，例如：

智能视频监控
自动驾驶
医学图像分析

总结

Involution是一种很有潜力的新型神经网络算子，它有望在各种计算机视觉任务中发挥重要作用。

影响

Involution的提出为神经网络架构设计提供了新的思路，并有可能引发后续研究的热潮。

未来扩展

Involution可以进一步扩展到其他深度学习任务，例如自然语言处理、语音识别等。

注意： 以上内容仅供参考，具体实现可能需要根据实际情况进行调整。

参考资料

Involution: Involutions for Efficient and Accurate Vision

改进YOLO系列 | CVPR 2021 | Involution：超越convolution和self-attention的神经网络算子

Involution：超越卷积和自注意力的新型神经网络算子（中文综述） 简介 Involuton是CVPR 2021上提出的新型神经网络算子，旨在超越卷积和自注意力，提供更高效、更具表达力的特征提取能力。 Involution原理 Involution的…...

编程日记 2024/6/17 8:32:25

落地速度与效果之争，通用VS垂直，我的观点和预测。

标题：AI大模型战场：通用VS垂直，谁将领跑落地新纪元？ 摘要：随着人工智能技术的飞速发展，大模型的应用场景日益广泛。在这场竞赛中，通用大模型和垂直大模型各有优势，落地速度和可能性也…...

编程日记 2024/6/17 8:31:24

【Android面试八股文】在Android中，出现ClassNotFound的有可能的原因是什么?

在Android环境下类未找到的可能原因在Android环境下，类未找到的可能原因包括但不限于以下几点：类路径问题：Android应用使用的类通常存储在APK文件中。如果类所在的APK文件没有被正确加载，或者应用的类路径配置有误，就会导致类未找到的错误。多DEX文件加载问题：在一些…...

编程日记 2024/6/17 8:30:22

模板引擎与 XSS 防御

在 View 层，可以解决 XSS 问题。在本书的“跨站脚本攻击”一章中，阐述了“输入检查” 与“输出编码”这两种方法在 XSS 防御效果上的差异。XSS 攻击是在用户的浏览器上执行的， 其形成过程则是在服务器端页面渲染时，注入了恶意的 H…...

编程日记 2024/6/17 8:28:20

vue3轮播图怎么做

先看效果实现代码 <n-carouseleffect"card"dot-type"line"draggable:autoplay"!isHovered":current-index"currentIndex"prev-slide-style"transform: translateX(-150%) translateZ(-450px);opacity:1"next-slide-st…...

编程日记 2024/6/17 8:27:19

ubuntu中安装docker并换源

使用 Ubuntu 的仓库安装 Docker sudo apt update现在，你可以使用以下命令在 Ubuntu 中安装 Docker 以及 Docker Compose： sudo apt install docker.io docker-composeDocker 包被命名为 docker.io，因为在 Docker 出现之前就已经存在一个名为…...

编程日记 2024/6/17 8:26:17

HTML静态网页成品作业(HTML+CSS)—— 环保主题介绍网页(5个页面)

🎉不定期分享源码，关注不丢失哦文章目录一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码五、源码获取一、作品介绍 🏷️本套采用HTMLCSS，未使用Javacsript代码，共有5个页面。二、作品演示三、代…...

编程日记 2024/6/17 8:23:14

深入了解RSA加密算法

目录前言一、什么是RSA？ 二、RSA加密的基本概念 1.非对称加密 2.密钥生成 3.加密和解密三、RSA加密的工作原理四、RSA的应用场景五、RSA加密解密的实现六、RSA算法的局限性及改进措施前言在当今的数字化时代，信息的安全性成为了人们关注…...

编程日记 2024/6/17 8:20:11

github基础使用

前言将用到的github指令记录下来，持续更新，方便随时查找学习。一、github用到的指令 1、我们从github克隆下来的代码版本一般都是master主分支，我们要建立自己的分支进行修改： //git branch //查看目前的分支/* * master /…...

编程日记 2024/6/17 8:18:09

Docker使用心得

Docker使用心得最近使用Docker比较频繁，特此想记录一下，方便后续查找。 Docker常用命令Docker如何配置使用GPU环境？如何使用Dockerfile构建镜像？如何使用docker compose 实例化容器？ Docker如何配置使用GPU环境参…...

编程日记 2024/6/17 8:16:07

QListWidget 插入 item，item显示自定义界面

代码示意： class ItemWidget_action_cfg_w(QWidget):... # 如下方法是在指定item下插入新的item def __do_add_item(self, item):# 获取当前item rowrow self.__list_w.indexFromItem(item).row()# 注意这里没有父类，解释见后面说明new_item QList…...

编程日记 2024/6/17 8:15:06

Python写一个ERP系统和agent智能体协同仓库和订单的案例

这是一个关于使用Python编写一个简单的ERP系统，并与Agent智能体协同完成仓库和订单管理的案例。在这个案例中，我们将使用Python的第三方库sqlite3进行数据库操作，以及discord库实现与Agent智能体的通信。 1. 首先，安装所需库&…...

编程日记 2024/6/17 8:14:05

【计算机网络】已解决：“‘ping‘ 不是内部或外部命令，也不是可运行的程序或批处理文件”报错

文章目录一、问题分析背景二、可能出错的原因三、错误代码示例四、正确解决方法与示例五、注意事项已解决“‘ping’ 不是内部或外部命令，也不是可运行的程序或批处理文件”报错一、问题分析背景在Windows操作系统中，ping 命令是一个常用的网络诊断…...

编程日记 2024/6/17 8:13:03

Web前端学堂：深入探索前端开发的核心领域

Web前端学堂：深入探索前端开发的核心领域在数字化时代的浪潮中，Web前端开发扮演着至关重要的角色。它不仅是连接用户与互联网世界的桥梁，更是创造丰富、互动网络体验的关键所在。本文将带领读者走进Web前端学堂，从四个方面、五个…...

编程日记 2024/6/17 8:11:01

Java数据结构与算法(0/1背包问题)

前言: 背包问题（Knapsack Problem）是组合优化问题中的一个经典问题，有多个变种。这里我们讨论的是 0/1 背包问题，这是最基本的一种形式。问题的描述如下： 给定 n 件物品，每件物品有一个重量 wi 和一个价值…...

编程日记 2024/6/17 8:09:59

LLVM 中的 pass 及其管理机制

概述 LLVM 编译器框架的核心概念是任务调用和执行编译器开发者将IR分解为不同的处理对象，并将其处理过程实现为单独的pass类型。在编译器初始化，pass被实例化，并被添加到pass管理中 pass 管理器(pass manager) 以流水线的方式将各个独立的…...

编程日记 2024/6/17 8:08:57

第 5 章监控系统 | 入门案例 - 虚拟机监控

👉 本文目标：为 Linux 虚拟机/服务器安装 node_exporter，实现对虚拟机/服务器的监控。 👀 本文内容：安装 Node Exporter，暴露 Linux 指标（比如 CPU、磁盘、IO 等）配置 Prometheus 抓取 Node Exporter 暴露的指标数据配置 Recording Rule，便于缓存/加速 Dashboard 频…...

编程日记 2024/6/17 8:07:56

教资认定报名照片要求小于190kb…

教资认定报名照片要求小于190kb…… 要求：文件小于190kb，宽度290-300，高度408-418 方法：vx搜随时照-教资认定直接制作合规尺寸即可，还可以打印纸质版邮寄到家...

编程日记 2024/6/17 8:03:50

显示类控件——Calendar Widget

🐌博主主页：🐌倔强的大蜗牛🐌 📚专栏分类：QT ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录一、Calendar Widget介绍核心属性重要信号代码示例: 获取选中的日期一、Calendar Widget 介绍 …...

编程日记 2024/6/17 7:53:37

system与excel族函数区别

1.system #include<stdlib.h> int system(const char *command); comand是命令的路径，一般我们用绝对路径 system函数会创建新的进程，新的进程执行完返回原来的进程，原来的进程则继续执行后面的代码段。如我们创建一个sys.cpp文件…...

编程日记 2024/6/17 7:52:36

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计：let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性，这种设计体现了语言的核心哲学。以下是深度解析： 1.1 设计理念剖析安全优先原则：默认不可变强制开发者明确声明意图 let x 5; …...

编程新知 2025/9/28 20:12:12

【位运算】消失的两个数字（hard）

消失的两个数字（hard） 题⽬描述：解法（位运算）：Java 算法代码：更简便代码题⽬链接：⾯试题 17.19. 消失的两个数字题⽬描述： 给定⼀个数组，包含从 1 到 N 所有…...

编程新知 2025/11/15 16:18:24

什么是EULA和DPA

文章目录 EULA（End User License Agreement）DPA（Data Protection Agreement）一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA（End User License Agreement） 定义： EULA即…...

编程新知 2025/10/18 7:13:10

智能仓储的未来：自动化、AI与数据分析如何重塑物流中心

当仓库学会“思考”，物流的终极形态正在诞生想象这样的场景： 凌晨3点，某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径；AI视觉系统在0.1秒内扫描包裹信息；数字孪生平台正模拟次日峰值流量压力…...

编程新知 2026/2/1 2:49:30

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/11/10 19:08:45

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/1/25 10:12:06

【Redis】笔记｜第8节｜大厂高并发缓存架构实战与优化

缓存架构代码结构代码详情功能点： 多级缓存，先查本地缓存，再查Redis，最后才查数据库热点数据重建逻辑使用分布式锁，二次查询更新缓存采用读写锁提升性能采用Redis的发布订阅机制通知所有实例更新本地缓存适用读多…...

编程新知 2026/1/26 3:45:28

Caliper 配置文件解析：fisco-bcos.json

config.yaml 文件 config.yaml 是 Caliper 的主配置文件，通常包含以下内容： test:name: fisco-bcos-test # 测试名称description: Performance test of FISCO-BCOS # 测试描述workers:type: local # 工作进程类型number: 5 # 工作进程数量monitor:type: - docker- pro…...

编程新知 2025/10/24 15:14:02

uniapp 集成腾讯云 IM 富媒体消息（地理位置/文件）

UniApp 集成腾讯云 IM 富媒体消息全攻略（地理位置/文件） 一、功能实现原理腾讯云 IM 通过消息扩展机制支持富媒体类型，核心实现方式： 标准消息类型：直接使用 SDK 内置类型（文件、图片等）自…...

编程新知 2025/10/25 5:53:05

ZYNQ学习记录FPGA(一)ZYNQ简介

一、知识准备 1.一些术语,缩写和概念： 1）ZYNQ全称：ZYNQ7000 All Pgrammable SoC 2）SoC:system on chips(片上系统)，对比集成电路的SoB（system on board） 3）ARM：处理器…...

编程新知 2026/2/5 9:30:45