当前位置：首页 > news >正文

【Block总结】SAFMN，空间自适应调制与局部特征增强的协同设计|即插即用

news 2026/2/9 2:40:44

论文信息

标题：Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution
论文链接：https://arxiv.org/pdf/2302.13800
代码与模型：https://github.com/sunny2109/SAFMN

创新点

空间自适应特征调制（SAFM）：通过独立计算多尺度特征并动态聚合，实现非局部特征依赖的高效建模[6][8]。
卷积通道混合器（CCM）：在SAFM基础上补充局部上下文信息，同时完成通道混合，提升局部特征表达能力[6][13]。
轻量化设计：模型参数量仅为同类高效超分方法（如IMDN）的1/3，内存占用更低，适用于低功耗设备[6][9]。

在这里插入图片描述

方法

整体架构：

特征提取：使用卷积层将低分辨率图像映射到特征空间。
特征混合模块（FMM）：由SAFM和CCM组成，堆叠多个FMM模块进行特征增强。
重建模块：通过上采样生成高分辨率图像[6][10][16]。

核心模块细节：

SAFM层：
- 通过多分支结构学习不同尺度特征，动态调整空间权重以融合全局信息。
- 类似ViT的非局部建模能力，但计算复杂度更低[10][13]。
CCM模块：
- 使用深度可分离卷积提取局部特征，减少参数量。
- 引入通道注意力机制优化特征通道关系[6][13]。

效果与实验结果

定量评估：

在Set5、Set14等基准数据集上，SAFMN在PSNR/SSIM指标上与IMDN等模型相当，但参数量减少70%[6][9]。
在NTIRE2023高效超分挑战赛中：
- 基础版SAFMN获整体性能赛道Top6，模型复杂度赛道Top3[7]。
- 改进版SAFMN++在NTIRE2024挑战赛的保真度赛道排名第一[7]。

效率优势：

参数量：SAFMN为0.95M，IMDN为3.2M[6][9]。
内存占用：相比IMDN减少50%，适合移动端部署[6][8]。

总结

SAFMN通过空间自适应调制与局部特征增强的协同设计，在超分任务中实现了精度与效率的平衡。其轻量化特性使其在低功耗设备（如手机、嵌入式系统）中具有实际应用潜力。后续改进版本（如SAFMN++）进一步验证了该框架的可扩展性[7][17]。

代码

import torch
import torch.nn as nn
import torch.nn.functional as F# Spatially-Adaptive Feature Modulation
class SAFM(nn.Module):def __init__(self, dim, n_levels=4):super().__init__()self.n_levels = n_levelschunk_dim = dim // n_levels# Multiscale feature representationself.mfr = nn.ModuleList([nn.Conv2d(chunk_dim, chunk_dim, 3, 1, 1, groups=chunk_dim, bias=False) for i in range(self.n_levels)])# Feature aggregationself.aggr = nn.Conv2d(dim, dim, 1, 1, 0, bias=False)# Activationself.act = nn.GELU()def forward(self, x):h, w = x.size()[-2:]xc = x.chunk(self.n_levels, dim=1)out = []for i in range(self.n_levels):if i > 0:p_size = (h//2**(i+1), w//2**(i+1))s = F.adaptive_max_pool2d(xc[i], p_size)s = self.mfr[i](s)s = F.interpolate(s, size=(h, w), mode='nearest')else:s = self.mfr[i](xc[i])out.append(s)out = self.aggr(torch.cat(out, dim=1))# Feature modulationout = self.act(out) * xreturn outif __name__ == "__main__":if __name__ == '__main__':# 定义输入张量大小（Batch、Channel、Height、Wight）B, C, H, W = 1, 64, 40, 40input_tensor = torch.randn(B, C, H, W)  # 随机生成输入张量# 初始化 SAFMdim = C  # 输入和输出通道数# 创建 SAFM 实例block = SAFM(dim=dim)# 如果GPU可用将模块移动到 GPUdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")sablock = block.to(device)print(sablock)input_tensor = input_tensor.to(device)# 执行前向传播output = sablock(input_tensor)# 打印输入和输出的形状print(f"Input: {input_tensor.shape}")print(f"Output: {output.shape}")

输出结果：
在这里插入图片描述

【Block总结】SAFMN，空间自适应调制与局部特征增强的协同设计|即插即用

论文信息标题：Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution论文链接：https://arxiv.org/pdf/2302.13800代码与模型：https://github.com/sunny2109/SAFMN 创新点空间自适应特征调制（SAFM&…...

编程日记 2025/3/4 6:41:13

Python爬虫：一文掌握PyQuery模块

文章目录 1. PyQuery 简介2. PyQuery 的安装2.1 安装 PyQuery2.2 安装依赖库3. PyQuery 的基本使用3.1 初始化 PyQuery 对象3.2 选择元素3.3 获取元素内容3.4 遍历元素4. PyQuery 的高级用法4.1 过滤元素4.2 查找子元素4.3 获取属性值4.4 修改元素4.5 添加和删除元素4.6 遍历文…...

编程日记 2025/3/4 6:39:11

LearnOpenGL之Shader编程用算法绘画

———————————————————— 前序 ——————————————————— AndroidLearnOpenGL是本博主自己实现的LearnOpenGL练习集合： Github地址：GitHub - wangyongyao1989/AndroidLearnOpenGL: OpenGL基础及运用系列文章&#xff…...

编程日记 2025/3/4 6:32:59

如何使用Spring Boot框架整合Redis：超详细案例教程

目录 # 为什么选择Spring Boot与Redis整合？ 1. 更新 pom.xml 2. 配置application.yml 3. 创建 Redis 配置类 4. Redis 操作类 5. 创建控制器 6. 启动应用程序 7. 测试 # 为什么选择Spring Boot与Redis整合？ 将Spring Boot与Redis整合可以充分利…...

编程日记 2025/3/4 6:31:56

贪心原理经典例题[860. 柠檬水找零](https://leetcode.cn/problems/lemonade-change/description/)[2208. 将数组和减半的最少操作次数](https://leetcode.cn/problems/minimum-operations-to-halve-array-sum/description/)[179. 最大数](https://leetcode.cn/problems/large…...

编程日记 2025/3/4 6:28:53

线程控制（创建、终止、等待、分离）

目录 1.前言 2.创建线程 pthread_create函数 3.线程终止 pthread_exit函数 pthread_cancel函数 4.线程等待 5.线程分离 1.前言在Linux系统中，并不存在真正的线程，只有轻量级进程。所以，Linux系统只提供了操作轻量级进程的系统调用…...

编程日记 2025/3/4 6:22:47

【备份】php项目处理跨域请求踩坑

这都是老生常谈的东西了。我还在踩坑，记录一下。我在项目入口明明写了如下代码： // 处理预检请求 (OPTIONS) if ($_SERVER[REQUEST_METHOD] OPTIONS) {header("Access-Control-Allow-Origin: https://xxx.vip");header("Access-Cont…...

编程日记 2025/3/4 6:18:43

目标检测YOLO实战应用案例100讲-面向无人机图像的小目标检测

目录知识储备 YOLO v8无人机拍摄视角小目标检测数据集结构环境部署说明安装依赖模型训练权重和指标可视化展示训练 YOLOv8 PyQt5 GUI 开发主窗口代码 main_window.py 使用说明无人机目标跟踪一、目标跟踪的基本原理二、常用的目标跟踪算法基于YOLOv…...

编程日记 2025/3/4 6:17:41

实现 Leaflet 多类型点位标记与聚合功能的实战经验分享

在现代的地理信息系统（GIS）应用中，地图功能是不可或缺的一部分。无论是展示商业网点、旅游景点还是公共服务设施，地图都能以直观的方式呈现数据。然而，当数据量较大时，地图上可能会出现大量的标记点&#x…...

编程日记 2025/3/4 6:16:40

Linux 环境“从零”部署 MongoDB 6.0：mongosh 安装与数据操作全攻略

前提完成linux平台部署MongoDB【部署教程】且完成mongosh的安装由于本人使用的是6.0版本的MongoDB，新版本 MongoDB（尤其是 6.0 及以上版本）已经不再默认捆绑传统的 mongo shell，而改用新的 MongoDB Shell（mongosh&am…...

编程日记 2025/3/4 6:14:37

深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析

# 深度学习五虎将：当CNN遇见Transformer的奇幻漂流 ## 序章：AI江湖的兵器谱排行 2012年，多伦多大学的厨房里，Hinton的学生们用GPU煎了个"AlexNet"荷包蛋，从此开启了深度学习的热兵器时代。如今五大模型各显…...

编程日记 2025/3/4 6:08:30

004 rocketmq集群

1、集群模式在RocketMQ中，集群的部署模式是比较多的，有以下几种： public class ConsumerDemo {public static void main(String[] args) throws Exception {DefaultMQPushConsumer consumer new DefaultMQPushConsumer("test-group&qu…...

编程日记 2025/3/4 6:04:26

基于 Python 深度学习的电影评论情感分析可视化系统（2.0 全新升级）

基于 Python 深度学习的电影评论情感分析可视化系统，基于 Flask 深度学习，构建了一个影评情感分析系统，能够自动分析影评、计算情感趋势并可视化展示，对于电影行业具有重要参考价值！ 基于 Python 深度学习的电影评…...

编程日记 2025/3/4 5:49:10

Linux内核配置与构建原理

Kconfig文件 Kconfig是Linux内核中用于配置功能的脚本语言系统，由众多内核源码树中每个目录下的Kconfig文件组成。它定义Linux相关的配置选项层次结构和依赖关系。 menuconfig工具，会抓取Kconfig中的信息，为用户输出友好的交互式菜单选项配…...

编程日记 2025/3/4 5:48:09

大语言模型微调的基本概念介绍

大型语言模型（LLMs）正在以惊人的速度发展，LLM微调的潜力更是如此。大型语言模型的生命周期有几个关键步骤，今天我们将要介绍这个周期中最丰富、最耗时的一部分——LLM微调过程。大语言模型的生命周期在深入了解大型语言模型&a…...

编程日记 2025/3/4 5:46:07

实例分割 | yolov11训练自己的数据集

前言因工作要求使用的都是yolov5系列的模型，今天学习一下最先进的yolov11，记录一下环境配置及训练过程。 1.项目下载及环境安装源码位置：yolov11 可以看到，这里要求python版本大于等于3.8，我这里安装python3.10.…...

编程日记 2025/3/4 5:42:04

vue3:四嵌套路由的实现

一、前言 1、嵌套路由的含义嵌套路由的核心思想是：在某个路由的组件内部，可以定义子路由，这些子路由会渲染在父路由组件的特定位置（通常是 <router-view> 标签所在的位置）。通过嵌套路由，你可以实…...

编程日记 2025/3/4 5:41:02

AIGC和搜索引擎的异同

AIGC（生成式人工智能）与搜索引擎的核心差异体现在信息处理方式和输出形态上，我们可以从以下维度对比： 一、工作原理的本质差异信息检索机制搜索引擎：基于关键词匹配（如"中暑怎么办"→返回相关…...

编程日记 2025/3/4 5:39:00

ES批量查询

在 Elasticsearch 中，multi_search（也称为 msearch）是一种允许你在单个请求中执行多个搜索操作的 API。它可以显著减少网络开销，尤其是在需要执行多个查询时。multi_search 会将多个查询打包成一个请求发送给 Elasticsearch&#…...

编程日记 2025/3/4 5:37:57

Vue2学习

一、Vue3 基础监视属性天气案例 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>天气案例</…...

编程日记 2025/3/4 5:34:54

网络编程（Modbus进阶）

思维导图 Modbus RTU（先学一点理论） 概念 Modbus RTU 是工业自动化领域最广泛应用的串行通信协议，由 Modicon 公司（现施耐德电气）于 1979 年推出。它以高效率、强健性、易实现的特点成为工业控制系统的通信标准。包…...

编程新知 2026/2/7 23:18:34

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/8 4:37:34

超短脉冲激光自聚焦效应

前言与目录强激光引起自聚焦效应机理超短脉冲激光在脆性材料内部加工时引起的自聚焦效应，这是一种非线性光学现象，主要涉及光学克尔效应和材料的非线性光学特性。自聚焦效应可以产生局部的强光场，对材料产生非线性响应，可能…...

编程新知 2026/2/8 20:42:48

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2026/1/21 9:20:07

【Java学习笔记】Arrays类

Arrays 类 1. 导入包：import java.util.Arrays 2. 常用方法一览表方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序（自然排序和定制排序）Arrays.binarySearch()通过二分搜索法进行查找（前提：数组是…...

编程新知 2025/12/3 9:38:15