当前位置：首页 > news >正文

模型压缩-对模型结构进行优化

news 2025/12/30 22:18:42

模型压缩-对模型结构进行优化

概述

模型压缩通常都是对推断过程而言，训练过程的计算代价通常不考虑，因为GPU可以快速完成任意复杂度模型的训练
对于推断过程来说，模型应用才是对于速度敏感的场景
多数情况下希望使用尽可能少的能耗完成京可能多的数据处理
推断过程不仅仅需要在CPU设备上完成测试，还需要再低功耗设备完成推断

卷积结构基础优化-空洞卷积

增大感受野，增大感受野基本方式就是增大卷积核大小
增大卷积核大小会增大训练参数拖慢计算
使用空洞卷积进行优化
空洞卷积将卷积可训练参数之间添加多个1
二维空洞卷积的核心形式就是再普通空洞卷积核心的横向纵向都添加1
pytorch中再conv添加dilation参数默认为1

https://blog.csdn.net/mrjkzhangma/article/details/104929302

关于常规卷积

在这里插入图片描述

关于空洞卷积

在这里插入图片描述

空洞卷积计算：扩张率D，那么就在横纵方向添加D -1 行

在这里插入图片描述

增大感受野的原因

下采样过程中大量池化操作，损失一些信息，再解码重建过程中产生影响

关于分组卷积

将输入特征图按照通道均分为g组，然后对每一组进行常规卷积
由于分组之后，每一组输入特征图的通道数变成Cin / g,那么每一个卷积核的通道数也降低到Cin / g
由于每一组进行的是常规卷积，所以每一组至少需要一个卷积核，也就是分组卷积输出通道数至少为g,那么如果每一组有n个卷积核输出Cout = n x g, 所以输出通道数是分组数的整数倍
分组卷积中要求输入和输出通道数均能整除分组数g
分组卷积的运算量和参数量的减少，本质原因就是一个卷积核本身通道数减少为原来的g分之一
整个分组卷积的参数量：

在这里插入图片描述

分组卷积的作用

减少运算量和参数，原来的1/g
隔绝不同组的信息交换
如果需要考虑所有输入特征图信息的情况，分组卷积会降低模型的性能，对于这个问题，需要在两个分组卷积之间加入Channel_Shuffle模块打乱通道顺序，从而实现不同分组之间的信息交换

关于分组卷积

import torch
import torch.nn as nn# batch 5 channel 128  大小 28 x 28
x = torch.zeros([5,128,28,28])cnn = nn.Conv2d(128,256,3,groups=2)#  计算cnn 的参数数量  只有一层卷积
#  第一个参数是权重 torch.Size([256, 64, 3, 3])
# 因为分为两组 每一组输入特征图的通道数变成64,然后每一个卷积核的通道数 也是64
# 3 x 3 卷积核 输出256 输入64 总共256个卷积核个数
for var in cnn.parameters():print(var.shape)# cnn = nn.Conv1d(128,256,3,groups=2)
# for var in cnn.parameters():
#     print(var.shape)

from torchvision.models import resnet50,mobilenet_v2
import torch
import timemodel1 = resnet50()
model2 = mobilenet_v2()  # 卷积速度优化# 输入1 输出3  大小 224 x 224
x = torch.randn([1,3,224,224],dtype=torch.float32)# 进行十次推理测试 每一次测试都测量模型推理时间  然后打印结果
for i in range(10):t1 = time.perf_counter()y = model2(x)t2 = time.perf_counter()# 计算推理时间 进行十次推理 发现每一次推理的时间都减小print(f"{t2-t1:.3f}")torch.save(model1.state_dict(),"resnet.pth")#  使用torch.save  保存模型的权重参数  然后以后可以加载这些模型权重  然后重用
torch.save(model2.state_dict(),"mobilenetv2.pth")

关于深度可分离卷积

import torch
import torch.nn as nn
import time# 产生随机测试数据
x = torch.randn([32,64,300,300])
# 定义卷积网络# 逐层卷积  g = Cin = Cout  卷积核大小 3 x 3
cnn1 = nn.Conv2d(64,64,3,groups=64)# 逐点卷积 
cnn2 = nn.Conv2d(64,128,1,groups=1)cnn1.eval() # 推断模型
cnn2.eval() for i in range(10):t1 = time.perf_counter()x = cnn1(x)y = cnn2(x)t2 = time.perf_counter()print(f"{t2 - t1:.3f}")

模型压缩-对模型结构进行优化

模型压缩-对模型结构进行优化概述模型压缩通常都是对推断过程而言，训练过程的计算代价通常不考虑，因为GPU可以快速完成任意复杂度模型的训练对于推断过程来说，模型应用才是对于速度敏感的场景多数情况下希望使用尽可能少的能耗完成京可能…...

编程日记 2023/9/8 6:36:01

软件工程课件

软件工程考点概述软件工程概述能力成度模型能力成熟度模型集成软件过程模型逆向工程![ ](https://img-blog.csdnimg.cn/425cea8190fb4c5ab2bf7be5e2ad990e.png) 考点概述重点章节软件工程概述之前老版教程的，之前考过能力成度模型记忆能力等级和特点能力…...

编程日记 2023/9/8 6:35:00

基于ADS的marx雪崩电路设计-设计实践（射频脉冲源）

基于ADS的marx雪崩电路设计-设计实践（射频脉冲源） 设计一个ns级别的脉冲源，属于是半路转行的，虽然不了解具体原理但是也可以进行设计。具体的设计理论以及优化方法将在之后进行讨论. 参考文献：基于Marx电路的亚纳秒级…...

编程日记 2023/9/8 6:33:59

X86_64函数调用汇编程序分析

X86_64函数调用汇编程序分析 1 X86_64寄存器使用标准2 对应代码的分析2.1 main函数及其对应的汇编程序2.1.1 main的C代码实现2.1.2 main函数对应汇编及其分析2.1.3 执行完成之后栈的存放情况 2.2 test_fun_a函数及其对应的汇编程序2.2.1 test_fun_a函数的C实现2.2.2 test_fun_a…...

编程日记 2023/9/8 6:32:58

Vue3【Provide/Inject】

前言自从使用了Provide/Inject代码的组织方式更加灵活了，但是这个灵活性的增加伴随着代码容错性的降低。我相信只要是真的在项目中引入Provide/Inject的同学，一定一定有过或者正在经历下面的状况： 注入名（Injection key&#x…...

编程日记 2023/9/8 6:31:57

Go-Python-Java-C-LeetCode高分解法-第四周合集

前言本题解Go语言部分基于 LeetCode-Go 其他部分基于本人实践学习个人题解GitHub连接：LeetCode-Go-Python-Java-C Go-Python-Java-C-LeetCode高分解法-第一周合集 Go-Python-Java-C-LeetCode高分解法-第二周合集 Go-Python-Java-C-LeetCode高分解法-第三周合集本…...

编程日记 2023/9/8 6:30:56

vue路由

一、声明式导航-导航链接 1.需求实现导航高亮效果如果使用a标签进行跳转的话，需要给当前跳转的导航加样式，同时要移除上一个a标签的样式，太麻烦！！！ 2.解决方案 vue-router 提供了一个全局组件 router…...

编程日记 2023/9/8 6:29:55

最强的AI视频去码图片修复模型：CodeFormer

目录 1 CodeFormer介绍 1.1 CodeFormer解决的问题 1.2 人脸复原的挑战 1.3 方法动机 1.4 模型实现 1.5 实验结果 2 CodeFormer部署与运行 2.1 conda环境安装 2.2 运行环境构建 2.3 模型下载 2.4 运行 2.4.1 人脸复原编辑编辑 2.4.2 全图片增强 2.4.3 人脸颜色…...

编程日记 2023/9/8 6:28:54

jenkins自动化部署安装

一、准备工作 1、安装jdk # 1、下载准备jdk包(也可以用docker安装) wget ... # 2、直接解压到,无需安装 unzip ...2、安装maven # 1、下载准备maven压缩包 wget ... # 2、直接解压,无需安装 unzip ... # 3、修改setting.xml，修改localRepository和MIRROR镜像地址…...

编程日记 2023/9/8 6:27:53

如何调用Zabbix API获取主机信息

自Zabbix 1.8版本被引进以后，Zabbix API开始扮演着越来越重要的角色，它可以为批量操作、第三方软件集成以及其他应用提供可编程接口。在运维实践中，Zabbix API还有更多巧妙的应用。面对规模庞大的监控设备，可能会出现某台机器发…...

编程日记 2023/9/8 6:26:53

批量执行redis命令总结

目录批量执行redis命令方式1: redis-cli直接执行方式2:通过redis-cli和xargs等命令批量执行redis命令方式1: redis-cli直接执行 redis-cli command param redis-cli本身支持单个命令执行省略了连接参数操作的key等相关数据，可以通过线下获取或通过keys scan等命…...

编程日记 2023/9/8 6:25:51

命令行git联网失败，但是实际可以联网

最近下载代码的时候发现总是告诉我连不上github的网页，但是我自己通过浏览器又可以上网，找了半天发现这个方法可以。记录下这个代理打开git bash 执行以下命令： git config --global http.proxy http://127.0.0.1:7890 git config --glob…...

编程日记 2023/9/8 6:24:50

网络编程套接字，Linux下实现echo服务器和客户端

目录 1、一些网络中的名词 1.1 IP地址 1.2 端口号port 1.3 "端口号" 和 "进程ID" 1.4 初始TCP协议 1.5 UDP协议 2、socket编程接口 2.1 socket 常见API 2.2 sockaddr结构 3、简单的网络程序 3.1 udp实现echo服务器和客户端 3.1.1 echo服务器实…...

编程日记 2023/9/8 6:23:49

java+ssh+mysql智能化办公管理系统

项目介绍： 本系统为基于jspsshmysql的OA智能办公管理系统，包含管理员、领导、员工角色，功能如下： 管理员：公告信息；工作计划；公司资料；部门管理；员工管理；员…...

编程日记 2023/9/8 6:22:48

网络层抓包tcpdump

sudo tcpdump -i eth0 -s 0 -nn host iphost -w xxx.pcap 这段代码使用了命令行工具 tcpdump，用于在Linux系统上捕获网络数据包。让我详细介绍一下这段代码的含义和 tcpdump 的用法： 代码含义： sudo: 使用超级用户权限执行 tcpdump 命令&am…...

编程日记 2023/9/8 6:21:47

QT之形态学操作

形态学操作包含以下操作： 腐蚀 (Erosion)膨胀 (Dilation)开运算 (Opening)闭运算 (Closing)形态梯度 (Morphological Gradient)顶帽 (Top Hat)黑帽(Black Hat) 其中腐蚀和膨胀操作是最基本的操作，其他操作由这两个操作变换而来。腐蚀用一个结构元素…...

编程日记 2023/9/8 6:20:46

15、监测数据采集物联网应用开发步骤(11)

源码将于最后一遍文章给出下载监测数据采集物联网应用开发步骤(10) 程序自动更新开发前面章节写了部分功能模块开发： 日志或文本文件读写开发;Sqlite3数据库读写操作开发;定时器插件化开发;串口(COM)通讯开发;TCP/IP Client开发;TCP/IP Server 开发;modbus协议…...

编程日记 2023/9/8 6:19:45

Pygame中Trivia游戏解析6-2

3.1.2 读取保存题目的文件在Trivia类的__init__()方法中，对各变量初始化完成之后，读取保存题目的文件，代码如下所示。 f open(filename, "r", encodingutf8) trivia_data f.readlines() f.close() 其中，open()函数…...

编程日记 2023/9/8 6:18:44

java 实现命令行模式

命令模式是一种行为设计模式，它允许您将请求封装为对象，以便您可以将其参数化、队列化、记录和撤销。在 Java 中实现命令模式涉及创建一个命令接口，具体命令类，以及一个接收者类，该接收者类执行实际操作。下面是一个简…...

编程日记 2023/9/8 6:17:42

A - Orac and Models（最长上升子序列——加强版）

There are nn models in the shop numbered from 11 to nn, with sizes s_1, s_2, \ldots, s_ns1,s2,…,sn. Orac will buy some of the models and will arrange them in the order of increasing numbers (i.e. indices, but not sizes). Orac thinks that the obtai…...

编程日记 2023/9/8 6:16:42

模型压缩-对模型结构进行优化

模型压缩-对模型结构进行优化

概述

卷积结构基础优化-空洞卷积

增大感受野的原因

关于分组卷积

分组卷积的作用

关于分组卷积

关于深度可分离卷积

相关文章：

模型压缩-对模型结构进行优化

软件工程课件

基于ADS的marx雪崩电路设计-设计实践（射频脉冲源）

X86_64函数调用汇编程序分析

Vue3【Provide/Inject】

Go-Python-Java-C-LeetCode高分解法-第四周合集

vue路由

最强的AI视频去码图片修复模型：CodeFormer

jenkins自动化部署安装

如何调用Zabbix API获取主机信息

批量执行redis命令总结

命令行git联网失败，但是实际可以联网

网络编程套接字，Linux下实现echo服务器和客户端

java+ssh+mysql智能化办公管理系统

网络层抓包tcpdump

QT之形态学操作

15、监测数据采集物联网应用开发步骤(11)

Pygame中Trivia游戏解析6-2

java 实现命令行模式

A - Orac and Models（最长上升子序列——加强版）

uniapp 对接腾讯云IM群组成员管理（增删改查）

conda相比python好处

【Python】 -- 趣味代码 - 小恐龙游戏

Zustand 状态管理库：极简而强大的解决方案

微信小程序 - 手机震动

什么是EULA和DPA

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

python报错No module named ‘tensorflow.keras‘

uniapp手机号一键登录保姆级教程（包含前端和后端）

WebRTC从入门到实践 - 零基础教程