当前位置：首页 > news >正文

【深度学习】【pytorch】对卷积层置零卷积核进行真实剪枝

news 2026/2/10 2:47:57

最近需要对深度学习模型进行部署,因此需要对模型进行压缩,博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论

文章目录

前言
卷积层剪枝
总结

前言

深度学习剪枝(Pruning)是一种用于减少神经网络模型大小、减少计算量和提高推理效率的技术，通过去除神经网络中的冗余连接(权重)或节点(神经元)，从而实现模型的稀疏化。
深度学习剪枝(Pruning)具有以下几个好处：1. 模型压缩和存储节省；2. 计算资源节省；3. 加速推理速度；4. 防止过拟合。
“假剪枝”(Fake Pruning)是一种剪枝算法的称呼，它在剪枝过程中并不真正删除权重或节点，而是通过一些技巧将它们置零或禁用，以模拟剪枝的效果，不少优秀的论文就采用了"假剪枝"策略，尽管可以在一定程度上提高模型的推理速度，但假剪枝算法没有真正减少模型的大小，博主将通过讲解一个小案例，简洁易懂的说明一种对"假剪枝"卷积层进行真正的剪枝的的方法。

卷积层剪枝

可以先将最后的完整代码拷贝到自己的py文件中，然后按照博主的思路学习如何将置零卷积核进行真实剪枝：

初始化卷积层，并查看卷积层权重

# 示例使用一个具有3个输入通道和5个输出通道的卷积层
conv = nn.Conv2d(3, 5, 3)
print("原始卷积层权重：")
print(conv.weight.data)
print(conv.weight.size())
print("原始卷积层偏置：")
print(conv.bias.data)
print(conv.bias.size())

通过随机函数让部分卷积核权重置为0，模拟完成了假剪枝。

# remove_zero_kernels方法内的代码
weight = conv_layer.weight.data
# 卷积核个数
num_kernels = weight.size(0)
# 随机对部分卷积置0
pruned = torch.ones(num_kernels, 1, 1, 1)
# 选择随着置0的卷积序号
random_int = random.randint(1, num_kernels-1)
for i in range(random_int):pruned[i, 0, 0, 0] = 0
conv_layer.weight.data = weight * pruned
weight = conv_layer.weight.data
bias = conv_layer.bias.data

保存未被剪枝的卷积核的权重和偏置

# 计算每个卷积核的L2范数,目的是为了检查卷积核的所有位置是不是都置0了
norms = torch.norm(weight.view(num_kernels, -1), dim=1)
zero_kernel_indices = torch.nonzero(norms==0).squeeze()
print(zero_kernel_indices)
# 移除L2范数为零的卷积核
new_weight = torch.stack([weight[i, :, :, :] for i in range(num_kernels) if i not in zero_kernel_indices])
new_bias = torch.stack([bias[i] for i in range(num_kernels) if i not in zero_kernel_indices])

构建新的卷积层，用来替换此前的卷积层，完成置零卷积核的真实剪枝

# 构建新的卷积层
if zero_kernel_indices.numel() > 0:# 输入channelin_channels = weight.size(1)# 输出channelout_channels = new_weight.size(0)# 卷积核大小kernel_size = weight.size(2)# 步长stride = conv_layer.stridepadding = conv_layer.paddingdilation = conv_layer.dilationgroups = conv_layer.groupsnew_conv_layer = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding, dilation, groups)new_conv_layer.weight.data = new_weightnew_conv_layer.bias.data = new_bias
else:new_conv_layer = conv_layer

完整代码

import torch
import torch.nn as nn
import randomdef remove_zero_kernels(conv_layer):# 卷积核权重weight = conv_layer.weight.data# 卷积核个数num_kernels = weight.size(0)# 随机对部分卷积置0pruned = torch.ones(num_kernels, 1, 1, 1)# 选择随着置0的卷积序号random_int = random.randint(1, num_kernels-1)for i in range(random_int):pruned[i, 0, 0, 0] = 0conv_layer.weight.data = weight * prunedweight = conv_layer.weight.databias = conv_layer.bias.data# 计算每个卷积核的L2范数，目的是为了检查卷积核的所有位置是不是都置0了norms = torch.norm(weight.view(num_kernels, -1), dim=1)zero_kernel_indices = torch.nonzero(norms==0).squeeze()print(zero_kernel_indices)# 移除L2范数为零的卷积核new_weight = torch.stack([weight[i, :, :, :] for i in range(num_kernels) if i not in zero_kernel_indices])new_bias = torch.stack([bias[i] for i in range(num_kernels) if i not in zero_kernel_indices])# 构建新的卷积层if zero_kernel_indices.numel() > 0:# 输入channelin_channels = weight.size(1)# 输出channelout_channels = new_weight.size(0)# 卷积核大小kernel_size = weight.size(2)# 步长stride = conv_layer.stridepadding = conv_layer.paddingdilation = conv_layer.dilationgroups = conv_layer.groupsnew_conv_layer = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding, dilation, groups)new_conv_layer.weight.data = new_weightnew_conv_layer.bias.data = new_biaselse:new_conv_layer = conv_layerreturn new_conv_layer# 示例使用一个具有3个输入通道和5个输出通道的卷积层
conv = nn.Conv2d(3, 5, 3)
# print("原始卷积层权重：")
# print(conv.weight.data)
# print(conv.weight.size())
# print("原始卷积层偏置：")
# print(conv.bias.data)
# print(conv.bias.size())# 将置零的卷积核移除
new_conv = remove_zero_kernels(conv)
# print("原始卷积层权重：")
# print(new_conv.weight.data)
# print(new_conv.weight.size())
# print("原始卷积层偏置：")
# print(new_conv.bias.data)
# print(new_conv.bias.size())

总结

博主的思路就是用卷积层中保留的(未被剪枝)权重初始化一个新的卷积层，这样就将假剪枝的置零卷积核真实的除去，有没有研究这方面的读者可以给博主分享其他的方法，共同进步。

【深度学习】【pytorch】对卷积层置零卷积核进行真实剪枝

文章目录

前言

卷积层剪枝

总结

相关文章：

【深度学习】【pytorch】对卷积层置零卷积核进行真实剪枝

机器人仿真-gazebo学习笔记（3）URDF和机器人模型

lua-resty-request库写入爬虫ip实现数据抓取

gitlab Activating and deactivating users

linux入门到精通-第五章-动态库和静态库

markdown 如何更改字体以及颜色等功能

一次cs上线服务器的练习

STM32-高级定时器

三季度业绩狂飙后，贝泰妮将开启集团化运营的“中场战事”？

快速了解：什么是优化问题

Unity在Project右键点击物体之后获取到点击物体的名称

【带头学C++】----- 三、指针章 ---- 3.7 数组指针

Ubuntu20.04安装CUDA、cuDNN、tensorflow2可行流程（症状：tensorflow2在RTX3090上运行卡住）

untiy打开关闭浏览器

独立站优缺点解析，如何用黑科技进行缺点优化

道本科技||紧跟数字化转型趋势，企业如何提高合同管理能效？

框架安全-CVE 复现Apache ShiroApache Solr漏洞复现

【OpenCV实现图像梯度，Canny边缘检测】

Spring Boot 解决跨域问题的 5种方案

linux 3.13版本nvme驱动阅读记录一

conda相比python好处

PHP和Node.js哪个更爽?

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

.Net框架，除了EF还有很多很多......

连锁超市冷库节能解决方案：如何实现超市降本增效

React19源码系列之事件插件系统

如何将联系人从 iPhone 转移到 Android

如何在网页里填写 PDF 表格？

C++使用 new 来创建动态数组

算法岗面试经验分享-大模型篇