[神经网络]基干网络之VGG、ShuffleNet
一、VGG
VGG是传统神经网络堆叠能达到的极限深度。
VGG分为VGG16和VGG19,其均有以下特点:
①按2x2的Pooling层,网络可以分成若干段
②每段之内由若干same卷积操作构成,段内Feature Map数量固定不变;
③Feature Map按2的倍数递增(64-128-256-512),第四段后均为512
由于这种特性,可以根据任务灵活调整段数,段每增加一段,Feature Map尺寸减小一半
①网络结构

两个模型均分为5个Block,每个Blcok以下采样连接;每个Block均使用3x3卷积核;随着模块边深,Channel数会翻倍。
其均具备以下性质:
①输入尺寸均为224x224;
②均有5层Max Pooling,最终都会产生7x7的Feature Map;
③特征层会经过两个4096的全连接,最后再连接一个1000类的softmax分类器;
④其模型均可表述为mx(nx(conv33)+max_pooling)
一般会将VGG的卷积核更换为3x3或1x1的小尺寸卷积核来提升性能。(同感受野的情况下,小尺寸卷积核有更深的深度;感受野公式—rf size=(out-1)x stride+ksize)
VGG网络的卷积核个数:
VGG-16:2,2,3,3,3
VGG-19:2,2,4,4,4
随着网络层数的增加,像素维度的长宽降低,语义层面的通道上升。
②VGG16
特征图尺寸变化如下

资源消耗: 内存占用大部分由前两个卷积层贡献
参数量大部分由第一个全连接层贡献
VGG精度一般,且参数量较大
相较于AlexNet,VGG使用3x3卷积核(1步长),丢失信息量较少,且不使用归一化。
③3x3卷积核
2层叠加的3x3卷积核等价于一个5x5卷积核;3层叠加的3x3卷积核等价于一个7x7卷积核
虽然其感受野尺寸相同,但是更深的网络可以带来:更强的非线性、更好的表示能力;更少的参数个数。
二、ShuffleNet V1
①Group Pointwise Convolution(分组1x1卷积)

每个卷积核仅处理一部分通道(传统卷积一个卷积核处理全部通道),可以有效减少参数数量。
②Channel Shuffle(通道重排)
目的是引入跨组的信息交融

Channel Shuffle操作:
①将通道重组为一个n列矩阵
②将矩阵转置
③重新将其展平(Flatten)

Channel shuffle可以直接使用pytorch的api实现,且可微分、可导(能实现端到端的训练);同时不会引入额外的计算量
③网络结构
Shuffle Block改进自ResNet的Bottleneck Block:
1.将1x1的降维和升维均改为组卷积
2.降维后引入channel Shuffle;
3.将3x3的标准卷积替换为Depthwise卷积。
下图所示为标准Shuffle Block(左侧为标准模块,右侧为下采样模块<Stride=2>)

分组卷积组数不同,可用的卷积核个数不同(组数与可用卷积核数成正比)
Concat操作:将计算得到的特征图进行堆叠而不是诸元素相加
网络构造:通常来说g=3是常用的ShuffleNet V1

超参数g可以用来控制分组组数;分组组数越高,正确率越高
三、ShuffleNet V2
①网络轻量化的准则
1.输入输出通道相同时,内存占用量(MAC)最小(对1x1卷积而言)
2.分组数过大的分组卷积会增大MAC
3.碎片化操作对并行加速不友好
4.逐元素操作带来的内存和耗时不可忽略
②ShuffleNet V2模块
下图所示为基本模块(左图);下采样模块(右图)

改进如下:
①Channel Split操作:将输入通道一分为二,分别分给残差连接和卷积网络
②Concat操作:将计算得到的特征图进行堆叠而不是诸元素相加
③1x1卷积不带分组卷积
Channel Shuffle和Channel Split在代码中是一个操作
相关文章:
[神经网络]基干网络之VGG、ShuffleNet
一、VGG VGG是传统神经网络堆叠能达到的极限深度。 VGG分为VGG16和VGG19,其均有以下特点: ①按2x2的Pooling层,网络可以分成若干段 ②每段之内由若干same卷积操作构成,段内Feature Map数量固定不变; ③Feature Map按2的…...
Java 日期时间与正则表达式,超详细整理,适合新手入门
目录 1、java.time.LocalDate类表示日期; 2、java.time.LocalTime类表示时间; 3、java.time.LocalDateTime类表示日期和时间; 4、java.time.format.DateTimeFormatter类用于格式化日期和时间; 5、创建正则表达式对象 6、匹配…...
用Netty实现物联网04:自定义通信协议
上一讲咱们澄清了Netty的一些基本概念,然后也写了一个服务端与客户端通信的简单应答程序。从这一讲开始,就来一步步搭建一个Netty物联网应用。 大多数硬件电子产品,都自带了嵌入式软件,或者说固件。这些嵌入式软件/固件基本上都是用C/C++编写的。由于这些小微电子设备资源极…...
「smardaten」上架钉钉应用中心!让进步再一次发生
使用钉钉的团队小伙伴们,smardaten给您送来福利啦~为了给更多团队提供更优质的应用开发体验,方便用户在线、快速使用无代码,数睿数据近期在【钉钉应用中心】发布smardaten在线版本。继与华为云、亚马逊云建立战略合作之后,smardat…...
3、Maven安装
前言:工具下载地址阿里云盘:Maven:https://www.aliyundrive.com/s/SgHKjQ5doSp提取码: ml40一、什么是maven?Apache Maven是个项目管理和自动构建工具,基于项目对象模型(POM)的概念。作用:完成…...
tkinter
# 隐藏控件 tl.pack_forget() tb.pack_forget() # 显示控件 tl.pack() tb.pack() 如果您使用 grid 布局管理器,则可以使用 grid_remove() 方法将控件隐藏,使用 grid() 方法将控件显示。例如: # 隐藏控件 tl.grid_remove() tb.grid_remove() #…...
Servlet笔记(6):HTTP状态码
1、状态码 代码消息描述100 Continue只有请求的一部分已经被服务器接收,但只要它没有被拒绝,客户端应继续该请求。101 Switching Protocols服务器切换协议。200 OK请求成功。201 Created该请求是完整的,并创建一个新的资源。202 Accepted该请…...
RocketMQ 延迟队列
什么是延迟队列指消息发送到某个队列后,在指定多长时间之后才能被消费。应用场景RocketMQ 延迟队列定时消息(延迟队列)是指消息发送到broker后,不会立即被消费,等待特定时间投递给真正的topic。broker有配置项messageD…...
【精准计时】北斗GPS卫星时钟同步改变精准计时年代
【精准计时】北斗GPS卫星时钟同步改变精准计时年代 【精准计时】北斗GPS卫星时钟同步改变精准计时年代 北斗GPS成精确计时先锋 北斗GPS精确时间自动校准技术,是一种简便的获取北斗GPS精确时间信息的专利技术,具有灵敏度高、不受时间及地域限制等特点…...
【C#基础】C# 面向对象编程
序号系列文章5【C#基础】C# 运算符总结6【C#基础】C# 常用语句讲解7【C#基础】C# 常用数据结构文章目录前言面向对象的 C#1,类的概念2,类的定义3,类成员4,对象5,继承6,多态性结语前言 😊大家好&…...
数据结构与算法入门
目录数据结构概述逻辑结构存储结构算法概述如何理解“大O记法”时间复杂度空间复杂度数据结构概述 数据结构可以简单的理解为数据与数据之间所存在的一些关系,数据的结构分为数据的存储结构和数据的逻辑结构。 逻辑结构 集合结构:数据元素同属于一个集…...
【OpenAI】基于 Gym-CarRacing 的自动驾驶练习项目 | 路径训练功能的实现 | GYM-Box2D CarRacing
限时开放,猛戳订阅! 👉 《一起玩蛇》🐍 💭 写在前面: 本篇是关于多伦多大学自动驾驶专业项目的博客。GYM-Box2D CarRacing 是一种在 OpenAI Gym 平台上开发和比较强化学习算法的模拟环境。它是流行的 Box2…...
亚马逊、沃尔玛测评自养号测评、退款、撸卡撸货怎么做?
大家好,有很多的测评工作室做亚马逊测评、沃尔玛测评自养号大额退款,撸卡撸货的找到我,问我有什么方式可以解决成本,效率,纯净度,便捷性等问题,测评养号系统从最早的模拟器,虚拟机到…...
Apollo 2.1.0最新版docker 部署多环境 与java spring boot 接入demo (附带一键部署脚本)
最新Apollo 版本发布2.1.0 https://www.apolloconfig.com/#/zh/design/apollo-design 环境说明 ecs 主机一台数据库mysql 8.0docker 环境 apollo 是内网可信应用,最好是部署在内网里面,外网不可使用,避免配置信息泄漏,这里为了方…...
分布式算法 - 一致性Hash算法
一致性Hash算法是个经典算法,Hash环的引入是为解决单调性(Monotonicity) 的问题;虚拟节点的引入是为了解决 平衡性(Balance) 问题。一致性Hash算法引入在分布式集群中,对机器的添加删除,或者机器故障后自动脱离集群这些操作是分布…...
OAuth2.0入门
什么是OAuth2.0 OAuth(Open Authorization)是一个关于授权(authorization)的开放网络标准,允许用户授权第三方应用访问他们存储在另外的服务提供者上的信息,而不需要将用户名和密码提供给第三方移动应用或…...
【HTTP——了解HTTP协议及状态码】
一, 什么是通信通信,就是信息的传递和交换。通信三要素:通信的主体,通信的内容,通信的方式现实生活中的通信:我打电话叫小明来我家吃饭【其中通信的主体是,我,小明。通信内容是&…...
骨传导耳机靠谱吗,骨传导耳机的原理是什么
很多人刚开始接触骨传导耳机时都会具有一个疑问,骨传导耳机是不是真的靠谱,是不是真的不伤害听力?骨传导耳机传输声音的原理是什么? 下面就给大家讲解一下骨传导耳机传输声音的原理以及骨传导耳机对听力到底有没有伤害。 骨传导…...
对个人博客系统进行web自动化测试(包含测试代码和测试的详细过程)
目录 一、总述 二、登录页面测试 一些准备工作 验证页面显示是否正确 验证正常登录的情况 该过程中出现的问题 验证登录失败的情况 关于登录界面的总代码 测试视频 三、注册界面的自动化测试 测试代码 过程中出现的bug 测试视频 四、博客列表页测试(…...
[ 2204听力 ] 五
[ 第五次课 对话1 ] Narrator Listen to a conversation between a student and her Ecology professor (woman) Hi, professor, did you want to talk about my paper? I didn’t get a grade. (man) Ah, yes, I think you might have done the wrong assignment. assign…...
glb模型在Cesium中发黑的机理分析
最近在将一款火箭模型(fbx模式)转换为glb(gltf)格式后,在Cesium中加载结果模型看起来全黑,经过分析发现是由于高光的折射率等级(IOR level)默认设置错误(设置为0)导致的,将其设置为0.5即可在Cesium中表现正常。 现象 现有一个fbx格…...
32位MCU轻量级OTA方案设计与实现
1. 项目概述:专为32位MCU设计的轻量级OTA方案在嵌入式设备开发中,固件升级一直是个令人头疼的问题。传统方式需要拆机连接烧录器,对于部署在偏远或密闭环境中的设备简直是场噩梦。上周分享的UART OTA方案获得不少开发者关注,今天带…...
Qwen3-14B制造业工艺文档生成:设备操作SOP自动编写与版本管理
Qwen3-14B制造业工艺文档生成:设备操作SOP自动编写与版本管理 1. 引言:制造业文档自动化的迫切需求 在制造业生产现场,设备操作标准作业程序(SOP)是确保产品质量和生产安全的关键文档。传统SOP编写方式面临三大痛点: 人力成本高…...
2026年,AI到底杀死了哪些行业?又催生了哪些新机会?
AI对传统行业的冲击2026年,AI的快速发展可能导致部分传统行业被大幅削弱甚至消失:客服行业:智能客服系统(如ChatGPT、语音AI)已能高效处理大部分标准化咨询,人工客服需求锐减。数据录入与基础会计ÿ…...
面试题杂记
1.问:react的Fabric实现原理答:实际上就是虚拟dom那一套东西,只不过换了个名词2.问:react的fiber架构实现原理答:在react15及以前的协调过程是基于栈(stack-based)的,缺点是一个组件…...
Pixel Couplet Gen快速上手:三步完成像素春联生成器本地部署与微信小程序对接
Pixel Couplet Gen快速上手:三步完成像素春联生成器本地部署与微信小程序对接 1. 项目概览 Pixel Couplet Gen是一款融合传统春节文化与现代像素艺术风格的AI春联生成器。通过ModelScope大模型驱动,它能够将用户输入的文字愿望转化为富有创意的像素风格…...
use-context-selector 与 Suspense 集成:实现数据加载的优雅处理
use-context-selector 与 Suspense 集成:实现数据加载的优雅处理 【免费下载链接】use-context-selector React useContextSelector hook in userland 项目地址: https://gitcode.com/gh_mirrors/us/use-context-selector 在 React 18 的并发渲染时代&#x…...
Android开发者的USB摄像头避坑指南:从设备枚举到SurfaceView预览的完整流程
Android开发者实战:USB摄像头集成全流程与疑难解析 去年接手一个医疗设备项目时,我需要在Android平板上接入工业级USB摄像头。本以为三天能搞定,结果光是解决画面拉伸问题就耗了一周。这份踩坑经验总结,将带你系统掌握从设备枚举到…...
百川2-13B-4bits量化版模型蒸馏:为OpenClaw定制更小尺寸专用模型
百川2-13B-4bits量化版模型蒸馏:为OpenClaw定制更小尺寸专用模型 1. 为什么需要为OpenClaw定制专用模型 去年冬天,当我第一次尝试在树莓派上部署OpenClaw时,遇到了一个尴尬的问题——即使是最轻量级的开源模型,也会让这个小家伙…...
Comsol页岩气水平井压裂模型
Comsol页岩气水平井压裂模型页岩气开采这事儿,说简单也简单说难也难。水平井压裂技术就像在岩石里画树枝——主井眼横向延伸,裂缝网络像毛细血管般扩散。玩过COMSOL的老铁肯定知道,这软件搞多物理场耦合就像拼乐高,但真要把地质力…...
