当前位置: 首页 > news >正文

【YOLO改进】换遍MMPretrain主干网络之ConvNeXt-Tiny(基于MMYOLO)

ConvNeXt-Tiny

ConvNeXt-Tiny 是一种改进的卷积神经网络架构,其设计目的是在保持传统卷积神经网络优势的同时,借鉴了一些Transformer架构的成功经验。

ConvNeXt-Tiny 的优点

  1. 架构优化: ConvNeXt-Tiny 对经典ResNet架构进行了多种优化,包括调整卷积核大小、增加归一化层以及调整激活函数的使用。这些改进使得ConvNeXt-Tiny在保持计算效率的同时,能够提高模型的表示能力。

  2. 高效计算: ConvNeXt-Tiny 采用了更大范围的卷积核和较少的池化操作,这使得它在同样的计算预算下,能够捕捉到更丰富的特征信息,提高了模型的性能。

  3. 灵活性: 由于ConvNeXt-Tiny 保留了卷积神经网络的基本结构,因此可以容易地与现有的卷积神经网络基础设施兼容,易于部署和优化。

  4. 性能优越: 在多个基准测试中,ConvNeXt-Tiny 展示了优异的性能,特别是在图像分类任务中,能够与最先进的Transformer模型相媲美。

作为YOLO系列网络主干网络的可行性

YOLO(You Only Look Once)系列网络是一种用于目标检测的实时系统,其设计的一个关键点是速度和精度的平衡。以下是ConvNeXt-Tiny作为YOLO主干网络的可行性分析:

  1. 计算效率: ConvNeXt-Tiny 具有高效的计算特性,这对于实时目标检测任务至关重要。其优化的卷积架构可以在保证精度的同时,提供更快的推理速度。

  2. 特征提取能力: ConvNeXt-Tiny 的设计增强了特征提取的能力,特别是在捕捉图像细节方面。这对于目标检测任务非常重要,因为精确的特征提取是提高检测精度的基础。

  3. 兼容性: 由于ConvNeXt-Tiny 保留了传统卷积神经网络的基本结构,迁移到YOLO架构中相对简单,能够利用现有的优化方法和硬件加速。

  4. 模型大小与复杂度: ConvNeXt-Tiny 的模型大小和复杂度适中,这使得它可以在保持高检测精度的同时,不会大幅增加YOLO网络的计算负担。

替换ConvNeXt-Tiny(基于MMYOLO)

如果想要使用在 MMPretrain 中实现的主干网络,需要先安装 MMPretrain

##官方提供的安装命令
##如果安装不成功的可以考虑直接把压缩包下载下来进行安装
git clone https://github.com/open-mmlab/mmpretrain.git
cd mmpretrain
mim install -e .

OpenMMLab 2.0 体系中 MMYOLO、MMDetection、MMClassification、MMSelfsup 中的模型注册表都继承自 MMEngine 中的根注册表,允许这些 OpenMMLab 开源库直接使用彼此已经实现的模块。 因此用户可以在 MMYOLO 中使用来自 MMDetection、MMClassification、MMSelfsup 的主干网络,而无需重新实现。

假设想将'ConvNeXt-Tiny'作为 'yolov5' 的主干网络,则配置文件如下:

_base_ = './yolov5_s-v61_syncbn_8xb16-300e_coco.py'# 导入 mmpretrain.models 使得可以调用 mmpretrain 中注册的模块
custom_imports = dict(imports=['mmpretrain.models'], allow_failed_imports=False)
checkpoint_file = 'https://download.openmmlab.com/mmclassification/v0/convnext/downstream/convnext-tiny_3rdparty_32xb128-noema_in1k_20220301-795e9634.pth'  # noqa
deepen_factor = _base_.deepen_factor
widen_factor = 1.0
channels = [192, 384, 768]model = dict(backbone=dict(_delete_=True, # 将 _base_ 中关于 backbone 的字段删除type='mmpretrain.ConvNeXt', # 使用 mmcls 中的 ConvNeXtarch='tiny',out_indices=(1, 2, 3),drop_path_rate=0.4,layer_scale_init_value=1.0,gap_before_final_norm=False,init_cfg=dict(type='Pretrained', checkpoint=checkpoint_file,prefix='backbone.')), # MMCls 中主干网络的预训练权重含义 prefix='backbone.',为了正常加载权重,需要把这个 prefix 去掉。neck=dict(type='YOLOv5PAFPN',deepen_factor=deepen_factor,widen_factor=widen_factor,in_channels=channels, # 注意:ConvNeXt-Tiny 输出的3个通道是 [192, 384, 768],和原先的 yolov5-s neck 不匹配,需要更改out_channels=channels),bbox_head=dict(type='YOLOv5Head',head_module=dict(type='YOLOv5HeadModule',in_channels=channels, # head 部分输入通道也要做相应更改widen_factor=widen_factor))
)

相关文章:

【YOLO改进】换遍MMPretrain主干网络之ConvNeXt-Tiny(基于MMYOLO)

ConvNeXt-Tiny ConvNeXt-Tiny 是一种改进的卷积神经网络架构,其设计目的是在保持传统卷积神经网络优势的同时,借鉴了一些Transformer架构的成功经验。 ConvNeXt-Tiny 的优点 架构优化: ConvNeXt-Tiny 对经典ResNet架构进行了多种优化&#…...

【数据库】MySQL

文章目录 概述DDL数据库操作查询使用创建删除 表操作创建约束MySqL数据类型数值类型字符串类型日期类型 查询修改删除 DMLinsertupdatedelete DQL基本查询条件查询分组查询分组查询排序查询分页查询 多表设计一对多一对一多对多设计步骤 多表查询概述内连接外连接 子查询标量子…...

JVM运行时内存:垃圾回收器(Serial ParNew Parallel )详解

文章目录 1. 查看默认GC2. Serial GC : 串行回收3. ParNew GC:并行回收4. Parallel GC:吞吐量优先 1. 查看默认GC -XX:PrintCommandLineFlags:查看命令行相关参数(包含使用的垃圾收集器)使用命令行指令:ji…...

The Missing Semester of Your CS Education(计算机教育中缺失的一课)

Shell 工具和脚本(Shell Tools and Scripting) 一、shell脚本 1.1、变量赋值 在bash中为变量赋值的语法是foobar,访问变量中存储的数值,其语法为 $foo。 需要注意的是,foo bar (使用空格隔开)是不能正确工作的&…...

如何为ChatGPT编写有效的提示词:软件开发者的指南

作为一名软件开发者,特别是使用Vue进行开发的开发者,与ChatGPT等AI助手高效互动,可以极大地提升你的开发效率。本文将深入探讨如何编写有效的提示词,以便从ChatGPT中获取有用的信息和帮助。 1. 明确目标 在编写提示词之前&#…...

angular插值语法与属性绑定

在 Angular 中&#xff0c;您提供的两种写法都是用来设置 HTML 元素的 title 属性&#xff0c;但它们的工作方式有所不同&#xff1a; 插值语法 (Interpolation) <h1 title"{{ name }}">我的名字</h1> 属性绑定 (Property Binding) <h1 [title]&q…...

Python ❀ 使用代码解决今天中午吃什么的重大生存问题

1. 环境安装 安装Python代码环境参考文档 2. 代码块 import random# 准备一下你想吃的东西 hot ["兰州拉面", "爆肚面", "黄焖鸡", "麻辣香锅", "米线", "麻食", "羊肉泡馍", "肚丝/羊血汤&qu…...

做抖音小店需要清楚的5个核心点!

大家好&#xff0c;我是喷火龙。 不管你是在做抖音小店&#xff0c;还是在做其他的电商平台&#xff0c;如果已经做了一段时间了&#xff0c;但还是没有拿到什么结果&#xff0c;我所指的结果不是什么大结果&#xff0c;而是连温饱都解决不了&#xff0c;甚至说还在亏钱。 有…...

文件流下载优化:由表单提交方式修改为Ajax请求

如果想直接看怎么写的可以跳转到 解决方法 节&#xff01; 需求描述 目前我们系统导出文件时&#xff0c;都是通过表单提交后&#xff0c;接收文件流自动下载。但由于在表单提交时没有相关调用前和调用后的回调函数&#xff0c;所以我们存在的问题&#xff0c;假如导出数据需…...

基础3 探索JAVA图形编程桌面:逻辑图形组件实现

在一个宽敞明亮的培训教室里&#xff0c;阳光透过窗户柔和地洒在地上&#xff0c;教室里摆放着整齐的桌椅。卧龙站在讲台上&#xff0c;面带微笑&#xff0c;手里拿着激光笔&#xff0c;他的眼神中充满了热情和期待。他的声音清晰而洪亮&#xff0c;传遍了整个教室&#xff1a;…...

前后端部署笔记

windows版&#xff1a; 如果傻呗公司让用win电脑部署&#xff0c;类似于我们使用笔记本做局域网服务器&#xff0c;社内使用。 1.安装win版的nginx、mysql、node、jdk等 2.nginx开机自启参考Nginx配置及开机自启动&#xff08;Windows环境&#xff09;_nginx开机自启动 wind…...

设计模式9——适配器模式

写文章的初心主要是用来帮助自己快速的回忆这个模式该怎么用&#xff0c;主要是下面的UML图可以起到大作用&#xff0c;在你学习过一遍以后可能会遗忘&#xff0c;忘记了不要紧&#xff0c;只要看一眼UML图就能想起来了。同时也请大家多多指教。 适配器模式&#xff08;Adapte…...

一文了解基于ITIL的运维管理体系框架

本文来自腾讯蓝鲸智云社区用户&#xff1a;CanWay ITIL&#xff08;Information Technology Infrastructure Library&#xff09;是全球最广泛使用的 IT 服务管理方法&#xff0c;旨在帮助组织充分利用其技术基础设施和云服务来实现增长和转型。优化IT运维&#xff0c;作为企业…...

Web前端开发技术-格式化文本 Web页面初步设计

目录 Web页面初步设计 标题字标记 基本语法&#xff1a; 语法说明&#xff1a; 添加空格与特殊符号 基本语法&#xff1a; 语法说明: 特殊字符对应的代码: 代码解释&#xff1a; 格式化文本标记 文本修饰标记 计算机输出标记 字体font标记 基本语法&#xff1a; 属…...

Windows下部署Seata1.5.2,解决Seata无法启动问题

目录 1. 版本说明 2. Windows下部署Seata1.5.2 2.1 创建回滚日志表undo_log 2.2 创建Seata服务端需要的四张表 2.3 在nacos创建seata命名空间&#xff0c;添加seataServer.yml配置 2.4 修改本地D:/tool/seata-server-1.5.2/seata/conf/applicaltion.yml文件 2.5 启动Seat…...

我加入了C++交流社区

最近&#xff0c;我决定加入了一个C交流社区&#xff0c;这是一个专注于C编程语言的在线平台。加入这个社区的初衷是为了提升我的编程技能&#xff0c;与其他对C感兴趣的人交流经验和知识。 加入这个社区后&#xff0c;我发现了许多有趣的讨论和资源。每天都有各种各样的话题&…...

Vue从入门到实战Day11

一、为什么要学Vue3 Vue3官网&#xff1a;简介 | Vue.js 1. Vue3的优势 2. Vue2选项式API vs Vue3组合式API 示例&#xff1a; 二、create-vue搭建Vue3项目 1. 认识create-vue create-vue是Vue官方新的脚手架工具&#xff0c;底层切换到了vite(下一代构建工具)&#xff0c;为…...

day15|各种遍历的应用

相关题目&#xff1a; 层次遍历会一打十 反转二叉树 对称二叉树 层次遍历会一打十 自底向上的层序遍历 实现思路&#xff1a;层次遍历二叉树&#xff0c;将遍历后的结果revers即可 public List<List<Integer>> levelOrderBottom(TreeNode root) {List<List&l…...

第12周作业--HLS入门

目录 一、HLS入门 二、HLS入门程序编程 创建项目 1、点击Vivado HLS 中的Create New Project 2、设置项目名 3、加入文件 4、仿真 3、综合 一、HLS入门 1. HLS是什么&#xff1f;与VHDL/Verilog编程技术有什么关系? HLS&#xff08;High-Level Synthesis&#xff0c…...

WorkManager使用技巧及各Android版本适配

WorkManager使用技巧及各Android版本适配 WorkManager是Android Jetpack中用于处理异步任务的库&#xff0c;它能够保证任务即使在应用关闭或设备重启后也能被执行。以下是WorkManager的使用技巧和代码示例&#xff0c;以及不同Android版本的适配方法。 1. 初始化WorkManager…...

AI Agent 项目学习笔记(十):文件操作、终端执行与 PDF 生成工具

1. 本期目标 上一篇文章分析了 ai_agent 项目中的三个联网工具&#xff1a; WebSearchTool WebScrapingTool ResourceDownloadTool它们主要解决的是&#xff1a; 智能体如何从外部网络获取信息&#xff1f;这一期继续分析工具模块中的另一类能力&#xff1a; 本地执行与结果…...

如何快速上手OOMAO:MATLAB自适应光学仿真终极指南

如何快速上手OOMAO&#xff1a;MATLAB自适应光学仿真终极指南 【免费下载链接】OOMAO Object-Oriented, Matlab & Adaptive Optics 项目地址: https://gitcode.com/gh_mirrors/oo/OOMAO OOMAO&#xff08;Object-Oriented, Matlab & Adaptive Optics&#xff09…...

职场新人不会写自我介绍怎么办?AI三分钟帮你搞定,面试邀约直接翻倍!

嘿&#xff0c;各位刚踏入职场的小萌新、想跳槽但又苦于没新项目亮点的打工人&#xff01;你是不是也遇到过这种尴尬&#xff1a;辛辛苦苦写完简历&#xff0c;最后却卡在“自我介绍”或者“个人总结”那块&#xff1f; 要么就是寥寥几句套话&#xff0c;像“本人性格开朗&…...

安装 KubeSphere

安装 KubeSphere KubeSphere Core (ks-core) 是 KubeSphere 的核心组件&#xff0c;为扩展组件提供基础的运行环境。KubeSphere Core 安装完成后&#xff0c;即可访问 KubeSphere Web 控制台。 1. 安装 KubeSphere Core 在集群节点上&#xff0c;执行以下命令安装 KubeSpher…...

保姆级教程:在Vue3项目中用ZLMediaKit+WebRTC实现超低延迟监控直播(附完整代码)

Vue3WebRTC超低延迟监控直播实战指南 在实时视频监控领域&#xff0c;延迟是衡量系统性能的核心指标之一。传统RTSP流媒体方案在Web端实现时&#xff0c;往往面临秒级甚至更长的延迟&#xff0c;这在对实时性要求极高的安防监控、工业检测等场景中成为致命短板。本文将深入探讨…...

WeChatFerry:微信机器人自动化框架的终极技术指南

WeChatFerry&#xff1a;微信机器人自动化框架的终极技术指南 【免费下载链接】WeChatFerry 微信机器人&#xff0c;可接入DeepSeek、Gemini、ChatGPT、ChatGLM、讯飞星火、Tigerbot等大模型。微信 hook WeChat Robot Hook. 项目地址: https://gitcode.com/GitHub_Trending/w…...

G3000,MG3660,MG3640S,TS3380,G3800,TS3480,TS3680,TS3460,TS3350,MG6380报错5B00,P07,E08,1700,5b04废墨垫清零,好用

下载&#xff1a;点这里下载 备用下载&#xff1a;https://pan.baidu.com/s/1WrPFvdV8sq-qI3_NgO2EvA?pwd0000 常见型号如下&#xff1a; G系列 G1000、G1100、G1200、G1400、G1500、G1800、G1900、G1010、G1110、G1120、G1410、G1420、G1411、G1510、G1520、G1810、G1820、…...

U8 ERP接口二次封装实战:用Net4.8+WebAPI打造比OpenAPI更香的内网集成方案

U8 ERP接口二次封装实战&#xff1a;用Net4.8WebAPI打造比OpenAPI更香的内网集成方案 在传统制造业数字化转型浪潮中&#xff0c;ERP系统作为企业核心数据枢纽&#xff0c;其接口能力直接决定了IT生态的扩展性。用友U8作为国内主流ERP解决方案&#xff0c;虽然提供了EAI、原生A…...

仿冒 Word 钓鱼攻击中可信远程工具滥用机理与企业防御研究

摘要 2026 年 5 月安全事件监测显示&#xff0c;以仿冒 Word 在线页面为诱饵、滥用合法远程管理工具实现内网渗透的新型钓鱼攻击&#xff0c;正成为企业安全防护的典型盲区。该攻击以 Outlook 钓鱼邮件为入口&#xff0c;诱导用户访问伪造的 Word Online/OneDrive 预览页面&…...

2026年AI写作辅助平台实测排行,哪款真正适合顺利通关?

2026 年学术 AI 论文工具已形成全流程、理工 / 社科、英文 / 中文、免费 / 付费的清晰分化。综合实测排行与场景适配&#xff0c;千笔AI 是中文全能首选&#xff0c;DeepSeek 学术版是理工开源首选&#xff0c;毕业之家是国内毕业专属首选。 一、2026 年实测排行 TOP5&#xff…...