当前位置: 首页 > news >正文

解读CVPR2024-论文分享|RepViT: Revisiting Mobile CNN From ViT Perspective

论文标题

RepViT: Revisiting Mobile CNN From ViT Perspective

论文链接:

https://arxiv.org/abs/2307.09283

论文作者

Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding

内容简介

这篇论文探讨了在资源受限的移动设备上,轻量级视觉变换器(ViTs)与轻量级卷积神经网络(CNNs)的性能和延迟。作者发现,尽管轻量级ViTs在性能上优于轻量级CNNs,但在硬件和计算库支持方面存在实际挑战。因此,研究团队重新审视了轻量级CNN的设计,并强调了其在移动设备部署上的潜力。通过将轻量级ViTs的高效架构设计集成到标准轻量级CNN(MobileNetV3)中,研究者们提出了一个新的轻量级CNN系列——RepViT。实验结果表明,RepViT在各种视觉任务中超越了现有的轻量级ViTs,并在延迟方面表现出优势。

方法

1.架构设计:

研究者们从MobileNetV3-L开始,逐步将其“现代化”,通过整合轻量级ViTs的高效架构设计。这个过程包括将ViTs的MetaFormer结构和Reparameterization卷积整合到CNN中,形成了新的RepViT块。

2.延迟度量:

为了更准确地评估模型在移动设备上的性能,研究者们使用实际设备(iPhone 12)上的延迟作为基准度量,而不是依赖于FLOPs或模型大小等传统指标。

3.训练方案对齐:

为了公平比较,研究者们将MobileNetV3-L的训练方案与现有的轻量级ViTs对齐,包括使用AdamW优化器、余弦学习率调度器、Mixup、自动增强和随机擦除等技术。

4.块设计:

研究者们分离了token mixer和channel mixer,并减少了扩张比,同时增加了网络宽度,以提高性能和减少延迟。

 

5.宏观设计:

对网络的宏观架构进行了优化,包括简化的stem、更深的下采样层和简化的分类器,以及调整整体阶段比。

 

6.微观设计:

关注于轻量级CNN的微观架构,包括内核大小选择和squeeze-and-excitation(SE)层的放置。

7.网络架构:

开发了多个RepViT变体,包括RepViT-M0.9/M1.0/M1.1/M1.5/M2.3,这些变体在通道数和每个阶段的块数上有所不同。

 

结论

RepViT作为一种新的轻量级CNN,不仅在性能上超越了现有的轻量级ViTs和CNNs,而且在延迟方面表现出色,特别是在移动设备上。这项工作不仅为轻量级模型的研究提供了一个强有力的基线,而且激发了对边缘部署轻量级模型的进一步研究。

CVPR2024论文合集链接:

https://arxiv.org/abs/2307.09283

希望这些论文能帮到你!如果觉得有用,记得点赞关注哦~ 后续还会更新更多论文合集!!

相关文章:

解读CVPR2024-论文分享|RepViT: Revisiting Mobile CNN From ViT Perspective

论文标题 RepViT: Revisiting Mobile CNN From ViT Perspective 论文链接: https://arxiv.org/abs/2307.09283 论文作者 Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding 内容简介 这篇论文探讨了在资源受限的移动设备上,轻量级视觉变…...

linux部署安装wordpress

一、环境准备 首先我们先介绍下环境和实验中所需要的包 环境: 我使用的是centos7.6的系统 建议关掉selinux和影响到80端口的防火墙策略 selinux永久有效 修改 /etc/selinux/config 文件中的 SELINUX"" 为 disabled ,然后重启。 selinux即…...

[Java] 配置Powershell 的 Maven 环境变量

目录 前言单独为 Powershell 设置 Maven 环境变量 前言 安装使用 maven 的时候发现,明明已经配置好了环境变量。但是在 powershell 中还是无法识别 mvn 命令。原来这货需要另外配置。 单独为 Powershell 设置 Maven 环境变量 要在 PowerShell 中永久配置 Maven 环…...

Android -- [SelfView] 自定义弹窗式颜色选择器

Android – [SelfView] 自定义弹窗式颜色选择器 PS: 1. 弹框式显示; 2. 支持透明度设置; 3. 支持拖动控件选择颜色; 4. 支持 ARGB | HEX 数值填写预览颜色并返回; 5. 输出支持Hex 和 Int 两种格式;效果 使用方法&…...

vue-echarts高度缩小时autoresize失效

背景 项目中采用动态给x-vue-echarts style赋值width&#xff0c;height的方式实现echarts图表尺寸的改变 <v-chart...autoresize></v-chart>给v-chart添加autoresize后&#xff0c;在图表宽度变化&#xff0c;高度增加时无异常&#xff0c;高度减小时图表并未缩…...

rabbitMq的rabbitmqctl status报错

Error: unable to perform an operation on node rabbitASUS-PC. Please see diagnostics information and suggestions below. 遇到上图这个错大部分问题可能是由于 RabbitMQ CLI 工具的 Erlang Cookie 与服务器上的不匹配而导致连接问题。Erlang Cookie 在 RabbitMQ 节点之间…...

linux c++ uuid编译时的问题

linux c uuid编译时的问题 写在前面可能编译过和不能编译过的可以编译和link过的不能编译过的 写在前面 几次翻车与uuid相关&#xff0c;超出我认知。 所以&#xff0c;把一些遇到的相关问题写在这里。 可能编译过和不能编译过的 可以编译和link过的 cmake_minimum_require…...

【STM32】RTT-Studio中HAL库开发教程九:FLASH中的OPT

文章目录 一、概要二、内部FLASH排布三、内部FLASH主要特色四、OTP函数介绍五、测试验证 一、概要 STM32系列是一款强大而灵活的微控制器&#xff0c;它的片内Flash存储器可以用来存储有关代码和数据&#xff0c;在实际应用中&#xff0c;我们也需要对这个存储器进行读写操作。…...

[SWPUCTF 2021 新生赛]crypto9

[MoeCTF 2021]Web安全入门指北—GET 意思是GET传参&#xff0c;moeflag 就可以得到falg 输入?moeflag flag为&#xff1a; NSSCTF{ff26110b-8793-403c-990e-15c7f1820596} [SWPUCTF 2021 新生赛]crypto9 #gpt写的代码 from itertools import product letter_list ABCDEFG…...

vue中常用的指令

v - if 指令 功能详细解释 它是一种真正的条件渲染指令。在 Vue 实例初始化以及数据更新过程中&#xff0c;Vue.js 会对v - if指令中的表达式进行求值。这个表达式可以是简单的布尔变量&#xff0c;也可以是一个复杂的计算表达式&#xff0c;只要最终结果是布尔值就行。当表达式…...

Docker Compose实战三:轻松部署PHP

通过前面的文章&#xff08;Docker Compose基础语法与MySQL部署&#xff09;&#xff0c;你已经掌握了Docker Compose的基本语法和常用指令&#xff0c;并成功部署了一个MySQL数据库服务器。今天&#xff0c;我们将继续深入探索Docker Compose的强大功能&#xff0c;介绍如何使…...

数据分析实战—房价特征关系

1.实战内容 &#xff08;1&#xff09; 读取房价特征关系表&#xff08;house_price.npz&#xff09;绘制离地铁站的距离与单位面积的房价的散点图&#xff0c;并对其进行分析&#xff1b; import pandas as pd import numpy as np import warnings warnings.filterwarnings(&…...

云和恩墨 zCloud 与华为云 GaussDB 完成兼容性互认证

近日&#xff0c;云和恩墨&#xff08;北京&#xff09;信息技术有限公司&#xff08;以下简称&#xff1a;云和恩墨&#xff09;的多元数据库智能管理平台 zCloud 与华为云计算技术有限公司&#xff08;以下简称&#xff1a;华为云&#xff09;的 GaussDB 数据库完成了兼容性互…...

【大语言模型LangChain】 ModelsIO OutputParsers详解

【大语言模型LangChain】 ModelsIO OutputParsers详解 一、简介二、OutputParsers 的优势三、解析器类型四、实战示例1、String 解析器2、Json 解析器3、Pydantic 解析器4、结构化输出解析器5、OpenAI 函数输出解析器5.1、JsonOutputFunctionsParser5.2、JsonKeyOutputFunction…...

PaddleSpeech本地部署文档

windows安装paddlespeech步骤&#xff1a; 1. 安装vs c编译环境 对于 Windows 系统&#xff0c;需要安装 Visual Studio 来完成 C 编译环境的安装。 Microsoft C Build Tools - Visual Studio 2. 安装conda conda create -y -p paddlespeech python3.8 conda activate pad…...

Android 第三方框架:RxJava:源码分析:责任链模式

文章目录 责任链模式RxJava中的责任链总结 责任链模式 RxJava中的责任链 链式调用的使用过程中形成了两个单向链表 第一个单向链表是Observable链表 它的形成过程&#xff1a; 1.首先调用Observable的静态方法创建第一个Observable对象&#xff0c;作为Observable链表的表…...

网络安全 与 加密算法

计算机中的网络安全 在本篇中介绍了以下几个方面: 机密性 密码学 对称加密算法(DES, 3DES, AES) 公开秘钥算法 RSA大素数的获取 完整性 散列函数(MD5, SHA-1, 并没有提及算法实现) 报文鉴别(MAC) 数字签名 端点鉴别 应用 SSL(TCP网络安全) 运行时安全 防火墙的基本知识 …...

UE4_贴花_贴花基础知识二

五、多表面投射 在本示例中&#xff0c;你将了解贴花如何在多个表面上进行投射。请注意&#xff0c;如果表面朝向与投射方向较为平行&#xff0c;贴花投射时必然会产生一些拉伸。另外&#xff0c;请记住&#xff0c;贴花可以在包括骨骼网格体在内的静态和动态网格体上进行投射。…...

ElasticSearch 搜索、排序、分页功能

一、DSL 查询文档 ElasticSearch 的查询依然是基于 json 风格的 DSL 来实现的。 官方文档&#xff1a;https://www.elastic.co/guide/en/elasticsearch/reference/8.15/query-dsl.html 1.1 DSL 查询分类 常见的查询类型包括&#xff1a; 查询所有&#xff1a;查询出所有数…...

MySQL-9.1.0 实现最基础的主从复制

目录 1 实验介绍 2 实验准备 2.1 创建目录为MySQL挂载使用 2.2 编写 docker-compose.yml 文件 2.3 启动容器 3 主从复制操作 3.1 MASTER 操作指令 3.2 SLAVE1 操作指令 3.3 SLAVE2 操作指令 4 验证是否实现主从 4.1 导入sql脚本查看是否正常主从复制 4.2 检验从库是否看见复制…...

商家客服智能管理系统架构设计与性能优化实战

商家客服智能管理系统架构设计与性能优化实战 面对电商大促期间海量用户的咨询涌入&#xff0c;传统的客服系统往往不堪重负。我记得去年双十一&#xff0c;我们团队维护的客服系统就经历了严峻考验&#xff1a;页面响应时间从平时的200ms飙升到2秒以上&#xff0c;大量用户排队…...

AI训练师真实收入全景图:软件测试员的蓝海突围指南

一、薪资迷雾&#xff1a;从“月入六万神话”到基层现实2026年AI训练师岗位呈现极端薪资分化&#xff0c;需穿透表象看本质&#xff1a;头部光环案例&#xff1a;大厂高阶岗位&#xff08;如AI伦理设计师、大模型优化专家&#xff09;年薪可达60-100万元&#xff0c;但通常要求…...

【C++ 多线程实战精讲】std::thread 线程创建 / 传参 / 同步 / 智能指针 / 生命周期管理

前言C11 正式推出了标准多线程库 <thread>&#xff0c;让跨平台多线程开发变得简单高效。但多线程的坑非常多&#xff1a;线程传参、对象生命周期、数据竞争、锁使用、指针悬空、析构崩溃……本文基于完整可运行工程代码&#xff0c;带你彻底掌握&#xff1a;线程创建、j…...

VideoAgentTrek-ScreenFilter快速部署:基于Docker与ComfyUI的可视化工作流搭建

VideoAgentTrek-ScreenFilter快速部署&#xff1a;基于Docker与ComfyUI的可视化工作流搭建 你是不是也对那些能自动处理视频、实现智能过滤的AI模型感到好奇&#xff0c;但又觉得命令行操作太复杂&#xff0c;参数调整像在猜谜&#xff1f;别担心&#xff0c;今天我们就来聊聊…...

VoxCPM-1.5语音合成作品集:高清自然语音生成效果展示

VoxCPM-1.5语音合成作品集&#xff1a;高清自然语音生成效果展示 1. 开篇&#xff1a;当AI学会"说话" 想象一下&#xff0c;你正在制作一部有声书&#xff0c;需要一位声音温暖、吐字清晰的主播。传统方式可能需要花费数千元聘请专业配音员&#xff0c;录制数小时音…...

Qwen3-0.6B-FP8部署与Git工作流结合:AI代码审查助手

Qwen3-0.6B-FP8部署与Git工作流结合&#xff1a;AI代码审查助手 你有没有遇到过这种情况&#xff1f;团队里新来的小伙伴提交了一段代码&#xff0c;语法上挑不出大毛病&#xff0c;但总觉得逻辑有点绕&#xff0c;或者命名风格不太统一。你作为资深开发&#xff0c;想提点建议…...

Pi0具身智能v1医疗应用:手术辅助机器人原型

Pi0具身智能v1医疗应用&#xff1a;手术辅助机器人原型 1. 引言 想象一下这样一个场景&#xff1a;外科医生正在进行一台精密的心脏手术&#xff0c;手术台旁的机械臂精准地递送器械&#xff0c;实时调整照明角度&#xff0c;还能在关键时刻提供力反馈提醒。这不是科幻电影&a…...

OpenClaw+Qwen3-32B-Chat镜像:3种模型接入方案对比实测

OpenClawQwen3-32B-Chat镜像&#xff1a;3种模型接入方案对比实测 1. 为什么需要测试不同接入方案&#xff1f; 去年冬天&#xff0c;当我第一次在本地部署OpenClaw时&#xff0c;最头疼的问题就是如何选择模型接入方式。作为个人开发者&#xff0c;既希望获得稳定的AI能力&a…...

Nacos如何开启ssl(https)[图文版]

首先,你得有个域名,只有域名才能有ssl 在你的腾讯云或者阿里云控制台把域名解析到nacos所在的ip上面 等待几分钟,打开cmd, ping 刚才的域名,如果返回的是nacos的ip那说明解析成功了 例如你的域名是 ttvv.com 那就 ping ttvv.com 准备证书文件 你的证书通常是 .pem 和 .key …...

ChatGPT聊天记录导出实战:自动化归档与高效管理方案

ChatGPT聊天记录导出实战&#xff1a;自动化归档与高效管理方案 作为一名经常和ChatGPT讨论技术问题的开发者&#xff0c;我发现自己遇到了一个甜蜜的烦恼&#xff1a;聊得越多&#xff0c;积累的“宝藏对话”就越多。这些对话里可能藏着某个复杂问题的解决思路、一段精妙的代…...