当前位置: 首页 > news >正文

论文阅读笔记——《室内服务机器人的实时场景分割算法》

一、主要工作

  • 通过深度可分离卷积膨胀卷积通道注意力机制设计轻量级的高准确度特征提取模块。
  • 融合浅层特征与深层语义特征获得更丰富的图像特征。
  • 在NYUDv2和CamVid数据集上的MIoU分别达到72.7%和59.9%,模型的计算力为4.2GFLOPs,参数量为8.3Mb。

二、残差瓶颈结构

  为了减小参数量同时达到高分割精度,设计了一个残差瓶颈结构作为网络的基础模块,包括2个调整特征通道的1x1卷积、1个深度可分离膨胀卷积、1个通道注意力模块和一条残差连接。

在这里插入图片描述

图2-1 残差瓶颈结构

  设计思路如下:

  • 降维-升维的瓶颈结构。先使用1×1的卷积对通道数进行压缩,压缩后使用3×3深度可分离卷积提取特征,再使用1×1卷积进行特征升维。为增大感受野,提取不同尺度的特征,3×3深度可分离卷积带有膨胀系数。
  • 通道注意力机制模块。在升维卷积操作前加入SE-Net网络的通道注意力机制模块,计算过程如图2-2所示,首先对特征通道进行全局平均池化操作,然后连接全连接层学习每个通道的权重值,并利用Sigmoid函数归一化到[0,1],最后对特征图进行通道加权,从而筛选特征的每个通道的信息,以此进一步提高分割精度。

在这里插入图片描述

图2-2 通道注意力模块计算过程
  • 残差连接。为缓解膨胀卷积引起的稀疏化问题,在瓶颈结构中加入了残差连接,将输入特征图和提取后的特征图相加,从而补充因膨胀卷积稀疏化而在特征提取时丢失的信息,同时残差连接也可以有效避免因网络深度增加而带来的梯度消失问题。

三、网络结构

  • 原文使用的是编码器-解码器的网络结构,在编码器端获取上下文信息和语义信息,在解码器端对提取的特征进行上采样和图像分割。

  • 为实现实时分割,原文没有对解码器进行复杂设计,而是使用高效的特征上采样模块

  • 此外,由于网络越深获取的语义特征越丰富,但空间信息丢失也越多,因此原文设计的网络在解码器阶段对不同层次的特征进行重利用,以高级语义特征融合低级图像特征,从而丰富模型特征,提高模型分割精度。

在这里插入图片描述

图3-1 网络结构图

  原文的结构如图3-1所示,其中,c代表concat操作。模型输入图像尺寸为512×512×3。为有效提取深层语义特征,编码器级联2个特征提取网络。第1级主干网络使用7个残差结构模块作为基础单元构成 特征提取的主干网络,每一个瓶颈结构模块的参数不同,相同通道数的瓶颈结构模块的膨胀率不同,以此获得不同感受野与不同尺度的特征。
  经实验验证,当膨胀率在8以上时,特征图的稀疏化非常严重,严重影响精度。因此,设置膨胀率为2、4或8。经过7个瓶颈结构模块提取深层特征后,对特征图进行上采样送入第2级特征提取网络,第2级特征提取网络由4个瓶颈结构模块和1个平均池化层构成,4个瓶颈结构模块在提取特征的同时融合第1个主干网络特征提取时相同尺度的特征图,减小特征提取时丢失的信息,之后使用平均池化对特征进行多尺度融合,再送入解码器模块。在解码过程中,融合第2个特征提取网络中相同层次的特征,补充特征图细节,最后进行场景分割结果输出。

相关文章:

论文阅读笔记——《室内服务机器人的实时场景分割算法》

一、主要工作 通过深度可分离卷积、膨胀卷积和通道注意力机制设计轻量级的高准确度特征提取模块。融合浅层特征与深层语义特征获得更丰富的图像特征。在NYUDv2和CamVid数据集上的MIoU分别达到72.7%和59.9%,模型的计算力为4.2GFLOPs,参数量为8.3Mb。 二…...

Hive学习——自定义函数UDFUDTF

目录 一、添加依赖 二、编写自定义UDF函数 (一)自定义首字母大写函数 1.java代码 2.hive中运行 (二)自定义字符串全部小写的函数 1.java代码 2.hive运行 (三)创建解析JSON字符串的函数 1.java代码 三、自定义编写UDTF函数 1.java编写 2.hive运行 虽然Hive中内置了…...

自学前端,你必须要掌握的3种定时任务

当你看到这篇博客的时候,一定会和狗哥结下不解之缘,因为狗哥的博客里不仅仅有代码,还有很多代码之外的东西,如果你可以看到最底部,看到投票环节,我相信你一定感觉到了,狗哥的真诚,狗…...

__stack_chk_fail问题分析

一、问题进程收到SIGABRT信号异常退出,异常调用栈显示__stack_chk_fail*** *** *** *** *** *** *** *** *** *** *** *** *** *** *** *** Build fingerprint: Pico/A7H10/PICOA7H10:10/5.5.0/smartcm.1676912090:userdebug/dev-keys Revision: 0 ABI: arm64 Times…...

linux 查看当前系统用户

1.查看当前登录账号(whoami) whoami ---------------------- root2.查看当前账号信息(id) id --------------------------- uid0(root) gid0(root) groups0(root)3.查看/etc/passwd文件 可以看到每行记录对应着一个用户信息,每条记录 共7段 用 冒号: 拼接&#xf…...

AI算法创新赛-人车目标检测竞赛总结05

队伍:AI0000043 1. 算法方案 由于赛题同时要求速度和精度,所以我们优先考虑小模型,在保证模型速度的同时通过模型调优稳 定提升模型精度。此外,由于图片分辨率比较大,且数据集中小目标占比高,我们计划使用…...

CSS 浮动【快速掌握知识点】

目录 前言 一、设置浮动属性 二、确定浮动元素的宽度 三、清除浮动 总结: 前言 CSS浮动是一种布局技术,它允许元素浮动到其父元素的左侧或右侧,从而腾出空间给其他元素。 一、设置浮动属性 使用CSS float属性将元素设置为浮动。例如&…...

在做自动化测试前需要知道的

什么是自动化测试? 做测试好几年了,真正学习和实践自动化测试一年,自我感觉这一个年中收获许多。一直想动笔写一篇文章分享自动化测试实践中的一些经验。终于决定花点时间来做这件事儿。 首先理清自动化测试的概念,广义上来讲&a…...

机器人学习的坚持与收获-2023

所有的机会都需要自己努力去争取,毕竟天会下雨下雪,但是不会掉馅饼。之前写过关于毕业生的一些博文。机器人工程ROS方向应用型本科毕业设计重点课题学生验收成果(暂缓通过)机器人工程ROS方向应用型本科毕业设计重点课题学生验收成…...

RSA签名加密解密

目录Java 接口RSAUtils.java示例中的依赖生成密钥对示例签名示例验证签名示例加密和解密示例Javascript 接口引入依赖生成密钥对示例签名示例验证签名示例加密和解密示例说在最后Java 接口 支持的密钥长度包括4种 RSA512、RSA1024、RSA2048、RSA4096支持的签名算法包括7种 MD2…...

【C语言】数据的存储

☃️内容专栏:【C语言】进阶部分 ☃️本文概括: C语言中的数据类型及其存储方式。 ☃️本文作者:花香碟自来_ ☃️发布时间:2023.2.24 目录 一、数据类型详细介绍 1.1 基本的数据类型 1.2 整型家族 1.3 构造类型 1.4 指针类型…...

「RISC-V Arch」SBI 规范解读(上)

术语 SBI,Supervisor Binary Interface,管理二进制接口 U-Mode,User mode,用户模式 S-Mode,Supervisor mode,监督模式 VS-Mode,Virtualization Supervisor mode,虚拟机监督模式 …...

2023年全国最新二级建造师精选真题及答案5

百分百题库提供二级建造师考试试题、二建考试预测题、二级建造师考试真题、二建证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 51.下列国有资金占控股或者主导地位的依法必须进行招标的项目,可以采取邀请招标的…...

365智能云打印怎么样?365小票无线订单打印机好用吗?

365智能云打印怎么样?365智能云打印是有赞官方首推的订单小票打印机,荣获2016年有赞最佳硬件服务商。可以实现远程云打印,无需连接电脑,只需通过GPRS流量或者WIFI即可连接,不受地理位置和距离限制。365小票无线订单打印…...

细说react源码中的合成事件

最近在做一个功能,然后不小心踩到了 React 合成事件 的坑,好奇心的驱使,去看了 React 官网合成事件 的解释,这不看不知道,一看吓一跳… SyntheticEvent是个什么鬼?咋冒出来了个事件池? 我就一…...

【架构师】零基础到精通——架构演进

博客昵称:架构师Cool 最喜欢的座右铭:一以贯之的努力,不得懈怠的人生。 作者简介:一名Coder,软件设计师/鸿蒙高级工程师认证,在备战高级架构师/系统分析师,欢迎关注小弟! 博主小留言…...

Hadoop命令大全

HDFS分布式文件系统 , 将一个大的文件拆分成多个小文件存储在多台服务器中 文件系统: 目录结构(树状结构) "/" 树根, 目录结构在namenode中维护 目录 1.查看当前目录 2.创建多级目录 3.上传文件 4.查…...

一文带你快速初步了解云计算与大数据

目录 🔍一、云计算基础 1、云计算的概念、特点、关键技术 2、云计算的分类 3、云计算的部署模式 4、云计算的服务模式:IaaS、PaaS、SaaS分别是什么,具体含义要清楚 5、物联网的概念 6、物联网和云计算、大数据的关系 7、了解云计算的…...

STM32 OTA应用开发——通过USB实现OTA升级

STM32 OTA应用开发——通过USB实现OTA升级 目录STM32 OTA应用开发——通过USB实现OTA升级前言1 环境搭建2 功能描述3 BootLoader的制作4 APP的制作5 烧录下载配置6 运行测试结束语前言 什么是OTA? 百度百科:空中下载技术(Over-the-Air Techn…...

JavaScript高级程序设计读书分享之6章——6.2Array

JavaScript高级程序设计(第4版)读书分享笔记记录 适用于刚入门前端的同志 除了 Object,Array 应该就是 ECMAScript 中最常用的类型了。 创建数组 使用 Array 构造函数 在使用 Array 构造函数时,也可以省略 new 操作符。 let colors new Array() let …...

CS231n实战解析:从HOG/HSV特征到图像分类性能提升

1. 图像特征工程入门:为什么HOG和HSV如此重要 第一次接触CS231n作业时,我对HOG和HSV这两个特征提取方法感到既陌生又好奇。直到在CIFAR-10数据集上做了对比实验才发现,使用原始像素训练的模型准确率只有0.51,而加入特征工程后直接…...

RabbitMQ 3.13.0实战:5分钟搞定MQTT 5.0协议配置与特性测试(附Docker命令)

RabbitMQ 3.13.0实战:5分钟搞定MQTT 5.0协议配置与特性测试(附Docker命令) 物联网开发者们,好消息!RabbitMQ 3.13.0正式支持MQTT 5.0协议了。作为消息中间件的标杆产品,这次更新让RabbitMQ在物联网领域的竞…...

OpenClaw与Qwen3-14B联调指南:解决模型响应超时与截断问题

OpenClaw与Qwen3-14B联调指南:解决模型响应超时与截断问题 1. 问题背景与挑战 上周我在尝试用OpenClaw自动化处理一批技术文档时,遇到了一个棘手的问题:当任务链超过5个步骤时,Qwen3-14B模型经常出现响应超时或输出截断。这直接…...

Phi-3-mini-4k-instruct-gguf保姆级教程:开箱即用的GGUF文本生成指南

Phi-3-mini-4k-instruct-gguf保姆级教程:开箱即用的GGUF文本生成指南 1. 认识Phi-3-mini-4k-instruct-gguf Phi-3-mini-4k-instruct-gguf是微软Phi-3系列中的轻量级文本生成模型GGUF版本。这个模型特别适合处理问答、文本改写、摘要整理和简短创作等任务。它最大的…...

5分钟上手MouseClick:让重复点击自动化的3个核心技巧

5分钟上手MouseClick:让重复点击自动化的3个核心技巧 【免费下载链接】MouseClick 🖱️ MouseClick 🖱️ 是一款功能强大的鼠标连点器和管理工具,采用 QT Widget 开发 ,具备跨平台兼容性 。软件界面美观 ,操…...

GPEN老照片修复案例:增强前后对比,效果直观展示

GPEN老照片修复案例:增强前后对比,效果直观展示 1. 引言:老照片修复的痛点与解决方案 翻开泛黄的相册,那些承载着珍贵记忆的老照片往往因为年代久远而变得模糊、褪色甚至破损。传统的手工修复不仅耗时耗力,还需要专业…...

Claude Code编程助手实践:辅助编写cv_resnet101模型调用代码

Claude Code编程助手实践:辅助编写cv_resnet101模型调用代码 不知道你有没有过这样的经历:项目急着要上线,需要调用一个像ResNet101这样的图像分类模型,但对着API文档,光是搞明白参数怎么传、返回结果怎么解析&#x…...

StructBERT语义分析工具实测:一键判断句子相似度,支持GPU加速

StructBERT语义分析工具实测:一键判断句子相似度,支持GPU加速 1. 工具核心价值 StructBERT语义分析工具是一款专为中文文本设计的本地化语义相似度计算解决方案。不同于传统的关键词匹配方法,该工具基于阿里巴巴开源的StructBERT-Large模型…...

短视频 SEO 推广与视频广告投放的区别是什么_短视频 SEO 优化需要结合网站整体 SEO 策略吗

短视频 SEO 推广与视频广告投放的区别是什么_短视频 SEO 优化需要结合网站整体 SEO 策略吗 在当前数字化营销的浪潮中,短视频平台和视频广告投放已经成为许多企业和创作者推广内容、吸引观众的重要手段。对于SEO策略的理解和应用却常常存在误解。今天,我…...

【仅限高级Java架构师查阅】Java外部函数安全沙箱构建指南:禁用dlopen/dlsym、符号白名单校验、Rust FFI桥接实践(含SPI自定义ClassLoader隔离方案)

第一章:Java外部函数优化Java外部函数接口(Foreign Function & Memory API,即JEP 454/459/460/461/462)自JDK 22起正式成为标准特性,为Java与本地代码(如C/C库)的高效互操作提供了零拷贝、类…...