当前位置: 首页 > article >正文

低算力适配!面向采摘机器人的改进 YOLOv8 实现遮挡花椒精准识别

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12894851/pdf/41598_2026_Article_36671.pdf计算机视觉研究院专栏Column of Computer Vision Institute本文提出的Red-YOLO 轻量检测模型精准又轻巧完美适配采摘机器人嵌入式设备PART/1痛点花椒采摘机器人的 “视觉困境”花椒采摘机器人的核心是视觉识别但传统模型全踩坑两阶段检测模型如 Faster R-CNN精度够但速度慢、参数大带不动嵌入式设备普通 YOLO 模型面对花椒密集重叠、枝叶遮挡容易漏检、误检花椒簇分松散型、紧凑型抓取力度和末端执行器尺寸需适配无专用数据集支撑。为解决这些问题团队自研数据集 优化模型打造出专属花椒的 Red-YOLO。PART/2实验准备专属花椒数据集精准标注不马虎没有公开花椒数据集团队直接实地采集采集地点四川汉源县皇木镇、清溪镇采集数据960 张高清花椒图分松散簇 600 张、紧凑簇 360 张数据增强松散簇用亮度、翻转、网格畸变等 5 种增强紧凑簇剔除网格畸变最终生成训练集 4320 张、验证集 540 张、测试集 96 张标注方式LabelImg 工具 YOLO 格式标注双人交叉核对确保精准。数据集构成、增强方法及划分对比表PART/3模型模型升级三大优化让 Red-YOLO 又准又轻以YOLOv8n为基础模型做三大关键改进平衡精度与轻量化1. 加入 CBAM 注意力机制在主干网络嵌入 CBAM通道 空间双重注意力自动聚焦花椒簇压制枝叶、光照等背景干扰小目标和遮挡花椒也能精准捕捉。CBAM 模块结构示意图2. 替换轻量卷积模块用GSConvVoV-GSCSP替换原卷积和 C2f 模块减少冗余计算模型更轻巧推理速度更快。GSConv 与 VoV-GSCSP 模块结构3. 升级 CARAFE 上采样替换传统最近邻插值内容自适应特征重组保留花椒簇细节结构密集重叠区域也能清晰识别。CARAFE 模型结构PART/4实验效果炸裂碾压主流模型适配嵌入式设备实验数据说话Red-YOLO 完胜 SSD、Faster R-CNN 及多款 YOLO 模型精度拉满精确率91.8%、召回率94.1%、mAP50 达96.2%全面超越对比模型极致轻量参数仅2.9M计算量7.7GFlops比基础 YOLOv8n 更小巧场景适配小目标、遮挡、背景模糊等复杂果园场景零漏检、零误检。各类模型检测效果对比表不同模型花椒检测效果可视化对比Red-YOLO 检测热力图消融实验也证实CBAM、VoV-GSCSP、CARAFE 三大模块缺一不可叠加后性能最优。模型消融实验结果表PART/5总结未来展望让花椒采摘全面智能化Red-YOLO 已为红花椒智能采摘机器人打下坚实视觉基础后续团队将扩充多品种、多地域、多角度数据集提升模型泛化性进一步轻量化优化适配更低算力设备结合多视角感知优化动态采摘识别。从 “人工刺手摘” 到 “机器人精准采”Red-YOLO 让红花椒产业智能化再进一步未来这项技术还能推广到其他小浆果、簇生作物采摘助力农业智慧升级有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测

相关文章:

低算力适配!面向采摘机器人的改进 YOLOv8 实现遮挡花椒精准识别

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12894851/pdf/41598_2026_Article_36671.pdf计算机视觉研究院专栏Column of Computer Vision …...

C++ 类设计实践(一):自定义 String 类与顺序栈

引言在学完 C 的类、构造函数、析构函数、拷贝控制、运算符重载、模板等核心知识后,动手设计一个完整的类是最好的巩固方式。今天,我将通过两个实践项目来检验这些知识的掌握程度:自定义 String 类:模拟标准库 std::string 的核心…...

Python自动化仿真终极指南:用MPh脚本化你的COMSOL多物理场工作流

Python自动化仿真终极指南:用MPh脚本化你的COMSOL多物理场工作流 【免费下载链接】MPh Pythonic scripting interface for Comsol Multiphysics 项目地址: https://gitcode.com/gh_mirrors/mp/MPh 还在为重复的COMSOL仿真操作感到疲惫吗?&#x1…...

终极指南:Agent创业机会,从垂直领域切入

终极指南:Agent创业机会,从垂直领域切入 引言 痛点引入:AI Agent浪潮下,普通创业者/技术人该怎么抢滩? 过去两年的AI技术发展,完全是“天翻地覆”级别的——ChatGPT的诞生把通用大语言模型(LLM&…...

基于LangGraph与多智能体协作的AI内容生成系统实战解析

1. 项目概述:一个基于多智能体协作的AI内容生成系统如果你也像我一样,经常被各种报告、方案、甚至小说创作的需求搞得焦头烂额,那么今天分享的这个项目,可能会成为你的“生产力倍增器”。我最近深度体验并拆解了一个名为“XunLong…...

LinkSwift网盘直链下载助手:免费解锁八大网盘高速下载的终极指南

LinkSwift网盘直链下载助手:免费解锁八大网盘高速下载的终极指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云…...

Amlogic S9xxx Armbian历史版本获取指南:解决新内核不兼容的实战方案

Amlogic S9xxx Armbian历史版本获取指南:解决新内核不兼容的实战方案 【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, s905w, s905, s…...

3分钟掌握RPG Maker解密工具:轻松提取游戏资源

3分钟掌握RPG Maker解密工具:轻松提取游戏资源 【免费下载链接】RPGMakerDecrypter Tool for decrypting and extracting RPG Maker XP, VX and VX Ace encrypted archives and MV and MZ encrypted files. 项目地址: https://gitcode.com/gh_mirrors/rp/RPGMaker…...

5分钟快速上手StarRailCopilot:崩坏星穹铁道智能自动化助手

5分钟快速上手StarRailCopilot:崩坏星穹铁道智能自动化助手 【免费下载链接】StarRailCopilot 崩坏:星穹铁道脚本 | Honkai: Star Rail auto bot (简体中文/繁體中文/English/Espaol) 项目地址: https://gitcode.com/gh_mirrors/st/StarRailCopilot …...

我从前熬夜整理会议纪要熬到头秃,后悔没早用!2026自动生成会议纪要真的太香了

上个月刚经历完因为会议纪要出错扣半个月绩效的社死现场,作为每周要泡在四五个会里的内容创作者,我前两年光是整理会议、访谈录音,每周就能耗掉我10小时以上,熬到发缝变宽都没解决问题。测了不下10款自动纪要工具,我可…...

如何在现代显示器上完美体验《植物大战僵尸》?PvZWidescreen宽屏模组彻底告别黑边困扰

如何在现代显示器上完美体验《植物大战僵尸》?PvZWidescreen宽屏模组彻底告别黑边困扰 【免费下载链接】PvZWidescreen Widescreen mod for Plants vs Zombies 项目地址: https://gitcode.com/gh_mirrors/pv/PvZWidescreen 还在为经典游戏《植物大战僵尸》在…...

Rust 所有权系统:借用检查器与生命周期

# Rust异步编程:Tokio运行时深度解析> **版本说明**:本文基于 Tokio 1.x 版本和 Rust 1.75 编写,所有代码示例均经过测试验证。## 📚 引言异步编程是现代高性能服务的基石,而 Tokio 作为 Rust 生态中最成熟的异步运…...

别再只用来校验文件了!聊聊哈希值在Python、Java和数据库里的5个实战骚操作

哈希值的五大高阶应用:从数据去重到分布式系统的实战技巧 开发者在日常工作中经常使用哈希值进行简单的数据校验,但它的潜力远不止于此。当我们将哈希算法与特定编程语言特性、数据库优化和系统设计相结合时,能解锁许多令人惊喜的高级用法。…...

NVIDIA Grace CPU架构解析与数据中心能效优化实践

1. NVIDIA Grace CPU家族:数据中心效率革命的核心引擎当全球数据量以每年23%的速度增长,传统CPU架构却陷入性能提升瓶颈时,数据中心的能效比成为决定未来计算能力的关键指标。作为从业十五年的数据中心架构师,我见证过无数次硬件迭…...

SpringBoot配置文件加密进阶:手把手教你自定义Jasypt加密算法和前缀后缀(告别默认ENC)

SpringBoot配置文件加密进阶:手把手教你自定义Jasypt加密算法和前缀后缀(告别默认ENC) 在企业级应用开发中,配置文件的安全性往往被忽视,尤其是数据库连接信息、API密钥等敏感数据。虽然Jasypt提供了开箱即用的ENC()加…...

Edgi-Talk开发套件:边缘AI全栈解决方案解析

1. Edgi-Talk开发套件核心解析这款由英飞凌和RT-Thread联合设计的开发板,本质上是一个面向边缘AI场景的全栈解决方案。PSOC Edge E84 SoC的双核架构设计非常有意思——400MHz的Cortex-M55主攻AI运算,搭配200MHz的Cortex-M33处理常规任务,这种…...

如何自动同步SQL异构表数据_利用触发器实现实时数据复制

不能,触发器仅支持同库同结构表的同步;跨库或异构场景需用binlogDebeziumKafka自定义消费者方案。触发器能自动同步异构表吗?不能,别硬套触发器本身不解决异构问题——它只在同库同结构的表上可靠运行。INSERT、UPDATE、DELETE 触…...

长沙心理医院暖心指南+真实案例分享

随着社会节奏加快,心理健康问题逐渐成为影响个人生活质量与社会和谐的重要因素。在长沙,作为中部核心城市,心理疾病就诊需求持续攀升,但与此同时,患者在就医过程中仍面临诸多挑战。据相关统计显示,长沙市居…...

青少年心理咨询指南:真实案例分享与暖心复盘

行业痛点分析当前长沙心理领域面临多重技术挑战。一方面,青少年心理问题呈现高发趋势,但社会对精神心理疾病仍存在认知偏差,导致病耻感普遍,许多学生因“怕被贴标签”而拒绝求助。另一方面,三甲医院心理科号源紧张&…...

终极解决方案:3分钟搞定Windows与iPhone网络共享驱动安装

终极解决方案:3分钟搞定Windows与iPhone网络共享驱动安装 【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/gh_…...

解锁音乐自由:ncmdumpGUI带你轻松解密网易云NCM格式

解锁音乐自由:ncmdumpGUI带你轻松解密网易云NCM格式 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾在网易云音乐下载了心爱的歌曲&#x…...

如何为魔兽争霸3解锁180fps帧率限制:WarcraftHelper完整配置指南

如何为魔兽争霸3解锁180fps帧率限制:WarcraftHelper完整配置指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 魔兽争霸3作为经典RTS游戏…...

VS Code Copilot Next 配置避坑黄金三角:权限粒度 × 语言服务器绑定 × Workspace Trust 状态(实测137次失败回溯)

更多请点击: https://intelliparadigm.com 第一章:VS Code Copilot Next 自动化工作流配置避坑指南 VS Code Copilot Next(v1.120)引入了基于 Workspace Trust 和 Language Server Protocol 的深度集成机制,但默认配…...

远程容器开发效率提升300%:VS Code Dev Containers 7个被90%开发者忽略的优化开关

更多请点击: https://intelliparadigm.com 第一章:Dev Containers 效率瓶颈的真相诊断 Dev Containers 本应简化环境一致性与协作开发,但实践中常遭遇构建缓慢、容器启动卡顿、VS Code 扩展加载失败等隐性性能衰减。这些现象并非源于设计缺陷…...

PTA天梯赛L2-012通关秘籍:手把手教你用C++搞定小顶堆的四种关系判断

PTA天梯赛L2-012通关秘籍:手把手教你用C搞定小顶堆的四种关系判断 在算法竞赛的战场上,堆结构就像瑞士军刀般不可或缺。今天我们要破解的PTA天梯赛L2-012题目,正是考察小顶堆构建与关系判断的经典案例。这道题看似简单,却暗藏多个…...

云原生智能流量代理trae-agent:动态路由、负载均衡与熔断限流实战

1. 项目概述:一个面向云原生时代的智能流量代理最近在梳理团队内部的微服务治理工具链时,又仔细研究了一下bytedance/trae-agent这个项目。它不是一个简单的反向代理,而是一个设计理念相当超前的“智能流量代理”。简单来说,它就像…...

2026年怎么集成OpenClaw/Hermes Agent?零基础部署及token Plan配置步骤

2026年怎么集成OpenClaw/Hermes Agent?零基础部署及token Plan配置步骤。OpenClaw(前身为Clawdbot/Moltbot)作为开源、本地优先的AI助理框架,凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力,成为个人办…...

WASM边缘服务上线倒计时:Docker Compose v2.22起支持wasm32-wasi,但92%开发者还没启用这个flag

更多请点击: https://intelliparadigm.com 第一章:Docker WASM 边缘计算部署指南 如何实现快速接入 WebAssembly(WASM)正成为边缘计算场景中轻量、安全、跨平台执行逻辑的关键载体,而 Docker 官方自 2023 年起通过 do…...

Arm Total Compute时钟控制架构与低功耗设计解析

1. Arm Total Compute时钟控制架构解析在Arm Total Compute 2022参考设计中,时钟控制系统采用分层架构设计,由CPU PIK(Power Integration Kit)和System PIK两大模块组成。这种设计源于现代SoC对精细功耗管理的需求——传统的一体式…...

从零到生产:手把手教你用MySQL 5.7为Hive 3.1.3配置远程元数据库

从零到生产:手把手教你用MySQL 5.7为Hive 3.1.3配置远程元数据库 在数据仓库的构建过程中,Hive作为Hadoop生态系统中的重要组件,其元数据管理方式直接影响着系统的稳定性和可扩展性。许多初学者习惯使用默认的Derby数据库存储元数据&#xff…...