智慧农业——InsectMamba利用状态空间模型对害虫进行分类
介绍
论文地址:https://arxiv.org/abs/2404.03611
害虫分类是农业中的一个重要问题。准确识别有害害虫可减少对作物的损害,确保粮食安全和环境的可持续发展。然而,害虫及其自然环境的高度拟态性和物种多样性使得视觉特征的提取极具挑战性。现有方法很难提取出区分近缘害虫物种所需的细节特征。即使采用了最先进的深度学习方法,由于害虫与背景之间存在很大的相似性,挑战依然存在。在此背景下,亟需开发更有效的害虫分类模型。
拟议方法(InsectMamba)
InsectMamba 的核心 "Mix-SSM 块 "是一种巧妙结合了四种视觉编码方法的结构。具体来说是:
状态空间模型(SSM):能有效地模拟随时间变化的视觉特征。善于捕捉长程依赖关系。
卷积神经网络(CNN):提取局部视觉特征的绝佳工具。
3. 多头自我关注(MSA):可捕捉全局上下文信息,补充 CNN 的不足。
4. 多层感知器(MLP):可有效提取信道方向的特征。
通过结合这四种方法的特点,InsectMamba 能够从多个角度捕捉害虫的视觉特征。
此外,所提出的 "选择性模块 "能自适应地整合通过这些编码方法获得的特征表征。通过动态分配每个通道的重要性,可以有效地模拟害虫特征。
因此,InsectMamba 的创新设计为害虫分类难题提供了全面的解决方案。
试验
本文利用五个昆虫危害分类数据集对 InsectMamba 的性能进行了评估。之所以选择这些数据集,是因为它们的昆虫和背景视觉相似度高,物种多样性大,这使得昆虫损伤分类具有挑战性。具体数据集包括
- 农场昆虫:包括 15 种害虫,有 1 368 个训练数据和 160 个测试数据。
- 农业害虫:包括 12 种农业害虫,有 240 个训练数据和 5 254 个测试数据。
- 昆虫识别:包括 24 种昆虫,有 768 个训练数据和 612 个测试数据。
- 林业害虫识别:包括 31 种害虫,599 个训练数据和 6,564 个测试数据。
- IP102:包括 102 种害虫,1,909 个训练数据和 65,805 个测试数据。
利用这些具有挑战性的数据集,InsectMamba 的性能与现有的强大模型(ResNet、DeiT、Swin Transformer 和 Vmamba)进行了对比评估。结果表明,InsectMamba 在所有指标(准确度、精确度、召回率和 F1 分数)上都表现最佳。
尤其值得一提的是图 3 所示的特征整合方法对比实验。在这里,建议的 "选择性模块 "表现最佳,证明了自适应特征整合的重要性。
此外,图 4 还研究了选择性模块卷积核大小的影响:对于农场昆虫数据集,3x3 的结果最佳,而对于 IP102,1x1 的结果最佳。这表明,根据数据集的特点选择适当的核大小非常重要。
而消融实验的结果表明,Mix-SSM 模块中的 SSM、CNN、MSA 和 MLP 每个组件都做出了独特的贡献。这些结果表明,InsectMamba 可以为昆虫害虫分类的挑战提供最有效的解决方案。
结论
本研究提出了一个新模型–InsectMamba,以应对昆虫伤害分类的挑战;InsectMamba 是一个创新的架构,结合了多种视觉编码方法。
实验结果表明,InsectMamba 在五个具有挑战性的昆虫害虫分类数据集上表现出色,明显优于现有的强大模型。此外,通过消融实验,可以清楚地看到,所提出方法的每个要素都有其独特的贡献。分析详细考察了特征整合方法和卷积核大小优化等关键设计方面,结果证明了 InsectMamba 的高度通用性和实用性。
展望未来,重要的是通过在更大的数据集和真实世界环境中进行评估,进一步验证 InsectMamba 的实用性。此外,还将努力实现实际应用,例如研究在硬件限制条件下的高效实施方法。这项研究的成果将为昆虫控制自动化和实现智能农业做出重大贡献。
相关文章:
智慧农业——InsectMamba利用状态空间模型对害虫进行分类
介绍 论文地址:https://arxiv.org/abs/2404.03611 害虫分类是农业中的一个重要问题。准确识别有害害虫可减少对作物的损害,确保粮食安全和环境的可持续发展。然而,害虫及其自然环境的高度拟态性和物种多样性使得视觉特征的提取极具挑战性。…...
基于机器学习的癌症数据分析与预测系统实现,有三种算法,bootstrap前端+flask
研究背景 癌症作为全球范围内最主要的死亡原因之一,已成为当代医学研究和公共健康的重大挑战。据世界卫生组织(WHO)的统计,癌症每年导致全球数百万人的死亡。随着人口老龄化、环境污染和生活方式的改变,癌症的发病率逐…...
docker|Oracle数据库|docker快速部署Oracle11g和数据库的持久化(可用于生产环境)
一、 容器数据持久化的概念 docker做为容器化的领先技术,现在广泛应用于各个平台中,但不知道什么时候有一个说法是docker并不适用容器化数据库,说容器化的数据库性能不稳定,其实,这个说法主要是因为对docker的数据持…...
uni-app 聊天界面滚动到消息底部
目录 问题 组件 页面 使用的API 总结 问题 当你发一个消息,但是消息却需要你自己向下滑你才能看见,否则一直呗输入框挡住。 组件 scroll-view组件:一般使用scroll-view组件的都采取使用其scroll-into-view或者scroll-to属性。 scroll-…...
学习风格的类型
学习风格是指个体在学习过程中偏好的方式和方法。不同的学习风格反映了人们在接收、处理和记忆信息方面的不同偏好。了解自己的学习风格可以帮助提高学习效率和效果。以下是几种常见的学习风格类型: 1. 视觉型(Visual Learner) 特点&#x…...
GCP容器镜像仓库使用
GCP容器镜像仓库产品为:Artifact Registry。 1)用户账号认证 GCP需要前置在控制台登陆对应环境账号。然后执行以下命令操作: $ gcloud auth login 2)登陆镜像仓库 $ gcloud auth configure-docker us-west1-docker.pkg.dev …...
【C++ Primer Plus习题】16.10
大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: #include <iostream> #include <string> #include <…...
Django框架全面指南
Django是一个高级的Python Web框架,它鼓励快速开发和清晰、实用的设计。本指南将全面介绍Django的核心概念和使用方法。 1. Django简介 Django遵循"batteries included"哲学,提供了Web开发所需的几乎所有功能。它的主要特点包括: ORM(对象关系映射)URL路由模板…...
git 更新LingDongGui问题解决
今天重新更新灵动gui的代码,以便使用最新的arm-2d,本来以为是比较简单的一件事情(因为以前已经更新过一次),却搞了大半天,折腾不易啊,简单记录下来,有同样遇到问题的同学参考&#x…...
Thymeleaf模版引擎
Thymeleaf是面向Web和独立环境的现代服务器端Java模版引擎,能够处理HTML、XML、JavaScript、CSS甚至纯文本。Thymeleaf旨在提供一个优雅的、高度可维护的创建模版的方式。为了实现这一目标,Thymeleaf建立在自然模版的概念上,将其逻辑注入到模…...
jpa适配mysql切换达梦可能的坑
1、liquibase脚本 (1)达梦数据库不支持,修改字段varchar改成blob <changeSet author"ly" id"v3.0_4_202307111505_101"><renameColumn tableName"PC_SS_ZRQD" oldColumnName"BHNR" newCo…...
922. 按奇偶排序数组 II 双指针 力扣
922. 按奇偶排序数组 II 已解答 简单 相关标签 相关企业 给定一个非负整数数组 nums, nums 中一半整数是 奇数 ,一半整数是 偶数 。 对数组进行排序,以便当 nums[i] 为奇数时,i 也是 奇数 ;当 nums[i] 为偶数时…...
Vue接入高德地图并实现基本的路线规划功能
目录 一、申请密钥 二、安装依赖 三、代码实现 四、运行截图 五、官方文档 一、申请密钥 登录高德开放平台,点击我的应用,先添加新应用,然后再添加Key。 如图所示填写对应的信息,系统就会自动生成。 二、安装依赖 npm i am…...
linux网络编程4
24.9.20学习目录 一.UDP(续)1.广播广播流程 2.多播多播流程 一.UDP(续) 1.广播 由一台主机向该主机所在子网内的所有主机发送数据的方式; 广播只能用UDP或原始IP实现,不能使用TCP; 其作用是将…...
Spring模块详解Ⅳ(Spring ORM和Spring Transaction)
目录 Spring ORM(Object-Relational Mapping)作用核心组件使用步骤事务管理代码演示优点挑战总结 Spring Transaction(Spring事务管理)事务的基本概念Spring事务管理的类型声明式事务管理事务的传播行为(Propagation&a…...
深度图可视化显示(kitti)
文章目录 前言一、读取深度值与图像1、深度值读取2、图像读取 二、深度图可视化1、深度图可视化代码2、深度图可视化结果展示 三、深度图在图像上可视化1、可视化代码2、可视化坐标显示 四、完整代码 前言 kitti数据是一个通用数据,有关kitti的深度图像内容我已有博…...
【Kubernetes知识点】HPA如何控制不同的资源实现自动扩缩容?
【Kubernetes知识点】HPA如何控制不同的资源实现自动扩缩容? 目录 1 概念 1.1 什么是HPA1.2 Deployment 与 HPA 的关系 1.2.1 工作原理 1.3 StatefulSet 与 HPA 的关系 1.3.1 工作原理 2 实验案例:HPA 控制 StatefulSet 进行扩缩容 2.1 部署一个有状态…...
adb devices不显示连接设备怎么解决
adb devices不显示设备,首先用老办法检查。假如是显示adb这个命令不认识,那就是系统路径问题。假如能认识adb这个命令,那就检查一下手机有没有开usb调试。 但是我遇到了更奇怪的问题:我把网上的攻略都试了一遍,设备驱…...
经典sql题(一)求连续登录不少于三天用户
示例数据 假设我们的 test 表有以下数据: iddate12023-10-01 08:00:0012023-10-01 09:00:0012023-10-02 10:00:0012023-10-03 11:00:0022023-10-01 10:00:0022023-10-02 12:00:0022023-10-03 14:00:0022023-10-04 15:00:0032023-10-01 16:00:00 第一步࿱…...
2024java面试-软实力篇
为什么说简历很重要? 一份好的简历可以在整个申请面试以及面试过程中起到非常好的作用。 在不夸大自己能力的情 况 下,写出一份好的简历也是一项很棒的能力。为什么说简历很重要呢? 、 先从面试来说 假如你是网申,你的简历必然…...
SILERGY矽力杰 SY81103ABT NA DC-DC电源芯片
特性 内部MOSFET低导通电阻:顶部80m2,底部40mO 宽输入电压范围:4.5V~18V 最高输出电流3A 1.5%0.6V参考电压 精确的EN阈值 SY81103和SY81103C采用脉冲频率调制(PFM)模式运行 SY81103E和SY81103B的强制连续导通模式(FCCM)操作 内部软启动限制浪涌电流 支持预偏置输出的…...
网易云音乐美化插件全攻略:从核心价值到深度定制的个性化指南
网易云音乐美化插件全攻略:从核心价值到深度定制的个性化指南 【免费下载链接】refined-now-playing-netease 🎵 网易云音乐沉浸式播放界面、歌词动画 - BetterNCM 插件 项目地址: https://gitcode.com/gh_mirrors/re/refined-now-playing-netease …...
Figo人机交互中“疯态”边界的引导与驯化————“可控赛博疯态”动态机制与实现路径研究
人机交互中“疯态”边界的引导与驯化 ——“可控赛博疯态”动态机制与实现路径研究 作者:Figo Cheung & Figo AI team 摘要:随着生成式人工智能技术的迭代升级,人机交互中涌现出一种突破常规逻辑、具有高度创造性与情感张力的“赛…...
别再自己写提示词了!用DeepSeek-V2规划,让墨刀AI生成你的APP原型图(附完整prompt模板)
用DeepSeek-V2重构提示词策略:打造高精度AI原型设计工作流 当墨刀AI生成的页面总与预期相差甚远时,问题往往不在工具本身,而在于我们传递需求的方式。传统"一句话需求"的粗放指令模式,就像让一位建筑师仅凭"想要栋…...
ANIMATEDIFF PRO电商创新:WebAR商品试穿系统
ANIMATEDIFF PRO电商创新:WebAR商品试穿系统 最近跟几个做电商的朋友聊天,他们都在抱怨同一个问题:商品退货率太高了。尤其是服装鞋帽这类需要试穿的商品,用户光看图片和模特展示,根本拿不准自己穿上到底合不合适、好…...
OpenClaw版本升级:Qwen3-4B模型与新框架特性的兼容性
OpenClaw版本升级:Qwen3-4B模型与新框架特性的兼容性 1. 为什么需要关注版本升级 上周五晚上11点,我的OpenClaw突然弹出一条警告:"当前版本(v0.8.3)将在48小时后停止维护"。这个深夜警报让我意识到,是时候处理这个技术…...
Qwen3-VL-2B-Instruct保姆级教程:视觉对话机器人部署
Qwen3-VL-2B-Instruct保姆级教程:视觉对话机器人部署 1. 环境准备与快速部署 想要体验AI视觉对话的神奇能力吗?Qwen3-VL-2B-Instruct让你不用昂贵的显卡也能拥有一个能"看懂"图片的智能助手。这个教程将手把手带你完成整个部署过程ÿ…...
PDF-Extract-Kit-1.0效果展示:高精度表格识别与公式还原真实案例集
PDF-Extract-Kit-1.0效果展示:高精度表格识别与公式还原真实案例集 想象一下,你手头有一份满是复杂表格和数学公式的PDF学术论文,或者一份财务报告。你需要把里面的数据提取出来,做成Excel表格进行分析,或者把那些复杂…...
AI 时代做自媒体,他从方法论上就赢了绝大部分人
AI 时代做自媒体,他从方法论上就赢了绝大部分人 昨天刷到卡兹克的一篇文章,他分享了自己做内容三年总结的 10 条方法论。 看完之后我的感受是:这哥们从方法论上就赢了。 简单介绍一下卡兹克。他的公众号「数字生命卡兹克」是 AIGC 领域的头部 IP,新榜 AI 行业公众号排名…...
Net/Net Core微信公众号上传图片永久图片素材和内容中图片素材不能用MultipartFormDataContent的坑
测试了N次,不能用net自带的 MultipartFormDataContent,否则微信公众号会一直报错41005错误,具体原因不详,只能拼装head字符串实现,下面是封装好的上传永久素材和临时图片素材的方法,下面为测试好的代码&…...
