YoloV8改进策略:BackBone改进|PKINet
摘要
PKINet是面向遥感旋转框的主干,网络包含了CAA、PKI等模块,给我们改进卷积结构的模型带来了很多启发。本文,使用PKINet替代YoloV8的主干网络,实现涨点。PKINet是我在作者的模型基础上,重新修改了底层的模块,方便大家轻松移植到YoloV8上。
论文:《Poly Kernel Inception Network在遥感检测中的应用》
https://export.arxiv.org/pdf/2403.06258
遥感图像(RSI)中的目标检测经常面临一些日益严重的挑战,包括目标尺度的巨大变化和多样的上下文环境。先前的方法试图通过扩大骨干网络的空间感受野来解决这些挑战,要么通过大核卷积,要么通过空洞卷积。然而,前者通常会引入大量的背景噪声,而后者则可能生成过于稀疏的特征表示。在本文中,我们引入了Poly Kernel Inception Network(PKINet)来处理上述挑战。PKINet采用无空洞的多尺度卷积核来提取不同尺度的目标特征并捕获局部上下文。此外,我们还并行引入了一个Context Anchor Attention(CAA)模块来捕获长距离上下文信息。这两个组件共同作用,提高了PKINet在四个具有挑战性的遥感检测基准上的性能,即DOTA-v1.0、DOTA-v1.5、HRSC2016和DIOR-R。

1、简介
遥感图像(RSI)中的
相关文章:
YoloV8改进策略:BackBone改进|PKINet
摘要 PKINet是面向遥感旋转框的主干,网络包含了CAA、PKI等模块,给我们改进卷积结构的模型带来了很多启发。本文,使用PKINet替代YoloV8的主干网络,实现涨点。PKINet是我在作者的模型基础上,重新修改了底层的模块,方便大家轻松移植到YoloV8上。 论文:《Poly Kernel Ince…...
如何在Linux系统部署Dupal CMS结合内网穿透实现无公网IP访问web界面
文章目录 前言1. Docker安装Drupal2. 本地局域网访问3 . Linux 安装cpolar4. 配置Drupal公网访问地址5. 公网远程访问Drupal6. 固定Drupal 公网地址 正文开始前给大家推荐个网站,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默&a…...
小巧玲珑的SQLite
SQLite是桌面端和移动端的不错选择 前言 SQLite身影无处不在。 SQLite,是一款轻型的数据库,是遵守ACID的关系型数据库管理系统,它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它,它占用资源非常的低&a…...
【Android 内存优化】 native内存泄漏监控方案源码分析
文章目录 前言使用效果使用apiJNI的动态注册native方法动态注册 hook的实现android_dlopen_ext和dl_iterate_phdr naive监控的实现nativeGetLeakAllocs 总结 前言 Android的native泄漏怎么检测?下面通过研究开源项目KOOM来一探究竟。 使用效果 未触发泄漏前的日志…...
数据结构 二叉树 力扣例题AC——代码以及思路记录
LCR 175. 计算二叉树的深 某公司架构以二叉树形式记录,请返回该公司的层级数。 AC int calculateDepth(struct TreeNode* root) {if (root NULL){return 0;}else{return 1 fmax(calculateDepth(root->left), calculateDepth(root->right));} } 代码思路 …...
Android 11系统启动流程
在Android 11系统启动流程中,系统启动主要经历了以下几个阶段: 引导加载程序(Bootloader)启动: 当设备加电后,首先运行的是ROM Bootloader,它负责验证操作系统映像的完整性、初始化基本硬件并加…...
python 爬取杭州小区挂牌均价
下载chrome驱动 通过chrome浏览器的 设置-帮助-关于Google Chrome 查看你所使用的Chrome版本 驱动可以从这两个地方找: 【推荐】https://storage.googleapis.com/chrome-for-testing-publichttp://npm.taobao.org/mirrors/chromedriver import zipfile import os import r…...
数据可视化-ECharts Html项目实战(3)
在之前的文章中,我们学习了如何创建堆积折线图,饼图以及较难的瀑布图并更改图标标题。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错,请留下你宝贵的点赞,谢谢。 …...
【理解机器学习算法】之Clustering算法(K-Means)
实现 K-means 聚类从零开始涉及几个关键步骤:初始化质心、将点分配给最近的质心、根据分配更新质心,以及重复这个过程直到收敛。这里是一个基本的 Python 实现: K-means 算法步骤: 初始化质心:从数据点中随机选择 k …...
Transformer的前世今生 day02(神经网络语言模型、词向量)
神经网络语言模型 使用神经网络的方法,去完成语言模型的两个问题,下图为两层感知机的神经网络语言模型: 假设词典V内有五个词:“判断”、“这个”、“词”、“的”、“词性”,且要输出P(w_next | “判断”、“这个”、…...
【Linux】多线程编程基础
💻文章目录 📄前言🌺linux线程基础线程的概念线程的优缺点线程与进程的区别 线程的创建 🌻linux线程冲突概念互斥锁函数介绍加锁的缺点 📓总结 📄前言 无论你是否为程序员,相信多线程这个词汇应…...
【地图】腾讯地图 - InfoWindow 自定义信息窗口内容时,内容 html 嵌套混乱问题
目录 需求描述问题问题代码页面展示 解决原因解决办法解决代码页面展示 代码汇总注 需求描述 腾讯地图上画点位,点击点位展示弹框信息 问题 问题代码 // 打开弹框 openInfoWindow(position, content) {this.infoWindow new TMap.InfoWindow({map: this.map,posit…...
Vue3、element-plus和Vue2、elementUI的一些转换
插槽 Vue3<template #default"scope"></template> <template #footer></template>Vue2<template slot-scope"scope"></template> <template slot"footer"></template>JS定义 Vue3 <script…...
Go语言gin框架中加载html/css/js等静态资源
Gin框架没有内置静态文件服务,但可以使用gin.Static或gin.StaticFS中间件来提供静态文件服务。 效果图如下: 一、gin 框架加载 Html 模板文件的方法 方式1:加载单个或多个html文件,需要指明具体文件名 r.LoadHTMLFiles("vie…...
#鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
3 月 19 日,#鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行。 现场,深圳市南山区人民政府副区长李志娜发布《2024 年南山区支持鸿蒙原生应用发展首批政策措施清单》,从加强鸿蒙原生应用供给能力、推动鸿蒙原生应用产业集聚、完善鸿蒙原生…...
flask 继续学习
group_by group_by是一种在数据库查询或数据处理中常用的操作,它用于将数据按照指定的列进行分组。通过group_by操作,可以将数据集按照某个列的值进行分类,然后对每个分类进行聚合计算或其他操作。 在SQL语言中,group_by通常与聚…...
DockerFile遇到的坑
CMD 命令的坑 dockerfile 中的 CMD 命令在docker run -it 不会执行 CMD 命令。 FROM golang WORKDIR / COPY . ./All-in-one CMD ["/bin/sh","-c","touch /kkk.txt && ls -la"] RUN echo alias ll"ls -la" > ~/.bashrc(不…...
并网型风光储微电网日前优化调度(MATLAB实现)
考虑了光伏发电、风力发电、电池储能和负荷需求等因素,与主网相连不考虑向主网售电情况。 % 微电网日前优化调度示例代码% 定义时间步长(例如,每小时) time_steps 24;% 生成模拟数据:光伏发电量,风力发电…...
MATLAB环境下基于振动信号的轴承状态监测和故障诊断
故障预测与健康管理PHM分为故障预测和健康管理与维修两部分,PHM首先借助传感器采集关键零部件的运行状态数据,如振动信号、温度图像、电流电压信号、声音信号及油液分析等,提取设备的运行监测指标,进而实现对设备关键零部件运行状…...
流畅的 Python 第二版(GPT 重译)(十二)
第五部分:元编程 第二十二章:动态属性和属性 属性的关键重要性在于,它们的存在使得将公共数据属性作为类的公共接口的一部分完全安全且确实可取。 Martelli、Ravenscroft 和 Holden,“为什么属性很重要” 在 Python 中࿰…...
Qwen3.5-4B-Claude-Opus效果集:编译器后端寄存器分配策略生成
Qwen3.5-4B-Claude-Opus效果集:编译器后端寄存器分配策略生成 1. 模型概述 Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF是一个专注于结构化分析和逻辑推理的轻量级AI模型。这个基于Qwen3.5-4B的推理蒸馏版本特别强化了处理代码生成、算法解释和编译器相…...
Phi-4-mini-reasoning效果实测:20道经典逻辑题准确率92%以上案例集
Phi-4-mini-reasoning效果实测:20道经典逻辑题准确率92%以上案例集 1. 模型能力概述 Phi-4-mini-reasoning是一款专注于推理任务的文本生成模型,在数学题解答、逻辑推理、多步分析和结论提炼等场景表现突出。与通用聊天模型不同,它专为&quo…...
YOLOv13镜像实战效果:复杂场景下目标识别依然精准
YOLOv13镜像实战效果:复杂场景下目标识别依然精准 1. 引言:当目标检测遇上复杂场景 想象一下这样的场景:一个繁忙的十字路口,行人穿梭、车辆交错、自行车穿行,还有各种交通标志和广告牌。在这样的复杂环境中…...
FastAPI异步优化实战:解决内存泄漏与虚拟内存激增问题
1. 为什么你的FastAPI服务内存越跑越高? 最近在技术社区看到不少开发者反馈,用FastAPI搭建的HTTP接口服务运行一段时间后,内存占用像坐火箭一样往上窜。我自己在去年做电商促销系统时也踩过这个坑——凌晨3点被报警短信吵醒,发现8…...
同事.Skill出圈,打工的尽头是被AI蒸馏吗?
当你的技能被封装成一行行代码,你与AI同事之间,是竞争还是共生?最近职场圈最火的词:同事.Skill。简单说,就是把某个同事的核心工作能力——写周报、做PPT、处理数据、安排会议——变成一个可复用的AI技能包。其他同事安…...
Gemini 3 Pro的国内体验路径:从AI Studio到聚合平台的日常使用观察
Google DeepMind在Gemini 3 Pro上投入的技术资源,从那份长达数十页的技术报告中可见一斑。原生多模态架构意味着图像、音频、视频不再需要额外的预处理步骤,模型能在同一个推理过程中直接理解不同模态的信息。我在AI Studio里试过上传一段技术会议的录像…...
洛克王国世界T0精灵合集!配无线副屏看攻略丝滑开荒!
《洛克王国:世界》自3月26日公测以来,首日新进用户就超过1500万,无数小洛克一头扎进这片超大地图开始冒险。但面对首发实装的超400只精灵,很多萌新最大的困惑就是——我到底该养谁?开荒选谁最稳?别慌。开局…...
Realistic Vision V5.1商业级作品:智能车概念设计渲染图集
Realistic Vision V5.1商业级作品:智能车概念设计渲染图集 最近在尝试用AI做设计的朋友,可能都听说过Realistic Vision这个系列。它一直以生成高度写实、细节丰富的人像而闻名。但当我拿到V5.1版本,并试着把它用在工业设计领域,特…...
Typora Markdown写作伴侣:集成Phi-4-mini-reasoning实现智能校对与内容拓展
Typora Markdown写作伴侣:集成Phi-4-mini-reasoning实现智能校对与内容拓展 1. 智能写作新体验 想象一下这样的场景:你在Typora中奋笔疾书,突然对某个专业术语的解释拿捏不准;或者写了一大段文字,却不确定语气是否得…...
LVGUI图片资源管理新思路:用NXP GUI Guider一键生成合并bin文件,告别手动算地址
LVGUI图片资源管理新思路:用NXP GUI Guider一键生成&合并bin文件,告别手动算地址 在嵌入式GUI开发中,图片资源管理一直是个让人头疼的问题。特别是当项目需要大量高分辨率图片时,如何高效地将这些资源存储到外部Nor Flash并正…...
