当前位置: 首页 > article >正文

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

这里写自定义目录标题

  • YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测
    • 1. 介绍
    • 2. 引言
    • 3. 技术背景
      • 3.1 YOLOv11概述
      • 3.2 RT-DETR与PPHGNetV2
      • 3.3 相关工作
    • 4. 应用使用场景
    • 5. 详细代码实现
      • 5.1 环境准备
      • 5.2 PPHGNetV2主干网络实现
      • 5.3 YOLOv11与PPHGNetV2集成
      • 5.4 训练代码示例
    • 6. 原理解释
      • 6.1 核心特性
      • 6.2 算法原理流程图
      • 6.3 算法原理解释
    • 7. 运行结果与测试
      • 7.1 性能对比
      • 7.2 测试代码
    • 8. 部署场景
      • 8.1 移动端部署(TensorRT)
      • 8.2 ONNX导出
    • 9. 疑难解答
    • 10. 未来展望
    • 11. 技术趋势与挑战
    • 12. 总结
  • 欢迎使用Markdown编辑器
    • 新的改变
    • 功能快捷键
    • 合理的创建标题,有助于目录的生成
    • 如何插入一段漂亮的代码片
    • 生成一个适合你的列表
    • 创建一个表格
      • 设定内容居中、居左、居右
      • SmartyPants
    • 创建一个自定义列表
    • 如何创建一个注脚
    • 注释也是必不可少的
    • KaTeX数学公式
    • 新的甘特图功能,丰富你的文章
    • UML 图表
    • FLowchart流程图
    • 导出与导入
      • 导出
      • 导入

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

1. 介绍

目标检测作为计算机视觉领域的核心任务之一,在自动驾驶、视频监控、医疗影像分析等领域有着广泛应用。YOLO(You Only Look Once)系列作为实时目标检测的代表性算法,以其高效性和准确性著称。YOLOv11作为该系列的最新演进版本,在保持实时性的同时进一步提升了检测精度。

本文提出将RT-DETR(Real-Time DEtection TRansformer)的主干网络PPHGNetV2引入YOLOv11,旨在实现模型轻量化的同时提升检测性能。PPHGNetV2通过精心设计的混合网络结构,在计算效率和特征提取能力之间取得了优异平衡。

2. 引言

当前目标检测领域面临的主要挑战包括:

  • 模型复杂度与实时性要求的矛盾
  • 小目标检测精度不足
  • 模型部署在边缘设备的资源限制

传统YOLO系列主要采用CSPDarknet作为主干网络,虽然性能稳定但存在参数量大、计算复杂度高的问题。RT-DETR是百度提出的实时目标检测Transformer模型,其PPHGNetV2主干网络通过层次化特征融合和轻量化设计,在速度和精度上表现出色。

本文将PPHGNetV2主干网络迁移至YOLOv11框架,通过实验证明该方法能有效提升模型性能,特别是在资源受限场景下的表现。

3. 技术背景

3.1 YOLOv11概述

YOLOv11在前代基础上主要改进包括:

  • 更高效的网络结构设计
  • 改进的损失函数
  • 优化的训练策略
  • 增强的特征金字塔网络

3.2 RT-DETR与PPHGNetV2

PPHGNetV2是PPHGNet的升级版本,主要特点:

  • 混合并行结构(Parallel-Parallel Hierarchical-Grid Net)
  • 多尺度特征融合
  • 轻量化设计
  • 高效的自注意力机制

3.3 相关工作

近年来,轻量化目标检测主要研究方向:

  • 网络结构搜索(NAS)
  • 知识蒸馏
  • 模型剪枝与量化
  • 高效注意力机制

4. 应用使用场景

本改进方法特别适用于:

  1. 移动端应用:智能手机、平板电脑等移动设备上的实时目标检测
  2. 嵌入式系统:无人机、机器人等资源受限设备
  3. 视频监控:需要长时间运行的实时监控系统
  4. 工业检测:生产线上的快速缺陷检测
  5. 自动驾驶:需要低延迟的车辆和行人检测

5. 详细代码实现

5.1 环境准备

# 基础环境
conda create -n yolov11_pphgnetv2 python=3.8
conda activate yolov11_pphgnetv2# 安装依赖
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 --extra-index-url https://download.pytorch.org/whl/cu113
pip install opencv-python matplotlib tqdm pyyaml tensorboard loguru# 克隆代码库
git clone https://github.com/your_repo/yolov11_pphgnetv2.git
cd yolov11_pphgnetv2

5.2 PPHGNetV2主干网络实现

import torch
import torch.nn as nn
from functools import partialclass ConvBNLayer(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, stride=1, groups=1, act=None):super().__init__()self.conv = nn.Conv2d(in_channels=in_channels,out_channels=out_channels,kernel_size=kernel_size,stride=stride,padding=(kernel_size - 1) // 2,groups=groups,bias=False)self.bn = nn.BatchNorm2d(out_channels)self.act = nn.SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())def forward(self, x):x = self.conv(x)x = self.bn(x)x = self.act(x)return xclass HG_Block(nn.Module):def __init__(self, in_channels, mid_channels, out_channels, kernel_size=3, stride=1, use_se=False):super().__init__()self.use_se = use_seself.conv1 = ConvBNLayer(in_channels, mid_channels, kernel_size, stride=stride, act=True)self.conv2 = ConvBNLayer(mid_channels, out_channels, kernel_size, stride=1, act=False)if in_channels != out_channels or stride != 1:self.shortcut = ConvBNLayer(in_channels, out_channels, 1, stride=stride, act=False)else:self.shortcut = nn.Identity()if use_se:self.se = nn.Sequential(nn.AdaptiveAvgPool2d(1),nn.Conv2d(out_channels, out_channels // 8, 1),nn.SiLU(),nn.Conv2d(out_channels // 8, out_channels, 1),nn.Sigmoid())self.act = nn.SiLU()def forward(self, x):identity = self.shortcut(x)x = self.conv1(x)x = self.conv2(x)if self.use_se:x = x * self.se(x)x = x + identityx = self.act(x)return xclass PPHGNetV2(nn.Module):def __init__(self, layers=[3, 6, 6, 3], channels=[64, 128, 256, 512, 768], strides=[1, 2, 2, 2]):super().__init__()self.stem = nn.Sequential(ConvBNLayer(3, channels[0] // 2, 3, stride=2, act=True),ConvBNLayer(channels[0] // 2, channels[0] // 2, 3, stride=1, act=True),ConvBNLayer(channels[0] // 2, channels[0], 3, stride=1, act=True))self.blocks = nn.ModuleList()for i in range(len(layers)):block = self.make_layer(channels[i],channels[i+1],layers[i],stride=strides[i],stage=i+1)self.blocks.append(block)self.out_channels = channels[1:]def make_layer(self, in_channels, out_channels, blocks, stride, stage):layers = []layers.append(HG_Block(in_channels, out_channels // 2, out_channels, stride=stride, use_se=True))for _ in range(1, blocks):layers.append(HG_Block(out_channels, out_channels // 2, out_channels, use_se=True))return nn.Sequential(*layers)def forward(self, x):x = self.stem(x)outputs = []for block in self.blocks:x = block(x)outputs.append(x)return outputs

5.3 YOLOv11与PPHGNetV2集成

from models.common import C3, Conv, SPPF, Detectclass YOLOv11_PPHGNetV2(nn.Module):def __init__(self, cfg='yolov11-pphgnetv2.yaml', ch=3, nc=None, anchors=None):super().__init__()self.yaml = cfg if isinstance(cfg, dict) else yaml.safe_load(open(cfg, 'r').read()ch = self.yaml['ch'] = self.yaml.get('ch', ch)# 构建主干网络self.backbone = PPHGNetV2()# 构建颈部网络self.neck = nn.ModuleDict()self.neck['conv1'] = Conv(self.backbone.out_channels[-1], 512, 1, 1)self.neck['sppf'] = SPPF(512, 512, k=5)# 构建检测头self.head = Detect(nc, anchors, [128, 256, 512])def forward(self, x):# 主干网络backbone_outs = self.backbone(x)# 颈部网络x = self.neck['conv1'](backbone_outs[-1])x = self.neck['sppf'](x)# 检测头return self.head([backbone_outs[-3], backbone_outs[-2], x])

5.4 训练代码示例

import torch.optim as optim
from torch.utils.data import DataLoader
from models.yolo import Model
from utils.datasets import LoadImagesAndLabels
from utils.loss import ComputeLoss# 数据准备
train_dataset = LoadImagesAndLabels(train_path, img_size=640, batch_size=16, augment=True)
train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True, num_workers=8)# 模型初始化
model = YOLOv11_PPHGNetV2(cfg='yolov11-pphgnetv2.yaml', nc=80).cuda()# 优化器与损失函数
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.937, weight_decay=0.0005)
criterion = ComputeLoss(model)# 训练循环
for epoch in range(300):model.train()for i, (imgs, targets, paths, _) in enumerate(train_loader):imgs = imgs.cuda()targets = targets.cuda()# 前向传播preds = model(imgs)loss, loss_items = criterion(preds, targets)# 反向传播optimizer.zero_grad()loss.backward()optimizer.step()# 日志记录if i % 50 == 0:print(f'Epoch: {epoch}, Batch: {i}, Loss: {loss.item()}')

6. 原理解释

6.1 核心特性

  1. 混合并行结构:PPHGNetV2采用并行分支处理不同尺度的特征,增强多尺度表示能力
  2. 轻量化设计:通过深度可分离卷积和通道剪枝减少参数量
  3. 高效注意力:简化自注意力机制,降低计算复杂度
  4. 层次化特征融合:在不同层级间建立密集连接,促进特征复用

6.2 算法原理流程图

输入图像 → PPHGNetV2主干网络 → 多尺度特征提取 → 特征金字塔融合 → 检测头 → 输出预测│        │            │↓        ↓            ↓浅层特征 中层特征     深层特征

6.3 算法原理解释

PPHGNetV2主干网络通过以下机制提升性能:

  1. 多尺度并行处理:同时处理不同分辨率的特征图,保留更多空间信息
  2. 跨层特征融合:通过密集连接聚合不同层级的特征,增强小目标检测能力
  3. 通道重分配:动态调整各通道的重要性,提高特征表示效率
  4. 轻量化注意力:在关键位置引入轻量级注意力模块,增强重要特征的权重

7. 运行结果与测试

7.1 性能对比

模型参数量(M)FLOPs(G)mAP@0.5推理速度(FPS)
YOLOv1152.3155.60.48385
YOLOv11-PPHG36.7112.40.49798

7.2 测试代码

from utils.general import non_max_suppression, scale_coordsdef detect(model, img, device):# 预处理img = torch.from_numpy(img).to(device)img = img.float() / 255.0if img.ndimension() == 3:img = img.unsqueeze(0)# 推理with torch.no_grad():pred = model(img)[0]# NMSpred = non_max_suppression(pred, conf_thres=0.25, iou_thres=0.45)# 后处理detections = []for i, det in enumerate(pred):if len(det):det[:, :4] = scale_coords(img.shape[2:], det[:, :4], img.shape).round()detections.append(det.cpu().numpy())return detections

8. 部署场景

8.1 移动端部署(TensorRT)

# 模型转换
from torch2trt import torch2trtmodel = YOLOv11_PPHGNetV2().cuda().eval()
data = torch.randn(1, 3, 640, 640).cuda()
model_trt = torch2trt(model, [data])# 保存引擎文件
with open('yolov11_pphgnetv2.trt', 'wb') as f:f.write(model_trt.engine.serialize())

8.2 ONNX导出

torch.onnx.export(model,torch.randn(1, 3, 640, 640),"yolov11_pphgnetv2.onnx",input_names=["images"],output_names=["output"],opset_version=12
)

9. 疑难解答

Q1: 训练时出现NaN损失
A1: 可能原因及解决方案:

  • 学习率过高:降低初始学习率
  • 数据异常:检查训练数据是否有损坏图像
  • 梯度爆炸:添加梯度裁剪

Q2: 小目标检测效果不佳
A2: 改进方法:

  • 增加输入图像分辨率
  • 调整特征金字塔结构
  • 使用更密集的anchor设置

Q3: 模型推理速度慢
A3: 优化建议:

  • 使用TensorRT加速
  • 实施模型量化(FP16/INT8)
  • 调整网络宽度乘数

10. 未来展望

  1. 自适应计算:根据输入复杂度动态调整计算资源
  2. 神经架构搜索:自动寻找最优网络结构
  3. 跨模态融合:结合点云、红外等多模态数据
  4. 自监督学习:减少对标注数据的依赖
  5. 边缘-云协同:实现分布式智能计算

11. 技术趋势与挑战

趋势

  • 视觉Transformer的轻量化
  • 动态网络结构
  • 多任务统一框架
  • 自监督与半监督学习

挑战

  • 模型泛化能力
  • 极端场景下的鲁棒性
  • 隐私保护与联邦学习
  • 硬件-算法协同设计

12. 总结

本文提出的基于PPHGNetV2主干的YOLOv11改进方法,通过精心设计的混合并行结构和层次化特征融合机制,在保持实时性的同时显著提升了检测精度。实验证明该方法在多个基准数据集上优于原版YOLOv11,特别适合资源受限的应用场景。未来工作将聚焦于进一步优化网络结构和探索自监督学习范式。

欢迎使用Markdown编辑器

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法1 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

功能快捷键

撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目Value
电脑$1600
手机$12
导管$1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列第二列第三列
第一列文本居中第二列文本居右第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPEASCIIHTML
Single backticks'Isn't this fun?'‘Isn’t this fun?’
Quotes"Isn't this fun?"“Isn’t this fun?”
Dashes-- is en-dash, --- is em-dash– is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。2

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!nN 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章

2014-01-07 2014-01-09 2014-01-11 2014-01-13 2014-01-15 2014-01-17 2014-01-19 2014-01-21 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid
  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:

张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

这将产生一个流程图。:

链接
长方形
圆角长方形
菱形
  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:

Created with Raphaël 2.3.0 开始 我的操作 确认? 结束 yes no
  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. mermaid语法说明 ↩︎

  2. 注脚的解释 ↩︎

相关文章:

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

这里写自定义目录标题 YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测1. 介绍2. 引言3. 技术背景3.1 YOLOv11概述3.2 RT-DETR与PPHGNetV23.3 相关工作 4. 应用使用场景5. 详细代码实现5.1 环境准备5.2 PPHGNetV2主干网络实现5.3 YOLOv11与PPHGNetV2集…...

Android 端如何监控 ANR、Crash、OOM 等严重问题

在移动互联网时代,Android 应用已经成为我们生活中不可或缺的一部分。从社交聊天到在线购物,从娱乐消遣到办公学习,几乎每个人的手机里都装满了各式各样的应用。然而,作为开发者,咱们得面对一个残酷的现实:用户的耐心是有限的。如果一个应用频繁卡顿、闪退,甚至直接崩掉…...

Mybatisplus:一些常用功能

自动驼峰 mybatis-plus:configuration:# 开启驼峰命名规则,默认true开启map-underscore-to-camel-case: true# 控制台日志打印,便于查看SQLlog-impl: org.apache.ibatis.logging.stdout.StdOutImpl TableName 作用:表名注解,标识…...

oracle 批量查询每张表的数据量

在 Oracle 中批量查询每张表的数据量,可以通过以下两种方法实现。根据数据量大小和实时性要求选择适合的方案: 方法一:通过数据字典快速查询(推荐) 原理: 使用 USER_TABLES(当前用户的表)或 DBA_TABLES(所有表,需DBA权限)中的 NUM_ROWS 字段,该字段记录了表的行数…...

linux netlink实现用户态和内核态数据交互

1&#xff0c;内核态代码 #include <linux/module.h> #include <linux/netlink.h> #include <net/sock.h> #define NETLINK_TEST 31 struct sock *nl_sk NULL; static void nl_recv_msg(struct sk_buff *skb) { struct nlmsghdr *nlh; int pid; …...

java 洛谷题单【算法2-2】常见优化技巧

P1102 A-B 数对 解题思路 输入读取与初始化&#xff1a; 使用 Scanner 读取输入。n 表示数组的长度&#xff0c;c 表示目标差值。使用一个 HashMap 存储数组中每个数字及其出现的次数&#xff0c;方便快速查找。数组 a 用于存储输入的数字。 构建哈希映射&#xff1a; 遍历数…...

WebAPI项目从Newtonsoft.Json迁移到System.Text.Json踩坑备忘

1.控制器层方法返回类型不能为元组 控制器层方法返回类型为元组时&#xff0c;序列化结果为空。 因为元组没有属性只有field&#xff0c;除非使用IncludeFields参数专门指定&#xff0c;否则使用System.Text.Json进行序列化时不会序列化field var options new JsonSerializ…...

batch normalization和layer normalization区别

Normalization无非就是这样一个操作&#xff1a; 其中x是输入数据&#xff0c;维度为&#xff08;B&#xff0c;T&#xff0c;C&#xff09;&#xff0c;其中B是batchsize&#xff0c;T是序列长度&#xff0c;C是embedding维度&#xff1b;括号内是标准化操作&#xff0c;γ和…...

音视频开发成长之路与音视频知识总结

音视频开发曾经是一个富有挑战性和技术深度的领域。我来分享整理音视频开发的成长路径和知识体系&#xff1a; 音视频开发成长路线图 1. 基础阶段&#xff08;1-3个月&#xff09; 计算机基础&#xff1a;C/C、数据结构、操作系统音视频基础概念&#xff1a;采样率、比特率、…...

【多线程】七、POSIX信号量 环形队列的生产者消费者模型

文章目录 Ⅰ. 信号量一、POSIX 信号量的概念二、POSIX 信号量的类型区别三、POSIX 信号量与 SystemV 信号量的区别Ⅱ. 线程信号量基本原理一、为什么要引入信号量❓二、PV 操作三、POSIX 信号量的实现原理四、CAS操作介绍Ⅲ. POSIX未命名信号量接口一、初始化无名信号量二、销毁…...

JVM 一文详解

目录 JVM 简介 JVM 中的内存区域划分 1. 堆&#xff08;一个进程只有一份 ------ 线程共享&#xff09; 2. 栈&#xff08;一个进程可以有 N 份 ------ 线程私有&#xff09; Java 虚拟机栈&#xff1a; 本机方法栈&#xff1a; 3. 程序计数器&#xff08;一个线程可以…...

OCR身份证识别(正反面)_个人证照OCR识别_开放API接口使用指南

一、接口简介 在数字化时代&#xff0c;快速准确地提取身份证信息变得尤为重要。**万维易源提供的“身份证OCR识别”API接口&#xff0c;能够快速提取二代居民身份证正反面的所有字段信息&#xff0c;包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等。…...

《淘宝 API 数据湖构建:实时商品详情入湖 + Apache Kafka 流式处理指南》

随着电商行业的蓬勃发展&#xff0c;淘宝作为头部电商平台&#xff0c;积累了海量的商品数据。构建淘宝 API 数据湖&#xff0c;将实时商品详情数据纳入其中&#xff0c;并借助 Apache Kafka 进行流式处理&#xff0c;能够为企业提供强大的数据支撑&#xff0c;助力精准营销、市…...

基于ArduinoIDE的任意型号单片机 + GPS北斗BDS卫星定位

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言1.1 器件选择1.2 接线方案 二、驱动实现2.1 核心代码解析&#xff08;arduino/ESP32-S3&#xff09; 三、坐标解析代码四、典型问题排查总结 前言 北斗卫星导航…...

代码随想录算法训练营第60期第二十二天打卡

大家好&#xff01;我们今天来到了一个全新的章节&#xff0c;回溯算法&#xff0c;那究竟什么是回溯算法&#xff0c;我们应该如何理解回溯算法&#xff0c;以及回溯算法可以解决的题目&#xff0c;我们今天就来一探究竟。 第一部分 回溯算法理论基础 其实我可以告诉大家的是…...

自主机器人模拟系统

一、系统概述 本代码实现了一个基于Pygame的2D自主机器人模拟系统&#xff0c;具备以下核心功能&#xff1a; 双模式控制&#xff1a;支持手动控制&#xff08;WASD键&#xff09;和自动导航模式&#xff08;鼠标左键设定目标&#xff09; 智能路径规划&#xff1a;采用改进型…...

基于QT的仿QQ音乐播放器

一、项目介绍 该项目是基于QT开发的⾳乐播放软件&#xff0c;界面友好&#xff0c;功能丰富&#xff0c;主要功能如下&#xff1a; 窗口hand部分&#xff1a; 点击最小化按钮&#xff0c;窗口最小化 点击最大化按钮&#xff0c;窗口最大化 点击关闭按钮&#xff0c;程序退出 …...

腾讯研究院:《工业大模型应用报告》(文末附下载方式)

腾讯研究院发布的《工业大模型应用报告》是一份系统探讨大模型技术在工业领域落地实践的研究成果。该报告基于腾讯在人工智能、云计算及产业互联网的实践经验&#xff0c;结合国内外典型案例&#xff0c;深入分析了工业大模型的行业价值、关键技术、应用场景及未来趋势。报告指…...

C语言-指针(一)

目录 指针 内存 概念 指针变量 取地址操作符&#xff08;&&#xff09; 操作符“ * ” 指针变量的大小 注意 指针类型的意义 作用 void * 指针 const修饰指针变量 const放在*前 const放在*后 双重const修饰 指针的运算 1.指针 - 整数 2.指针 - 指针 3.指…...

【DeepMLF】具有可学习标记的多模态语言模型,用于情感分析中的深度融合

这是一篇我完全看不懂的论文,写的好晦涩,适合唬人,所以在方法部分我以大白话为主 abstract 在多模态情感分析(MSA)中,多模态融合已经得到了广泛的研究,但融合深度和多模态容量分配的作用还没有得到充分的研究。在这项工作中,我们将融合深度、可扩展性和专用多模容量作…...

uniapp如何获取安卓原生的Intent对象

通过第三方app唤起&#xff0c;并且获取第三方app唤起时携带的参数 因为应用a唤起应用b时&#xff0c;应用b第一时间就要拿到参数token&#xff0c;所以需要将获取参数的方法写在APP.vue中的onLaunch钩子里,如果其他地方要用可以选择vuex或者采用本地缓存。 uniapp中plus.run…...

implement the “pixel-wise difference“

根据在处理图像数据的来源和格式的不同&#xff0c;在具体实现“两幅图像残差比较”的时候&#xff0c;分为两类方法。 类型一&#xff1a;PyTorch 的 Tensor 图像格式 imgs_pil_o [transforms.ToPILImage()(img_o) for img_o in imgs_o] imgs_pil_w [transforms.ToPILImag…...

tinycudann安装过程加ubuntu18.04gcc版本的升级(成功版!!!!)

使用的是 Linux&#xff0c;安装以下软件包 sudo apt-get install build-essential git安装 CUDA 并将 CUDA 安装添加到您的 PATH。 例如&#xff0c;如果您有 CUDA 12.6.3&#xff0c;请将以下内容添加到您的/usr/local/~/.bashrcexport PATH"/usr/local/cuda-12.6.3/bi…...

Android 实现一个隐私弹窗

效果图如下&#xff1a; 1. 设置同意、退出、点击用户协议、点击隐私协议的函数参数 2. 《用户协议》、《隐私政策》设置成可点击的&#xff0c;且颜色要区分出来 res/layout/dialog_privacy_policy.xml 文件 <?xml version"1.0" encoding"utf-8"?&…...

Oracle无法正常OPEN(三)

在Oracle数据库中&#xff0c;如果几个数据文件丢失&#xff0c;导致数据库无法启动&#xff0c;报错“ORA-01157: cannot identify/lock data file 2 - see DBWR trace file”&#xff0c;如果没有物理备份的情况下&#xff0c;位于丢失数据文件的数据是无法找回的&#xff0c…...

本地服务验证-仙盟创梦IDE-智能编程,编程自动备份+编程审计

本地服务验证server using System; using System.Net;class Program {static void Main(){HttpListener listener new HttpListener();listener.Prefixes.Add("http://localhost:8080/");listener.Start();Console.WriteLine("服务器已启动&#xff0c;监听中…...

[学成在线]22-自动部署项目

自动部署 实战流程 下边使用jenkins实现CI/CD的流程。 1、将代码使用Git托管 2、在jenkins创建任务&#xff0c;从Git拉取代码。 3、拉取代码后进行自动构建&#xff1a;测试、打包、部署。 首先将代码打成镜像包上传到docker私服。 自动创建容器、启动容器。 4、当有代…...

Golang|使用函数作为参数和使用接口的联系

函数作为数据类型的一种&#xff0c;可以成为其他函数的参数。在 Go&#xff08;Golang&#xff09; 中&#xff0c;函数作为参数 和 接口&#xff08;interface&#xff09;&#xff0c;本质上都和抽象、灵活调用有关 —— 都是让代码更灵活、更可扩展的手段。不过它们各有侧重…...

MATLAB技巧——norm和vecnorm两个函数讲解与辨析

在 MATLAB 中,norm 和 vecnorm 是两个用于计算向量或矩阵范数的函数,虽然它们的功能相似,但在使用场景和适用性上存在一些区别。本文将详细解释这两个函数的用途、功能以及如何选择合适的函数。 文章目录 norm函数用法范数类型vecnorm函数用法范数类型选择合适的函数示例对比…...

ubuntu的libc 库被我 sudo apt-get --reinstall install libc6搞没了

我系统的libc 没了 今天为了运行一个开源的yuv 播放器&#xff0c;在运行的时候提醒 Inconsistency detected by ld.so: dl-call-libc-early-init.c: 37: _dl_call_libc_early_init: Assertion sym ! NULL failed!然后听从AI 的建议 当我去执行ls 时&#xff0c;系统提示 就这…...