当前位置: 首页 > article >正文

计算机视觉---目标检测(Object Detecting)概览

一、目标检测定义与核心任务

1. 定义

  • 任务:在图像/视频中定位并分类所有感兴趣目标,输出边界框(Bounding Box)和类别标签。
  • 核心输出
    • 坐标:((x_1, y_1, x_2, y_2))(左上角+右下角)或 ((x, y, w, h))(中心+宽高)。
    • 类别:离散标签(如“汽车”“行人”)。
    • 置信度:目标存在的概率(用于后处理筛选)。
      在这里插入图片描述

2. 关键挑战

  • 多尺度变化:目标大小差异大(如远处车辆vs近处行人)。
  • 遮挡与模糊:部分目标被遮挡或成像质量差。
  • 类别不平衡:数据集中少数类别样本稀缺。
  • 实时性需求:自动驾驶等场景要求毫秒级响应。

在这里插入图片描述

二、发展历程:从传统方法到深度学习

1. 传统方法(2010年前)

  • 手工特征阶段
    • HOG+SVM(2005):梯度方向直方图提取边缘特征,SVM分类。
    • DPM(可变形部件模型)(2008):基于滑动窗口,结合部件模板匹配,处理目标形变。
  • 缺陷:依赖人工设计特征,泛化能力弱,计算效率低。

2. 深度学习早期(2014-2017:两阶段检测器主导)

  • R-CNN系列
    • R-CNN(2014):首次将CNN引入目标检测,流程:选择性搜索生成2k候选框→CNN提取特征→SVM分类→回归调整边界框。缺点:耗时(单图47s),重复计算。
    • Fast R-CNN(2015):引入ROI池化共享特征计算,联合优化分类与回归,速度提升至2s/图。
    • Faster R-CNN(2015):提出区域建议网络(RPN)替代选择性搜索,端到端训练,首次实现实时性(17fps)。
  • 里程碑:证明深度学习在目标检测的绝对优势,奠定两阶段框架(候选框生成+分类回归)。

3. 单阶段崛起(2016-2020:效率优先)

  • YOLO系列
    • YOLOv1(2016):颠覆两阶段范式,直接将图像划分为(S×S)网格,每个网格预测边界框和类别,速度达45fps(牺牲部分精度)。
    • SSD(2016):多尺度特征图预测,兼顾速度(59fps)与精度,首次在移动端可用。
    • YOLOv2-v3(2017):引入锚框聚类、多尺度训练、FPN特征融合,精度接近两阶段模型,速度保持领先。
  • RetinaNet(2017):提出焦点损失(Focal Loss)解决正负样本失衡,单阶段精度首次超越两阶段。

4. 无锚框与Transformer时代(2020-至今)

  • Anchor-Free
    • CenterNet(2019):通过关键点检测目标中心,回归宽高,避免锚框设计,简化流程。
    • FCOS(2019):逐像素预测“是否属于目标”及相对位置,完全无锚,泛化能力强。
  • Transformer融合
    • DETR(2020):首次将Transformer引入检测,端到端消除NMS,通过集合预测直接输出结果,但收敛慢(500epochs)。
    • Swin Transformer(2021):结合局部注意力与层次化特征,在COCO数据集刷新mAP纪录(58.7%)。
  • 轻量化与实时化
    • YOLOv5/v6/v7/v8:持续优化网络结构(CSP模块、动态网络),适应边缘设备(如YOLOv8n在CPU达160fps)。
    • NanoDet/PP-YOLO:模型压缩技术(知识蒸馏、量化)推动移动端部署。

三、核心技术模块详解

1. 候选区域生成(两阶段检测器)

  • RPN(区域建议网络)
    • 原理:在特征图上滑动窗口,生成锚框(预设不同尺度/比例),分类锚框为“前景/背景”,回归锚框偏移。
    • 优势:替代传统选择性搜索,生成建议框速度提升100倍。
  • 锚框设计
    • 超参数:尺度(如32×32, 64×64)、比例(1:1, 1:2, 2:1),通常通过K-means聚类数据集真实框确定。
    • 问题:锚框数量多导致正负样本失衡(99%为背景),催生Focal Loss等优化。

2. 特征提取网络

  • 经典Backbone
    • VGG(2014):堆叠3×3卷积,奠定深度CNN基础。
    • ResNet(2015):残差连接解决梯度消失,支持超深网络(如ResNet-101)。
    • DenseNet(2017):密集连接复用特征,减少参数量。
  • 多尺度特征融合
    • FPN(特征金字塔网络,2017):自顶向下融合高层语义与底层细节,提升小目标检测。
    • PANet(2018):增加自底向上路径,强化不同层级特征流动。
    • BiFPN(2020):加权双向特征融合,动态调整跨层连接权重。
  • Transformer类Backbone
    • Swin Transformer:分层窗口注意力,兼顾局部与全局建模,分辨率适配性强。
    • Vision Transformer(ViT):纯Transformer架构,在大规模数据集预训练后性能超越CNN。

3. 分类与回归头

  • 分类任务
    • 多类别softmax:输出类别概率分布,交叉熵损失优化。
    • 焦点损失(Focal Loss):通过(\alpha)和(\gamma)参数降低简单样本权重,缓解正负/难易样本失衡。
  • 回归任务
    • 目标:预测锚框/中心点到真实框的偏移量((\Delta x, \Delta y, \Delta w, \Delta h))。
    • 损失函数:
      • Smooth L1:对离群值不敏感,优于L2损失。
      • IoU Loss系列:
        • IoU(2016):直接优化边界框重叠度,解决L1/L2不直接关联定位精度的问题。
        • GIoU(2019):考虑包围框面积,处理不相交框的梯度消失。
        • DIoU/CIoU(2020):进一步引入中心点距离和长宽比约束,收敛更快、定位更准。

4. 后处理:边界框筛选

  • NMS(非极大值抑制)
    • 流程:按置信度排序→保留最高分框→抑制与最高分框IoU超过阈值(如0.5)的框→重复直至处理所有框。
    • 变体:
      • Soft-NMS:不直接删除高IoU框,而是降低其置信度,避免漏检遮挡目标。
      • DIoU-NMS:用DIoU替代传统IoU,考虑中心点距离,更适合密集目标场景(如人群)。
  • 锚框解码
    • 将模型预测的偏移量转换为真实坐标,需考虑锚框初始尺寸和特征图缩放因子。

5. 无锚框机制(Anchor-Free)

  • 关键点检测
    • CornerNet(2018):检测目标的左上角和右下角关键点,组合成边界框。
    • CenterNet(2019):预测目标中心热力图,直接回归宽高,无需分组关键点。
  • 逐像素预测
    • FCOS(2019):每个像素若位于目标框内,则预测其到框四边的距离(l, t, r, b),通过中心度(Centerness)抑制远离中心的低质量框。
  • 优势:消除锚框超参数(如数量、尺度),减少内存占用,提升泛化能力(尤其未知形状目标)。

四、主流算法分类与对比

1. 两阶段检测器(Two-Stage)

算法核心创新优势劣势典型应用
Faster R-CNNRPN替代选择性搜索精度高(COCO mAP 43.5%)速度慢(5fps)高精度场景
Mask R-CNN增加实例分割分支同时实现检测与分割计算量翻倍医学影像分析
Cascade R-CNN级联多个回归器逐步优化框极端IoU下精度提升推理时间更长工业质检

2. 单阶段检测器(One-Stage)

算法核心创新优势劣势典型应用
YOLO系列网格直接预测框+类别速度极快(v8s达220fps)小目标检测较弱自动驾驶
SSD多尺度特征图预测移动端友好(30fps)锚框设计依赖经验手机摄像头
RetinaNet焦点损失解决样本失衡单阶段精度首次超越两阶段计算量较高通用检测

3. 无锚框检测器(Anchor-Free)

算法核心思路优势劣势典型应用
CenterNet中心点+宽高回归模型简单,无锚框设计密集目标易漏检无人机巡检
FCOS逐像素距离回归+中心度泛化能力强需多层特征融合遥感目标检测

4. Transformer基检测器

算法核心思路优势劣势典型应用
DETRTransformer集合预测+二分匹配端到端无NMS收敛慢(500epochs)学术研究
Deformable DETR可变形注意力减少计算量速度提升3倍精度略降视频检测
Swin Transformer Detector层次化Transformer+窗口注意力刷新COCO mAP至58.7%参数量大(100M+)科研竞赛

五、评估指标:全面衡量性能

1. 精度指标

  • mAP(平均精度均值)
    • 计算每个类别在不同置信度阈值下的精确率-召回率曲线(AP),再取所有类别的平均值。
    • COCO数据集采用多IoU阈值(0.5到0.95,步长0.05)的平均值(mAP@0.5:0.95),更严格评估定位精度。
    • 细分指标:mAP_s/mAP_m/mAP_l(小/中/大目标)。
  • 召回率(Recall):检测到的真实目标占所有真实目标的比例(避免漏检)。
  • 精确率(Precision):检测结果中正确目标的比例(避免误检)。

2. 效率指标

  • FPS(帧率):每秒处理图像数,衡量实时性(≥30fps为流畅)。
  • 模型复杂度
    • 参数量(Params):影响模型大小(如YOLOv8n为3.2M,DETR为85M)。
    • 计算量(FLOPs):浮点运算次数,反映推理耗时(如ResNet-50约4FLOPs)。

3. 其他指标

  • F1分数:精确率与召回率的调和平均,平衡两者的综合指标。
  • 推理延迟:端到端处理时间(包括数据加载、前向传播、后处理),硬件敏感(GPU/CPU/NPU差异大)。

六、训练技巧:提升模型性能的关键

1. 数据增强

  • 基础增强:翻转、裁剪、缩放、颜色抖动,提升数据多样性。
  • 高级增强
    • Mosaic(YOLOv4):拼接4张图像,丰富小目标数量,增强上下文关联。
    • MixUp:融合两张图像及其标签,抑制模型对单一样本的过拟合。
    • CutOut/CutMix:随机遮挡区域或替换区域,提升模型抗遮挡能力。

2. 样本平衡策略

  • 难例挖掘
    • OHEM(在线难例挖掘,Fast R-CNN):选择损失最高的样本训练,聚焦难分样本。
    • 焦点损失(RetinaNet):通过指数衰减降低简单样本权重,无需显式筛选。
  • 类别平衡
    • 过采样少数类、欠采样多数类,或使用标签平滑(Label Smoothing)缓解类别不平衡。

3. 多尺度训练与测试

  • 训练阶段:YOLO动态调整输入图像尺寸(如416×416到608×608),提升模型对不同尺度目标的鲁棒性。
  • 测试阶段:多尺度推断(MS-COCO标准),融合不同尺寸结果,提升小目标检测精度。

4. 损失函数优化

  • 定位损失:优先选择CIoU Loss(同时优化重叠度、中心点距离、长宽比),替代传统Smooth L1。
  • 分类损失:结合Focal Loss(处理正负失衡)与Label Smoothing(防止过自信)。
  • 多任务联合优化:如Mask R-CNN同时优化检测损失与分割损失,共享底层特征。

5. 模型优化

  • 骨干网络选择:轻量模型(如MobileNet、ShuffleNet)用于移动端,深层网络(ResNet-101)用于服务器端。
  • 网络结构设计:引入CSP模块(YOLOv5)减少计算量,使用深度可分离卷积(Xception)降低参数量。
  • 预训练与迁移学习:在ImageNet上预训练骨干网络,再在检测数据集上微调,加速收敛并提升精度。

七、应用场景:技术落地的核心领域

1. 安防与监控

  • 人脸检测与识别:门禁系统、犯罪追踪(需高实时性与精度)。
  • 异常行为检测:摔倒检测、入侵报警,结合视频序列分析(如YOLO+DeepSORT跟踪)。

2. 自动驾驶

  • 多传感器融合:摄像头检测+雷达点云定位,处理复杂路况(如特斯拉FSD芯片部署YOLO变体)。
  • 实时性要求:200ms内完成检测(对应5fps),支持紧急制动决策,典型算法:YOLOv8、BEVDet(鸟瞰图检测)。

3. 医疗影像

  • 病灶检测:CT/MRI中的肿瘤、结节定位,需极高精度(mAP>90%),常用算法:3D目标检测(如VNet)、弱监督检测(仅图像级标签训练)。
  • 挑战:数据稀缺、标注成本高,依赖迁移学习与数据增强。

4. 工业与遥感

  • 缺陷检测:电路板焊点缺陷、机械零件裂纹,要求像素级定位,常用算法:Faster R-CNN(高精度)、CenterNet(快速部署)。
  • 遥感目标检测:无人机/卫星图像中的船舶、车辆检测,需处理旋转目标(使用RRPN旋转锚框)和小目标密集场景。

5. 消费级应用

  • 手机摄影:实时物体识别(如Google Lens)、人像虚化(检测人体边界),依赖轻量模型(如SSD-MobileNet)。
  • 电商与物流:商品检测(货架补货)、包裹分拣,结合OCR识别提升效率。

八、当前挑战与未来方向

1. 核心挑战

  • 长尾分布:少数类别样本不足,导致漏检(如罕见鸟类检测),需小样本学习(Few-Shot Learning)与元学习。
  • 开放世界检测:未知类别误判为已知类别,需引入开放集识别(Open-Set Recognition),输出“未知”类别。
  • 鲁棒性不足:对抗样本攻击(如贴纸误导自动驾驶检测)、极端环境(低光照、雨雾)性能骤降,需对抗训练与域适应(Domain Adaptation)。

2. 未来研究方向

  • 高效检测架构
    • 动态网络(Dynamic Network):根据输入复杂度自适应调整计算量(如YOLOv8的动态尺度)。
    • 神经架构搜索(NAS):自动设计最优网络结构,平衡精度与速度。
  • 多模态融合
    • 结合视觉、红外、激光雷达(LiDAR)数据,提升复杂场景检测能力(如自动驾驶多传感器融合模型)。
    • 视频时空建模:引入3D CNN或Transformer处理时序信息,优化视频检测与跟踪(如DETR3D)。
  • 自监督与弱监督
    • 利用海量无标注数据预训练(如MAE掩码自编码器),降低标注成本。
    • 弱监督检测:仅用图像级标签训练(如ILSVRC数据集),通过注意力机制定位目标区域。
  • 轻量化与边缘部署
    • 模型压缩(剪枝、量化、知识蒸馏):使YOLOv8n在ARM芯片达100fps。
    • 端云协同:边缘设备实时检测,云端处理复杂场景,构建分布式检测系统。

九、总结

目标检测历经从手工特征到深度学习的变革,形成两阶段、单阶段、无锚框、Transformer四大技术路线,覆盖精度、速度、泛化能力的不同需求。未来发展将聚焦高效化(边缘部署)、鲁棒化(复杂环境)、智能化(自监督/多模态),推动技术在安防、自动驾驶、医疗等领域的深度落地。掌握核心模块(特征提取、锚框机制、损失函数、后处理)与主流算法的优缺点,是理解和改进目标检测系统的关键。

相关文章:

计算机视觉---目标检测(Object Detecting)概览

一、目标检测定义与核心任务 1. 定义 任务:在图像/视频中定位并分类所有感兴趣目标,输出边界框(Bounding Box)和类别标签。核心输出: 坐标:((x_1, y_1, x_2, y_2))(左上角右下角)或…...

在vue3中使用Cesium的保姆教程

1. 软件下载与安装 1. node安装 Vue.js 的开发依赖于 Node.js 环境,因此我们首先需要安装 Node.js。Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,它允许你在服务器端运行 JavaScript 代码,同时也为前端开发提供了强大的工具支…...

IP地址、端口、TCP介绍、socket介绍、程序中socket管理

1、IP地址:IP 地址就是 标识网络中设备的一个地址,好比现实生活中的家庭地址。IP 地址的作用是 标识网络中唯一的一台设备的,也就是说通过IP地址能够找到网络中某台设备。 2、端口:代表不同的进程,如下图: 3、socket:…...

基于MCP的桥梁设计规范智能解析与校审系统构建实践

引言 在腾讯云开发者社区中,有多种MCP工具可以用于本系统的开发和优化中,以下是一些潜在的应用场景: ‌PDF解析工具‌:如pdfplumber等,可以用于规范文件的预处理,提取文本和图像信息。‌自然语言处理工具…...

搭建运行若依微服务版本ruoyi-cloud最新教程

搭建运行若依微服务版本ruoyi-cloud 一、环境准备 JDK > 1.8MySQL > 5.7Maven > 3.0Node > 12Redis > 3 二、后端 2.1数据库准备 在navicat上创建数据库ry-seata、ry-config、ry-cloud运行SQL文件ry_20250425.sql、ry_config_20250224.sql、ry_seata_2021012…...

OM和SCADA的区别

在工业与能源领域,O&M(Operation and Maintenance,运维) 和 SCADA(Supervisory Control And Data Acquisition,监控与数据采集系统) 是两类截然不同的概念,前者是 人员与流程驱动…...

CentOS7 grub配置文件介绍

1. grub2-editenv list saved_entryCentOS Linux (3.10.0-1160.el7.x86_64) 7 (Core) 这个命令查询出当前启动的内核版本。 2.grep ^menu /boot/grub2/grub.cfg menuentry CentOS Linux (3.10.0-1160.el7.x86_64) 7 (Core) --class centos --class gnu-linux --class gnu --c…...

SpringBoot常用注解详解

文章目录 1. 前言2. 核心注解2.1 SpringBootApplication2.2 Configuration2.3 EnableAutoConfiguration2.4 ComponentScan2.5 Bean2.6 Autowired2.7 Qualifier2.8 Primary2.9 Value2.10 PropertySource2.11 ConfigurationProperties2.12 Profile 3. Web开发相关注解3.1 Control…...

Python字符串常用内置函数详解

文章目录 Python字符串常用内置函数详解一、基础字符串函数1. len() - 获取字符串长度2. ord() - 获取字符的Unicode码点3. chr() - 通过Unicode码点获取字符4. ascii() - 获取字符的ASCII表示 二、类型转换函数1. str() - 将对象转为字符串2. repr() - 获取对象的官方字符串表…...

MyBatis 批量新增与删除功能完整教程

一、功能概述 通过 MyBatis 动态 SQL 实现以下功能: 批量新增:一次性插入多条员工记录,支持自增主键回填。批量删除:根据 ID 数组一次性删除多条记录。二、代码逐行解析 1. Mapper 接口定义 // 批量新增:传入员工对象集合 void insertAll(List<Emp> empList);// …...

HTML常用标签用法全解析:构建语义化网页的核心指南

HTML作为网页开发的基石&#xff0c;其标签的合理使用直接影响页面的可读性、SEO效果及维护性。本文系统梳理HTML核心标签的用法&#xff0c;结合语义化设计原则与实战示例&#xff0c;助你构建规范、高效的网页结构。 一、基础结构与排版标签 1.1 文档结构 <!DOCTYPE htm…...

大数据架构选型全景指南:核心架构对比与实战案例 解析

目录 大数据架构选型全景指南&#xff1a;核心架构对比与实战案例解析1. 主流架构全景概览1.1 核心架构类型1.2 关键选型维度 2. 架构对比与选型矩阵2.1 主流架构对比表2.2 选型决策树 3. 案例分析与实现案例1&#xff1a;电商实时推荐系统&#xff08;Lambda架构&#xff09;案…...

FPGA: XILINX Kintex 7系列器件的架构

本文将详细介绍Kintex-7系列FPGA器件的架构。以下内容将涵盖Kintex-7的核心架构特性、主要组成部分以及关键技术&#xff0c;尽量全面且结构化&#xff0c;同时用简洁的语言确保清晰易懂。 Kintex-7系列FPGA架构概述 Kintex-7是Xilinx 7系列FPGA中的中高端产品线&#xff0c;基…...

RK3568-鸿蒙5.1与原生固件-扇区对比分析

编译生成的固件目录地址 ../openharmony/out/rk3568/packages/phone/images鸿蒙OS RK3568固件分析 通过查看提供的信息&#xff0c;分析RK3568开发板固件的各个组件及其用途&#xff1a; 主要固件组件 根据终端输出的文件列表&#xff0c;RK3568固件包含以下关键组件&#x…...

常见激活函数——作用、意义、特点及实现

文章目录 激活函数的意义常见激活函数及其特点1. Sigmoid&#xff08;Logistic 函数、S型函数&#xff09;2. Tanh&#xff08;双曲正切函数&#xff09;3. ReLU&#xff08;Rectified Linear Unit修正线性单元&#xff09;4. Softmax5. Swish&#xff08;Google 提出&#xff…...

Spring模拟转账开发

完成转账代码的编写 service public class AccountServiceImpl implements AccountService {Autowiredprivate AccountDao accountDao;public void setAccountDao(AccountDao accountDao) {this.accountDao accountDao;}public void pay(String out, String in, Double money)…...

基于微信小程序的在线聊天功能实现:WebSocket通信实战

基于微信小程序的在线聊天功能实现&#xff1a;WebSocket通信实战 摘要 本文将详细介绍如何使用微信小程序结合WebSocket协议开发一个实时在线聊天功能。通过完整的代码示例和分步解析&#xff0c;涵盖界面布局、WebSocket连接管理、消息交互逻辑及服务端实现&#xff0c;适合…...

小波变换+注意力机制成为nature收割机

小波变换作为一种新兴的信号分析工具&#xff0c;能够高效地提取信号的局部特征&#xff0c;为复杂数据的处理提供了有力支持。然而&#xff0c;它在捕捉数据中最为关键的部分时仍存在局限性。为了弥补这一不足&#xff0c;我们引入了注意力机制&#xff0c;借助其能够强化关注…...

【无标题】威灏光电哲讯科技MES项目启动会圆满举行

5月14日&#xff0c;威灏光电与哲讯科技MES项目启动会在威灏光电总部隆重举行。威灏光电董事长江轮、总经理刘明星、哲讯科技总经理崔新华、副总王子文及双方项目组成员共同出席&#xff0c;标志着两家企业在数字化领域的第二次深度合作正式启航。 强强联手&#xff0c;二度合作…...

腾讯云存储原理

我们来详细展开你提到的两个核心结构概念&#xff1a; 一、“基于分布式文件系统 对象存储技术” 是什么&#xff1f; 1. 分布式文件系统&#xff08;DFS&#xff09;基础 分布式文件系统是一种支持将数据分布在多个存储节点上、并对上层用户透明的文件系统。腾讯云COS虽然是…...

display:grid网格布局属性说明

网格父级 &#xff1a;display:grid&#xff08;块级网格&#xff09;/ inline-grid&#xff08;行内网格&#xff09; 注意&#xff1a;当设置网格布局&#xff0c;column、float、clear、vertical-align的属性是无效的。 HTML: <ul class"ls02 f18 mt50 sysmt30&…...

排序算法之高效排序:快速排序,归并排序,堆排序详解

排序算法之高效排序&#xff1a;快速排序、归并排序、堆排序详解 前言一、快速排序&#xff08;Quick Sort&#xff09;1.1 算法原理1.2 代码实现&#xff08;Python&#xff09;1.3 性能分析 二、归并排序&#xff08;Merge Sort&#xff09;2.1 算法原理2.2 代码实现&#xf…...

Java 并发编程归纳总结(可重入锁 | JMM | synchronized 实现原理)

1、锁的可重入 一个不可重入的锁&#xff0c;抢占该锁的方法递归调用自己&#xff0c;或者两个持有该锁的方法之间发生调用&#xff0c;都会发生死锁。以之前实现的显式独占锁为例&#xff0c;在递归调用时会发生死锁&#xff1a; public class MyLock implements Lock {/* 仅…...

基于对抗性后训练的快速文本到音频生成:stable-audio-open-small 模型论文速读

Fast Text-to-Audio Generation with Adversarial Post-Training 论文解析 一、引言与背景 文本到音频系统的局限性&#xff1a;当前文本到音频生成系统性能虽佳&#xff0c;但推理速度慢&#xff08;需数秒至数分钟&#xff09;&#xff0c;限制了其在创意领域的应用。 研究…...

BUFDS_GTE2,IBUFDS,BUFG缓冲的区别

1、IBUFDS_GTE2 这是 Xilinx FPGA 中专门为 高速收发器&#xff08;SerDes/GTX/GTH/GTY&#xff09;参考时钟设计的差分输入缓冲器。 主要功能是将外部的差分时钟信号&#xff08;如LVDS、LVPECL等&#xff09;转换为FPGA内部的单端时钟信号&#xff0c;并保证信号的完整性和高…...

ADC深入——SNR、SFDR、ENOB等概念

目录 SNR&#xff08;Spurious‑Free Dynamic Range 信噪比&#xff09; ENOB&#xff08;Effective Number Of Bits 有效位&#xff09; SFDR&#xff08;Spurious‑Free Dynamic Range&#xff09; 感觉SNR和SFDR差不多&#xff1f;看看下图 输入带宽 混叠 带通采样/欠…...

ThinkPad X250电池换电池芯(理论技术储备)

参考&#xff1a;笔记本电池换电芯的经验与心得分享 - 经典ThinkPad专区 - 专门网 换电池芯&#xff0c;需要克服以下问题&#xff1a; 1 拆电池。由于是超声波焊接&#xff0c;拆解比较费力&#xff0c;如果暴力撬&#xff0c;有可能导致电池壳变形... 2 替换电池芯的时候如…...

硬件厂商的MIB文档详解 | 如何查询OID? | MIB Browser实战指南-优雅草卓伊凡

硬件厂商的MIB文档详解 | 如何查询OID? | MIB Browser实战指南-优雅草卓伊凡 一、硬件厂商的MIB文档是什么&#xff1f; 1. MIB的本质&#xff1a;设备的”数据字典” MIB&#xff08;Management Information Base&#xff09; 是SNMP协议的核心数据库&#xff0c;定义了设备…...

阿里开源通义万相 Wan2.1-VACE,开启视频创作新时代

0.前言 阿里巴巴于2025年5月14日正式开源了其最新的AI视频生成与编辑模型——通义万相Wan2.1-VACE。这一模型是业界功能最全面的视频生成与编辑工具&#xff0c;能够同时支持多种视频生成和编辑任务&#xff0c;包括文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展…...

小学数学题批量生成及检查工具

软件介绍 今天给大家介绍一款近期发现的小工具&#xff0c;它非常实用。 软件特点与出题功能 这款软件体积小巧&#xff0c;不足两兆&#xff0c;具备强大的功能&#xff0c;能够轻松实现批量出题。使用时&#xff0c;只需打开软件&#xff0c;输入最大数和最小数&#xff0c…...