当前位置：首页 > news >正文

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-autobackend.py

news 2025/7/8 5:35:31

autobackend.py

ultralytics\nn\autobackend.py

autobackend.py

1.所需的库和模块

2.def check_class_names(names):

3.def default_class_names(data=None):

4.class AutoBackend(nn.Module):

1.所需的库和模块

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/licenseimport ast
import json
import platform
import zipfile
from collections import OrderedDict, namedtuple
from pathlib import Pathimport cv2
import numpy as np
import torch
import torch.nn as nn
from PIL import Imagefrom ultralytics.utils import ARM64, IS_JETSON, IS_RASPBERRYPI, LINUX, LOGGER, PYTHON_VERSION, ROOT, yaml_load
from ultralytics.utils.checks import check_requirements, check_suffix, check_version, check_yaml, is_rockchip
from ultralytics.utils.downloads import attempt_download_asset, is_url

2.def check_class_names(names):

# 这段代码定义了一个函数 check_class_names ，用于检查和处理类别名称（ names ）。它的主要功能包。将类别名称从列表转换为字典。将类别索引从字符串转换为整数，并确保类别名称为字符串格式。检查类别索引是否有效。如果类别名称是 ImageNet 的类别代码，则将其映射为人类可读的名称。
# 定义了一个函数 check_class_names ，接受一个参数。
# 1.names ：类别名称。
def check_class_names(names):# 检查类名。# 如果需要，将 imagenet 类代码映射到人类可读的名称。将列表转换为字典。"""Check class names.Map imagenet class codes to human-readable names if required. Convert lists to dicts."""# 检查 names 是否是一个列表。if isinstance(names, list):  # names is a list# 如果 names 是一个列表，则将其转换为字典。 使用 enumerate(names) 生成索引和值的元组。 使用 dict(...) 将其转换为字典，其中索引作为键，类别名称作为值。names = dict(enumerate(names))  # convert to dict# 检查 names 是否是一个字典。if isinstance(names, dict):# Convert 1) string keys to int, i.e. '0' to 0, and non-string values to strings, i.e. True to 'True'# 如果 names 是一个字典，则进行以下处理。# 将键（类别索引）从字符串转换为整数。# 将值（类别名称）转换为字符串。# 使用字典推导式生成新的字典。names = {int(k): str(v) for k, v in names.items()}# 获取 类别总数 ，存储在变量 n 中。n = len(names)# 检查 类别索引是否有效 。如果最大类别索引大于或等于类别总数 n ，则说明类别索引无效。if max(names.keys()) >= n:# 抛出一个 KeyError 异常，提示用户类别索引无效。raise KeyError(f"{n}-class dataset requires class indices 0-{n - 1}, but you have invalid class indices "    # {n} 类数据集需要类索引 0-{n - 1}，f"{min(names.keys())}-{max(names.keys())} defined in your dataset YAML."    # 但是您在数据集 YAML 中定义了无效的类索引 {min(names.keys())}-{max(names.keys())}。)# 检查类别名称是否为 ImageNet 的类别代码。 如果第一个类别名称是字符串，并且以 "n0" 开头（例如 "n01440764" ），则认为是 ImageNet 的类别代码。if isinstance(names[0], str) and names[0].startswith("n0"):  # imagenet class codes, i.e. 'n01440764'# 加载 ImageNet 的类别映射文件。 使用 yaml_load 函数加载 ROOT / "cfg/datasets/ImageNet.yaml" 文件。 提取文件中的 map 字段，该字段包含类别代码到人类可读名称的映射。# def yaml_load(file="data.yaml", append_filename=False): -> 用于加载和解析YAML文件。它还提供了一些额外的功能，例如清理文件内容中的特殊字符，并可以选择将文件名添加到解析后的数据中。返回解析后的YAML数据，可能包含文件名（如果 append_filename 为 True ）。 -> return datanames_map = yaml_load(ROOT / "cfg/datasets/ImageNet.yaml")["map"]  # human-readable names# 将类别代码映射为人类可读的名称。 使用字典推导式，将 names 中的每个类别代码 v 替换为对应的可读名称 names_map[v] 。names = {k: names_map[v] for k, v in names.items()}# 返回处理后的类别名称字典。return names
# check_class_names 函数的主要功能和作用如下。格式转换：将类别名称从列表转换为字典，方便后续处理。数据类型校验：确保类别索引为整数，类别名称为字符串。索引检查：验证类别索引是否在有效范围内，避免索引错误。映射处理：如果类别名称是 ImageNet 的类别代码，则将其映射为人类可读的名称。灵活性和兼容性：支持多种输入格式（列表或字典），并提供详细的错误提示，方便调试和使用。这个函数在处理类别名称时非常实用，尤其是在处理数据集配置文件时，能够确保类别名称的正确性和一致性。

3.def default_class_names(data=None):

# 这段代码定义了一个函数 default_class_names ，用于从输入的 YAML 文件中提取类别名称，或者在无法提取时返回默认的类别名称。
# 定义了一个函数 default_class_names ，接受一个可选参数。
# 1.data ：输入的 YAML 文件路径或其他数据源。
def default_class_names(data=None):# 将默认类名应用于输入 YAML 文件或返回数字类名。"""Applies default class names to an input YAML file or returns numerical class names."""# 检查是否提供了输入数据 data 。if data:# 开始一个 try 块，尝试从输入数据中提取类别名称。try:# 调用 check_yaml(data) 函数，验证输入的 data 是否为有效的 YAML 文件路径或内容。# 使用 yaml_load 函数加载 YAML 文件内容。# 提取 names 字段，返回类别名称列表。# def check_yaml(file, suffix=(".yaml", ".yml"), hard=True): -> 用于检查YAML文件是否存在，如果不存在则尝试下载文件，并返回文件的路径。它还检查文件的后缀是否符合指定的允许后缀列表。调用 check_file 函数，检查文件是否存在，如果不存在则尝试下载文件，并返回文件的路径。 -> return check_file(file, suffix, hard=hard)return yaml_load(check_yaml(data))["names"]# 如果在尝试提取类别名称时发生任何异常（如文件不存在、格式错误等），则进入 except 块。except Exception:# 在 except 块中，不执行任何操作，直接跳过异常处理。pass# 如果无法从输入数据中提取类别名称（或未提供输入），则返回默认的类别名称字典。 使用字典推导式生成一个字典，键为类别索引（从 0 到 998），值为格式化的字符串 "class{i}" 。 这样可以确保即使没有提供有效的类别名称，函数也能返回一个默认的类别名称映射。return {i: f"class{i}" for i in range(999)}  # return default if above errors
# default_class_names 函数的主要功能和作用如下。从 YAML 文件中提取类别名称：如果提供了有效的 YAML 文件路径或内容，函数会尝试从中提取 names 字段。提取的类别名称以列表形式返回。提供默认的类别名称：如果输入数据无效或未提供输入，函数会返回一个默认的类别名称字典。默认的类别名称格式为 "class{i}" ，其中 i 是类别索引。容错处理：函数通过 try-except 块捕获可能的异常，确保即使输入数据有问题，也不会导致程序崩溃。如果提取失败，函数会返回默认的类别名称字典，保证函数的输出始终是有效的。这个函数在处理数据集配置文件时非常实用，尤其是在类别名称可能缺失或格式不正确的情况下，能够提供一个可靠的默认值。

4.class AutoBackend(nn.Module):

# 这段代码定义了一个名为 AutoBackend 的类，它是 Ultralytics YOLO 模型的动态后端选择器，用于在不同平台上运行推理。 AutoBackend 支持多种模型格式，并能够根据输入模型的格式动态切换后端，从而简化了模型部署过程。
# AutoBackend 继承自 torch.nn.Module ，使其可以像 PyTorch 模型一样使用。
class AutoBackend(nn.Module):# 处理使用 Ultralytics YOLO 模型运行推理的动态后端选择。# AutoBackend 类旨在为各种推理引擎提供抽象层。它支持多种格式，每种格式都有特定的命名约定，如下所述：# 支持的格式和命名约定：# | Format                | File Suffix       |# | --------------------- | ----------------- |# | PyTorch               | *.pt              |"""Handles dynamic backend selection for running inference using Ultralytics YOLO models.The AutoBackend class is designed to provide an abstraction layer for various inference engines. It supports a widerange of formats, each with specific naming conventions as outlined below:Supported Formats and Naming Conventions:| Format                | File Suffix       || --------------------- | ----------------- || PyTorch               | *.pt              || TorchScript           | *.torchscript     || ONNX Runtime          | *.onnx            || ONNX OpenCV DNN       | *.onnx (dnn=True) || OpenVINO              | *openvino_model/  || CoreML                | *.mlpackage       || TensorRT              | *.engine          || TensorFlow SavedModel | *_saved_model/    || TensorFlow GraphDef   | *.pb              || TensorFlow Lite       | *.tflite          || TensorFlow Edge TPU   | *_edgetpu.tflite  || PaddlePaddle          | *_paddle_model/   || MNN                   | *.mnn             || NCNN                  | *_ncnn_model/     || IMX                   | *_imx_model/      || RKNN                  | *_rknn_model/     |This class offers dynamic backend switching capabilities based on the input model format, making it easier to deploymodels across various platforms."""# 这段代码是 AutoBackend 类的初始化方法 __init__ ，它负责根据输入的模型权重和配置参数，加载不同格式的模型，并进行相应的初始化操作。# 装饰器，表示在初始化过程中不会计算梯度，适用于推理阶段。@torch.no_grad()# 参数 ：# 1.weights ：模型权重文件路径或 torch.nn.Module 实例，默认为 "yolo11n.pt" 。# 2.device ：运行模型的设备，默认为 CPU。# 3.dnn ：是否使用 OpenCV DNN 模块进行 ONNX 推理，默认为 False 。# 4.data ：包含类别名称的额外 data.yaml 文件路径，可选。# 5.fp16 ：是否启用半精度推理，默认为 False 。# 6.batch ：推理时假设的批量大小，默认为 1。# 7.fuse ：是否融合 Conv2D + BatchNorm 层以优化，默认为 True 。# 8.verbose ：是否启用详细日志，默认为 True 。def __init__(self,weights="yolo11n.pt",device=torch.device("cpu"),dnn=False,data=None,fp16=False,batch=1,fuse=True,verbose=True,):# 初始化 AutoBackend 进行推理。"""Initialize the AutoBackend for inference.Args:weights (str | torch.nn.Module): Path to the model weights file or a module instance. Defaults to 'yolo11n.pt'.device (torch.device): Device to run the model on. Defaults to CPU.dnn (bool): Use OpenCV DNN module for ONNX inference. Defaults to False.data (str | Path | optional): Path to the additional data.yaml file containing class names. Optional.fp16 (bool): Enable half-precision inference. Supported only on specific backends. Defaults to False.batch (int): Batch-size to assume for inference.fuse (bool): Fuse Conv2D + BatchNorm layers for optimization. Defaults to True.verbose (bool): Enable verbose logging. Defaults to True."""# 这段代码是 AutoBackend 类初始化方法 __init__ 的一部分，主要负责初始化一些基础变量和模型的格式检测。# 调用父类 torch.nn.Module 的初始化方法，确保 AutoBackend 类继承了 PyTorch 模块的基本功能。super().__init__()# 如果 weights 是一个列表，则取列表的第一个元素作为权重路径；否则直接将 weights 转换为字符串。 这样可以支持用户传入单个权重文件路径或权重文件列表。w = str(weights[0] if isinstance(weights, list) else weights)# 检查 weights 是否为 torch.nn.Module 的实例。 如果是，说明用户传入的是一个已经加载的 PyTorch 模型，而不是权重文件路径。nn_module = isinstance(weights, torch.nn.Module)# 检测模型格式。(# _model_type 方法返回一个元组，包含布尔值。# 表示模型是否为 PyTorch ( pt )、pt,# TorchScript ( jit )、jit,# ONNX ( onnx )、onnx,# OpenVINO ( xml )、xml,# TensorRT ( engine )、engine,# CoreML ( coreml )、coreml,# TensorFlow SavedModel ( saved_model )、saved_model,# TensorFlow GraphDef ( pb )、pb,# TensorFlow Lite ( tflite )、tflite,# Edge TPU ( edgetpu )、edgetpu,# TensorFlow.js ( tfjs )、tfjs,# PaddlePaddle ( paddle )、paddle,# MNN ( mnn )、mnn,# NCNN ( ncnn )、ncnn,# IMX ( imx )、imx,# RKNN ( rknn ) 、rknn,# 或 Triton ( triton ) 格式。triton,# 调用 _model_type 方法，根据权重文件路径 w 检测模型的格式。) = self._model_type(w)# 设置 FP16 和 NHWC 格式。# 如果模型是 PyTorch ( pt )、TorchScript ( jit )、ONNX ( onnx )、OpenVINO ( xml )、TensorRT ( engine )、PyTorch 模块 ( nn_module ) 或 Triton ( triton ) 格式，则支持半精度推理（FP16）。# 这里使用了位运算符 &= ，只有在上述条件满足时， fp16 才保持为 True 。fp16 &= pt or jit or onnx or xml or engine or nn_module or triton  # FP16# 如果模型是 CoreML ( coreml )、TensorFlow SavedModel ( saved_model )、TensorFlow GraphDef ( pb )、TensorFlow Lite ( tflite )、Edge TPU ( edgetpu ) 或 RKNN ( rknn ) 格式，则数据格式为 NHWC（ height, width, channels ），而不是 PyTorch 默认的 NCHW（ channels, height, width ）。nhwc = coreml or saved_model or pb or tflite or edgetpu or rknn  # BHWC formats (vs torch BCWH)# 初始化其他变量。# stride 默认步幅为 32。stride = 32  # default stride# end2end 默认为 False ，表示模型不是端到端的。end2end = False  # default end2end# model 、 metadata 和 task 初始化为 None ，稍后根据模型格式加载相应的值。model, metadata, task = None, None, None# 这段代码的主要作用是。初始化基础变量：设置一些默认值，如步幅、端到端标志等。检测模型格式：根据权重文件路径或 PyTorch 模块，确定模型的格式。设置推理配置：根据模型格式，决定是否支持半精度推理（FP16）和数据格式（NHWC 或 NCHW）。这些初始化操作为后续的模型加载和推理提供了必要的基础信息。# 这段代码的作用是根据模型的格式和设备的可用性来设置推理时使用的设备（CPU 或 GPU）。# Set device# 如果系统支持 CUDA 且用户指定的设备不是 CPU，则将 cuda 设置为 True ，表示可以使用 GPU 进行推理；否则， cuda 为 False 。# torch.cuda.is_available() ：检查当前系统是否支持 CUDA（即是否有可用的 NVIDIA GPU）。# device.type != "cpu" ：检查用户指定的设备是否不是 CPU。cuda = torch.cuda.is_available() and device.type != "cpu"  # use CUDA# 如果模型不是上述支持 GPU 的格式，则将设备设置为 CPU，并将 cuda 设置为 False 。# cuda ：表示前面检测到系统支持 CUDA。# not any([nn_module, pt, jit, engine, onnx, paddle]) ：检查模型是否不是以下格式 ：# nn_module ：PyTorch 模块。# pt ：PyTorch 模型。# jit ：TorchScript 模型。# engine ：TensorRT 模型。# onnx ：ONNX 模型。# paddle ：PaddlePaddle 模型。if cuda and not any([nn_module, pt, jit, engine, onnx, paddle]):  # GPU dataloader formatsdevice = torch.device("cpu")cuda = False# 这段代码的主要作用是。检查 CUDA 是否可用：如果系统支持 CUDA 且用户指定的设备不是 CPU，则尝试使用 GPU。检查模型格式是否支持 GPU：如果模型格式不支持 GPU 推理，则将设备切换到 CPU，并禁用 CUDA。通过这段代码， AutoBackend 类能够根据模型格式和设备的可用性，动态选择最适合的推理设备。# Download if not local# 如果模型不是 PyTorch ( pt )、Triton ( triton ) 或 torch.nn.Module ( nn_module ) 格式。if not (pt or triton or nn_module):# 则调用 attempt_download_asset 函数。 attempt_download_asset 函数会尝试下载模型文件，确保模型文件在本地可用。# def attempt_download_asset(file, repo="ultralytics/assets", release="v8.3.0", **kwargs): -> 用于尝试下载指定的资产文件（如模型文件）。它会检查文件是否已存在，如果不存在，则尝试从指定的URL或GitHub仓库下载。返回文件的路径。 -> return str(file)w = attempt_download_asset(w)# 这段代码处理了当输入的 weights 是一个已经加载的 PyTorch 模型（ torch.nn.Module ）时的情况。# In-memory PyTorch model# nn_module 是之前通过 isinstance(weights, torch.nn.Module) 检测得到的布尔值，表示 weights 是否是一个 PyTorch 模型实例。 如果是 PyTorch 模型实例，则进入这个分支。if nn_module:# 将输入的 PyTorch 模型 weights 移动到指定的设备（ device ）上。 这一步确保模型的参数和缓冲区在正确的设备上，例如 CPU 或 GPU。model = weights.to(device)# 如果 fuse 参数为 True 。if fuse:# 则调用模型的 fuse 方法进行融合优化。# 融合优化通常包括将多个层（如 Conv2D + BatchNorm ）合并为一个层，以提高推理速度。 verbose 参数控制是否输出融合过程的详细信息。model = model.fuse(verbose=verbose)# 获取模型的属性。# 检查模型是否有 kpt_shape 属性。if hasattr(model, "kpt_shape"):# 如果有，则将其值赋给变量 kpt_shape 。 kpt_shape 通常用于姿势检测模型，表示关键点的形状。kpt_shape = model.kpt_shape  # pose-only# 获取模型的步幅（ stride ），并确保其值至少为 32。 确保模型的步幅符合要求，避免过小的步幅导致推理问题。stride = max(int(model.stride.max()), 32)  # model stride# 获取模型的类别名称（ names ）。 如果模型是一个包装模块（ model.module ），则从包装模块中获取类别名称；否则直接从模型中获取。 确保能够正确获取模型的类别名称，用于后续的推理和结果解析。names = model.module.names if hasattr(model, "module") else model.names  # get class names# 设置模型的数据类型。# 如果 fp16 参数为 True ，则将模型的数据类型转换为半精度浮点数（ float16 ）；否则保持为单精度浮点数（ float32 ）。 半精度浮点数可以减少模型的内存占用，并可能提高推理速度，但可能会牺牲一些精度。model.half() if fp16 else model.float()# 显式分配模型。将处理后的模型显式分配给类的 model 属性。 这样可以在类的其他方法中方便地调用模型，并进行设备转换（如 to() ）、数据类型转换（如 half() ）等操作。self.model = model  # explicitly assign for to(), cpu(), cuda(), half()# 将变量 pt 设置为 True ，表示当前处理的是 PyTorch 模型。 这个变量在后续的代码中用于判断模型的类型，并进行相应的处理。pt = True# 这段代码的主要作用是。处理 PyTorch 模型实例：将输入的 PyTorch 模型移动到指定设备，并进行融合优化。获取模型的属性：提取模型的步幅、类别名称等重要属性。设置模型的数据类型：根据 fp16 参数，将模型转换为半精度或单精度浮点数。显式分配模型：将处理后的模型分配给类的属性，以便后续使用。通过这段代码， AutoBackend 类能够正确处理输入的 PyTorch 模型，并为其后续的推理做好准备。# 这段代码处理了当输入的 weights 是一个 PyTorch 模型文件路径时的情况。# PyTorch# pt 是之前通过 _model_type 方法检测得到的布尔值，表示 weights 是否为 PyTorch 模型文件路径。 如果是 PyTorch 模型文件路径，则进入这个分支。elif pt:# 导入 attempt_load_weights 函数，该函数用于加载 PyTorch 模型权重。# def attempt_load_weights(weights, device=None, inplace=True, fuse=False): -> 用于加载模型权重，支持加载单个模型或多个模型组成的集成模型（ensemble）。如果 ensemble 中只有一个模型。返回最终的模型集合 ensemble 。 -> return ensemble[-1] / return ensemblefrom ultralytics.nn.tasks import attempt_load_weights# 调用 attempt_load_weights 函数加载 PyTorch 模型。model = attempt_load_weights(# 如果 weights 是一个列表，则取列表的第一个元素作为权重路径；否则直接使用 w （之前已经将 weights 转换为字符串路径）。# device=device ：指定将模型加载到的设备。# inplace=True  ：表示在加载模型时进行原地操作，以节省内存。# fuse=fuse ：如果 fuse 参数为 True ，则在加载模型时进行融合优化。weights if isinstance(weights, list) else w, device=device, inplace=True, fuse=fuse)# 获取模型的属性。# 检查模型是否有 kpt_shape 属性。如果有，则将其值赋给变量 kpt_shape 。 kpt_shape 通常用于姿势检测模型，表示 关键点的形状 。if hasattr(model, "kpt_shape"):kpt_shape = model.kpt_shape  # pose-only# 获取模型的 步幅 （ stride ），并确保其值至少为 32。 为了确保模型的步幅符合要求，避免过小的步幅导致推理问题。stride = max(int(model.stride.max()), 32)  # model stride# 获取模型的类别名称（ names ）。 如果模型是一个包装模块（ model.module ），则从包装模块中获取类别名称；否则直接从模型中获取。 确保能够正确获取模型的类别名称，用于后续的推理和结果解析。names = model.module.names if hasattr(model, "module") else model.names  # get class names# 如果 fp16 参数为 True ，则将模型的数据类型转换为半精度浮点数（ float16 ）；否则保持为单精度浮点数（ float32 ）。 半精度浮点数可以减少模型的内存占用，并可能提高推理速度，但可能会牺牲一些精度。model.half() if fp16 else model.float()# 显式分配模型。# 将处理后的模型显式分配给类的 model 属性。# 这样可以在类的其他方法中方便地调用模型，并进行设备转换（如 to() ）、数据类型转换（如 half() ）等操作。self.model = model  # explicitly assign for to(), cpu(), cuda(), half()# 这段代码的主要作用是。加载 PyTorch 模型：使用 attempt_load_weights 函数加载 PyTorch 模型文件，并根据 fuse 参数进行融合优化。获取模型的属性：提取模型的步幅、类别名称等重要属性。设置模型的数据类型：根据 fp16 参数，将模型转换为半精度或单精度浮点数。显式分配模型：将处理后的模型分配给类的属性，以便后续使用。通过这段代码， AutoBackend 类能够正确处理输入的 PyTorch 模型文件，并为其后续的推理做好准备。# 可忽略-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↓# TorchScriptelif jit:LOGGER.info(f"Loading {w} for TorchScript inference...")extra_files = {"config.txt": ""}  # model metadatamodel = torch.jit.load(w, _extra_files=extra_files, map_location=device)model.half() if fp16 else model.float()if extra_files["config.txt"]:  # load metadata dictmetadata = json.loads(extra_files["config.txt"], object_hook=lambda x: dict(x.items()))# ONNX OpenCV DNNelif dnn:LOGGER.info(f"Loading {w} for ONNX OpenCV DNN inference...")check_requirements("opencv-python>=4.5.4")net = cv2.dnn.readNetFromONNX(w)# ONNX Runtime and IMXelif onnx or imx:LOGGER.info(f"Loading {w} for ONNX Runtime inference...")check_requirements(("onnx", "onnxruntime-gpu" if cuda else "onnxruntime"))if IS_RASPBERRYPI or IS_JETSON:# Fix 'numpy.linalg._umath_linalg' has no attribute '_ilp64' for TF SavedModel on RPi and Jetsoncheck_requirements("numpy==1.23.5")import onnxruntimeproviders = ["CPUExecutionProvider"]if cuda and "CUDAExecutionProvider" in onnxruntime.get_available_providers():providers.insert(0, "CUDAExecutionProvider")elif cuda:  # Only log warning if CUDA was requested but unavailableLOGGER.warning("WARNING ⚠️ Failed to start ONNX Runtime with CUDA. Using CPU...")device = torch.device("cpu")cuda = FalseLOGGER.info(f"Using ONNX Runtime {providers[0]}")if onnx:session = onnxruntime.InferenceSession(w, providers=providers)else:check_requirements(["model-compression-toolkit==2.1.1", "sony-custom-layers[torch]==0.2.0", "onnxruntime-extensions"])w = next(Path(w).glob("*.onnx"))LOGGER.info(f"Loading {w} for ONNX IMX inference...")import mct_quantizers as mctqfrom sony_custom_layers.pytorch.object_detection import nms_ort  # noqasession = onnxruntime.InferenceSession(w, mctq.get_ort_session_options(), providers=["CPUExecutionProvider"])task = "detect"output_names = [x.name for x in session.get_outputs()]metadata = session.get_modelmeta().custom_metadata_mapdynamic = isinstance(session.get_outputs()[0].shape[0], str)fp16 = True if "float16" in session.get_inputs()[0].type else Falseif not dynamic:io = session.io_binding()bindings = []for output in session.get_outputs():out_fp16 = "float16" in output.typey_tensor = torch.empty(output.shape, dtype=torch.float16 if out_fp16 else torch.float32).to(device)io.bind_output(name=output.name,device_type=device.type,device_id=device.index if cuda else 0,element_type=np.float16 if out_fp16 else np.float32,shape=tuple(y_tensor.shape),buffer_ptr=y_tensor.data_ptr(),)bindings.append(y_tensor)# OpenVINOelif xml:LOGGER.info(f"Loading {w} for OpenVINO inference...")check_requirements("openvino>=2024.0.0")import openvino as ovcore = ov.Core()w = Path(w)if not w.is_file():  # if not *.xmlw = next(w.glob("*.xml"))  # get *.xml file from *_openvino_model dirov_model = core.read_model(model=str(w), weights=w.with_suffix(".bin"))if ov_model.get_parameters()[0].get_layout().empty:ov_model.get_parameters()[0].set_layout(ov.Layout("NCHW"))# OpenVINO inference modes are 'LATENCY', 'THROUGHPUT' (not recommended), or 'CUMULATIVE_THROUGHPUT'inference_mode = "CUMULATIVE_THROUGHPUT" if batch > 1 else "LATENCY"LOGGER.info(f"Using OpenVINO {inference_mode} mode for batch={batch} inference...")ov_compiled_model = core.compile_model(ov_model,device_name="AUTO",  # AUTO selects best available device, do not modifyconfig={"PERFORMANCE_HINT": inference_mode},)input_name = ov_compiled_model.input().get_any_name()metadata = w.parent / "metadata.yaml"# TensorRTelif engine:LOGGER.info(f"Loading {w} for TensorRT inference...")if IS_JETSON and PYTHON_VERSION <= "3.8.0":# fix error: `np.bool` was a deprecated alias for the builtin `bool` for JetPack 4 with Python <= 3.8.0check_requirements("numpy==1.23.5")try:import tensorrt as trt  # noqa https://developer.nvidia.com/nvidia-tensorrt-downloadexcept ImportError:if LINUX:check_requirements("tensorrt>7.0.0,!=10.1.0")import tensorrt as trt  # noqacheck_version(trt.__version__, ">=7.0.0", hard=True)check_version(trt.__version__, "!=10.1.0", msg="https://github.com/ultralytics/ultralytics/pull/14239")if device.type == "cpu":device = torch.device("cuda:0")Binding = namedtuple("Binding", ("name", "dtype", "shape", "data", "ptr"))logger = trt.Logger(trt.Logger.INFO)# Read filewith open(w, "rb") as f, trt.Runtime(logger) as runtime:try:meta_len = int.from_bytes(f.read(4), byteorder="little")  # read metadata lengthmetadata = json.loads(f.read(meta_len).decode("utf-8"))  # read metadataexcept UnicodeDecodeError:f.seek(0)  # engine file may lack embedded Ultralytics metadatamodel = runtime.deserialize_cuda_engine(f.read())  # read engine# Model contexttry:context = model.create_execution_context()except Exception as e:  # model is NoneLOGGER.error(f"ERROR: TensorRT model exported with a different version than {trt.__version__}\n")raise ebindings = OrderedDict()output_names = []fp16 = False  # default updated belowdynamic = Falseis_trt10 = not hasattr(model, "num_bindings")num = range(model.num_io_tensors) if is_trt10 else range(model.num_bindings)for i in num:if is_trt10:name = model.get_tensor_name(i)dtype = trt.nptype(model.get_tensor_dtype(name))is_input = model.get_tensor_mode(name) == trt.TensorIOMode.INPUTif is_input:if -1 in tuple(model.get_tensor_shape(name)):dynamic = Truecontext.set_input_shape(name, tuple(model.get_tensor_profile_shape(name, 0)[1]))if dtype == np.float16:fp16 = Trueelse:output_names.append(name)shape = tuple(context.get_tensor_shape(name))else:  # TensorRT < 10.0name = model.get_binding_name(i)dtype = trt.nptype(model.get_binding_dtype(i))is_input = model.binding_is_input(i)if model.binding_is_input(i):if -1 in tuple(model.get_binding_shape(i)):  # dynamicdynamic = Truecontext.set_binding_shape(i, tuple(model.get_profile_shape(0, i)[1]))if dtype == np.float16:fp16 = Trueelse:output_names.append(name)shape = tuple(context.get_binding_shape(i))im = torch.from_numpy(np.empty(shape, dtype=dtype)).to(device)bindings[name] = Binding(name, dtype, shape, im, int(im.data_ptr()))binding_addrs = OrderedDict((n, d.ptr) for n, d in bindings.items())batch_size = bindings["images"].shape[0]  # if dynamic, this is instead max batch size# CoreMLelif coreml:LOGGER.info(f"Loading {w} for CoreML inference...")import coremltools as ctmodel = ct.models.MLModel(w)metadata = dict(model.user_defined_metadata)# TF SavedModelelif saved_model:LOGGER.info(f"Loading {w} for TensorFlow SavedModel inference...")import tensorflow as tfkeras = False  # assume TF1 saved_modelmodel = tf.keras.models.load_model(w) if keras else tf.saved_model.load(w)metadata = Path(w) / "metadata.yaml"# TF GraphDefelif pb:  # https://www.tensorflow.org/guide/migrate#a_graphpb_or_graphpbtxtLOGGER.info(f"Loading {w} for TensorFlow GraphDef inference...")import tensorflow as tffrom ultralytics.engine.exporter import gd_outputsdef wrap_frozen_graph(gd, inputs, outputs):"""Wrap frozen graphs for deployment."""x = tf.compat.v1.wrap_function(lambda: tf.compat.v1.import_graph_def(gd, name=""), [])  # wrappedge = x.graph.as_graph_elementreturn x.prune(tf.nest.map_structure(ge, inputs), tf.nest.map_structure(ge, outputs))gd = tf.Graph().as_graph_def()  # TF GraphDefwith open(w, "rb") as f:gd.ParseFromString(f.read())frozen_func = wrap_frozen_graph(gd, inputs="x:0", outputs=gd_outputs(gd))try:  # find metadata in SavedModel alongside GraphDefmetadata = next(Path(w).resolve().parent.rglob(f"{Path(w).stem}_saved_model*/metadata.yaml"))except StopIteration:pass# TFLite or TFLite Edge TPUelif tflite or edgetpu:  # https://www.tensorflow.org/lite/guide/python#install_tensorflow_lite_for_pythontry:  # https://coral.ai/docs/edgetpu/tflite-python/#update-existing-tf-lite-code-for-the-edge-tpufrom tflite_runtime.interpreter import Interpreter, load_delegateexcept ImportError:import tensorflow as tfInterpreter, load_delegate = tf.lite.Interpreter, tf.lite.experimental.load_delegateif edgetpu:  # TF Edge TPU https://coral.ai/software/#edgetpu-runtimedevice = device[3:] if str(device).startswith("tpu") else ":0"LOGGER.info(f"Loading {w} on device {device[1:]} for TensorFlow Lite Edge TPU inference...")delegate = {"Linux": "libedgetpu.so.1", "Darwin": "libedgetpu.1.dylib", "Windows": "edgetpu.dll"}[platform.system()]interpreter = Interpreter(model_path=w,experimental_delegates=[load_delegate(delegate, options={"device": device})],)device = "cpu"  # Required, otherwise PyTorch will try to use the wrong deviceelse:  # TFLiteLOGGER.info(f"Loading {w} for TensorFlow Lite inference...")interpreter = Interpreter(model_path=w)  # load TFLite modelinterpreter.allocate_tensors()  # allocateinput_details = interpreter.get_input_details()  # inputsoutput_details = interpreter.get_output_details()  # outputs# Load metadatatry:with zipfile.ZipFile(w, "r") as model:meta_file = model.namelist()[0]metadata = ast.literal_eval(model.read(meta_file).decode("utf-8"))except zipfile.BadZipFile:pass# TF.jselif tfjs:raise NotImplementedError("YOLOv8 TF.js inference is not currently supported.")# PaddlePaddleelif paddle:LOGGER.info(f"Loading {w} for PaddlePaddle inference...")check_requirements("paddlepaddle-gpu" if cuda else "paddlepaddle")import paddle.inference as pdi  # noqaw = Path(w)if not w.is_file():  # if not *.pdmodelw = next(w.rglob("*.pdmodel"))  # get *.pdmodel file from *_paddle_model dirconfig = pdi.Config(str(w), str(w.with_suffix(".pdiparams")))if cuda:config.enable_use_gpu(memory_pool_init_size_mb=2048, device_id=0)predictor = pdi.create_predictor(config)input_handle = predictor.get_input_handle(predictor.get_input_names()[0])output_names = predictor.get_output_names()metadata = w.parents[1] / "metadata.yaml"# MNNelif mnn:LOGGER.info(f"Loading {w} for MNN inference...")check_requirements("MNN")  # requires MNNimport osimport MNNconfig = {"precision": "low", "backend": "CPU", "numThread": (os.cpu_count() + 1) // 2}rt = MNN.nn.create_runtime_manager((config,))net = MNN.nn.load_module_from_file(w, [], [], runtime_manager=rt, rearrange=True)def torch_to_mnn(x):return MNN.expr.const(x.data_ptr(), x.shape)metadata = json.loads(net.get_info()["bizCode"])# NCNNelif ncnn:LOGGER.info(f"Loading {w} for NCNN inference...")check_requirements("git+https://github.com/Tencent/ncnn.git" if ARM64 else "ncnn")  # requires NCNNimport ncnn as pyncnnnet = pyncnn.Net()net.opt.use_vulkan_compute = cudaw = Path(w)if not w.is_file():  # if not *.paramw = next(w.glob("*.param"))  # get *.param file from *_ncnn_model dirnet.load_param(str(w))net.load_model(str(w.with_suffix(".bin")))metadata = w.parent / "metadata.yaml"# NVIDIA Triton Inference Serverelif triton:check_requirements("tritonclient[all]")from ultralytics.utils.triton import TritonRemoteModelmodel = TritonRemoteModel(w)metadata = model.metadata# RKNNelif rknn:if not is_rockchip():raise OSError("RKNN inference is only supported on Rockchip devices.")LOGGER.info(f"Loading {w} for RKNN inference...")check_requirements("rknn-toolkit-lite2")from rknnlite.api import RKNNLitew = Path(w)if not w.is_file():  # if not *.rknnw = next(w.rglob("*.rknn"))  # get *.rknn file from *_rknn_model dirrknn_model = RKNNLite()rknn_model.load_rknn(w)rknn_model.init_runtime()metadata = Path(w).parent / "metadata.yaml"
# 可忽略-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↑# 这段代码处理了当输入的模型格式不被支持时的情况。# Any other format (unsupported)# 检查是否为不支持的格式。如果前面的代码中没有匹配到任何支持的模型格式（如 PyTorch、ONNX、TensorRT 等），则进入这个分支。else:# 导入 export_formats 函数，该函数返回一个字典，包含 Ultralytics 支持的所有模型格式及其相关信息。# def export_formats(): -> 用于生成一个字典，描述了 Ultralytics YOLO 模型支持的导出格式及其相关属性。返回一个字典，其中键为 字段名 ，值为 字段值的列表 。 -> return dict(zip(["Format", "Argument", "Suffix", "CPU", "GPU", "Arguments"], zip(*x)))from ultralytics.engine.exporter import export_formats# 抛出一个 TypeError 异常，提示用户输入的模型格式不被支持。# 异常消息中包含了 ：# 输入的模型路径 w 。# Ultralytics 支持的模型格式列表，通过调用 export_formats()['Format'] 获取。raise TypeError(f"model='{w}' is not a supported model format. Ultralytics supports: {export_formats()['Format']}\n"    # model='{w}' 不是受支持的模型格式。Ultralytics 支持：{export_formats()['Format']}。f"See https://docs.ultralytics.com/modes/predict for help."    # 请参阅https://docs.ultralytics.com/modes/predict 寻求帮助。)# 这段代码的主要作用是。检查是否为不支持的格式：如果输入的模型格式不被支持，则进入这个分支。导入 export_formats 函数：获取 Ultralytics 支持的所有模型格式。抛出异常：提示用户输入的模型格式不被支持，并列出支持的格式。通过这段代码， AutoBackend 类能够明确地告知用户，输入的模型格式不被支持，并提供支持的格式列表，帮助用户解决问题。# 这段代码的目的是加载和处理模型的外部元数据（通常存储在 YAML 文件中），并根据元数据更新一些关键的模型属性。# Load external metadata YAML    加载外部元数据 YAML 。# 检查元数据文件是否存在。# 检查 metadata 是否为字符串或 Path 对象，并且对应的文件是否存在。if isinstance(metadata, (str, Path)) and Path(metadata).exists():# 如果文件存在，则使用 yaml_load 函数加载 YAML 文件内容到 metadata 变量中。 yaml_load 是一个自定义函数，用于加载 YAML 文件并将其内容解析为 Python 字典。# def yaml_load(file="data.yaml", append_filename=False): -> 用于加载和解析YAML文件。它还提供了一些额外的功能，例如清理文件内容中的特殊字符，并可以选择将文件名添加到解析后的数据中。返回解析后的YAML数据，可能包含文件名（如果 append_filename 为 True ）。 -> return datametadata = yaml_load(metadata)# 处理元数据。# 如果 metadata 是一个字典。if metadata and isinstance(metadata, dict):# 则遍历其键值对。for k, v in metadata.items():# 如果键是 stride 或 batch ，则将对应的值转换为整数。if k in {"stride", "batch"}:metadata[k] = int(v)# 如果键是 imgsz 、 names 、 kpt_shape 或 args ，并且值是字符串，则使用 eval 将字符串转换为实际的 Python 对象（如列表或字典）。elif k in {"imgsz", "names", "kpt_shape", "args"} and isinstance(v, str):metadata[k] = eval(v)# 更新模型属性。从元数据中提取并更新模型的属性。# 模型的步幅。stride = metadata["stride"]# 模型的任务类型（如检测、分割等）。task = metadata["task"]# 模型的批量大小。batch = metadata["batch"]# 模型的输入图像大小。imgsz = metadata["imgsz"]# 模型的类别名称。names = metadata["names"]# 模型的关键点形状（如果存在）。kpt_shape = metadata.get("kpt_shape")# 模型是否为端到端模型（通过 args 字典中的 nms 键值判断）。end2end = metadata.get("args", {}).get("nms", False)# 如果元数据不存在。# 如果元数据文件不存在，并且模型不是 PyTorch、Triton 或 PyTorch 模块，则记录一个警告日志，提示用户未找到元数据。 这里假设 PyTorch、Triton 和 PyTorch 模块不需要外部元数据文件。elif not (pt or triton or nn_module):LOGGER.warning(f"WARNING ⚠️ Metadata not found for 'model={weights}'")    # 警告⚠️未找到“model={weights}”的元数据。# 这段代码的主要作用是。加载元数据文件：如果存在元数据文件，则加载并解析其内容。处理元数据：将元数据中的某些值转换为适当的类型（如整数或 Python 对象）。更新模型属性：根据元数据更新模型的步幅、任务类型、批量大小、输入图像大小、类别名称等属性。记录警告：如果未找到元数据文件且模型不是 PyTorch、Triton 或 PyTorch 模块，则记录警告。通过这段代码， AutoBackend 类能够根据外部元数据文件动态更新模型的属性，从而确保模型的正确性和灵活性。# 这段代码的目的是确保模型的类别名称（ names ）是有效的，并禁用模型的梯度计算，最后将所有局部变量分配给类的属性。# Check names# 检查 names 是否在局部变量中。如果不存在，说明之前没有成功加载或定义类别名称。if "names" not in locals():  # names missing# 如果 names 缺失，则调用 default_class_names(data) 函数，使用默认的类别名称。 data 参数通常是一个路径，指向包含类别名称的 data.yaml 文件。# def default_class_names(data=None): -> 用于从输入的 YAML 文件中提取类别名称，或者在无法提取时返回默认的类别名称。 -> return yaml_load(check_yaml(data))["names"] / return {i: f"class{i}" for i in range(999)}  # return default if above errorsnames = default_class_names(data)# 调用 check_class_names(names) 函数，对类别名称进行验证和处理。 这个函数会确保类别名称是有效的，并将其转换为字典格式（如果需要）。例如，如果输入是一个列表，它会将其转换为字典，键为索引，值为类别名称。# def check_class_names(names): -> 用于检查和处理类别名称（ names ）。返回处理后的类别名称字典。 -> return namesnames = check_class_names(names)# Disable gradients    禁用梯度计算。# 如果模型是 PyTorch 模型（ pt 为 True ）。if pt:# 则遍历模型的所有参数。for p in model.parameters():# 并将它们的 requires_grad 属性设置为 False 。# 是为了禁用梯度计算，因为在推理阶段不需要计算梯度，这可以节省内存并提高推理速度。p.requires_grad = False# 将局部变量分配给类的属性。# 使用 self.__dict__.update(locals()) 将所有局部变量分配给类的属性。 这样可以在类的其他方法中方便地访问这些变量，而不需要显式地将它们定义为类的属性。self.__dict__.update(locals())  # assign all variables to self# 这段代码的主要作用是。确保类别名称存在：如果类别名称缺失，则使用默认的类别名称。验证和处理类别名称：通过 check_class_names 函数确保类别名称是有效的，并将其转换为合适的格式。禁用梯度计算：在推理阶段禁用模型的梯度计算，以节省内存并提高性能。将局部变量分配给类的属性：将所有局部变量分配给类的属性，以便在类的其他方法中使用。通过这段代码， AutoBackend 类能够确保模型的类别名称是有效的，并为推理阶段做好准备。# AutoBackend 类的 __init__ 方法的主要功能和特点如下。动态后端选择：根据模型文件的格式，动态选择合适的推理后端。支持多种格式：支持 PyTorch、ONNX、OpenVINO、TensorRT、CoreML、TensorFlow、TFLite、PaddlePaddle、MNN、NCNN、RKNN 等多种模型格式。设备兼容性：支持 CPU 和 GPU 设备，自动检测并切换。推理优化：支持半精度推理（FP16）、动态批量大小、模型融合等优化。类别名称管理：提供默认类别名称，并支持自定义类别名称。通过 AutoBackend ，用户可以轻松地在不同平台上部署和运行 Ultralytics YOLO 模型，而无需关心底层的推理引擎细节。# 这段代码定义了 AutoBackend 类的 forward 方法，用于在不同后端（如 PyTorch、ONNX、TensorRT 等）上运行模型推理。# 定义了 forward 方法，接受以下参数 ：# 1.im ：输入图像张量。# 2.augment ：是否在推理时进行数据增强，默认为 False 。# 3.visualize ：是否可视化输出预测，默认为 False 。# 4.embed ：可选的特征向量/嵌入列表。# 返回值是一个元组，包含原始输出张量和处理后的输出（如果 visualize=True ）。def forward(self, im, augment=False, visualize=False, embed=None):# 在 YOLOv8 MultiBackend 模型上运行推理。"""Runs inference on the YOLOv8 MultiBackend model.Args:im (torch.Tensor): The image tensor to perform inference on.augment (bool): whether to perform data augmentation during inference, defaults to Falsevisualize (bool): whether to visualize the output predictions, defaults to Falseembed (list, optional): A list of feature vectors/embeddings to return.Returns:(tuple): Tuple containing the raw output tensor, and processed output for visualization (if visualize=True)"""# 这段代码是 AutoBackend 类的 forward 方法的一部分，主要负责处理输入图像张量 im ，并根据模型的配置和后端类型进行推理。# 获取输入图像张量 im 的形状，分别表示 ：# b ：批量大小（batch size）。# ch ：通道数（channels）。# h ：图像高度（height）。# w ：图像宽度（width）。b, ch, h, w = im.shape  # batch, channel, height, width# 处理数据类型。# 检查是否启用了半精度浮点数（FP16）推理（ self.fp16 ）。 如果启用了 FP16 且输入张量的数据类型不是 torch.float16 ，则将输入张量转换为半精度浮点数（ torch.float16 ）。 这一步可以减少内存占用并提高推理速度，但可能会牺牲一些精度。if self.fp16 and im.dtype != torch.float16:im = im.half()  # to FP16# 处理数据格式。# 检查是否需要将输入张量从 PyTorch 的 BCHW 格式转换为 NHWC 格式（ self.nhwc ）。 如果需要，则调用 permute 方法重新排列张量的维度顺序，将通道维度从第一个位置移动到最后一个位置。 这一步是为了适配某些后端（如 OpenCV DNN、TensorFlow Lite 等）对输入数据格式的要求。if self.nhwc:im = im.permute(0, 2, 3, 1)  # torch BCHW to numpy BHWC shape(1,320,192,3)# PyTorch    PyTorch 模型推理。# 检查是否是 PyTorch 模型（ self.pt ）或 PyTorch 模块（ self.nn_module ）。if self.pt or self.nn_module:# 如果是，则调用模型的 forward 方法进行推理。# im ：输入图像张量。# augment ：是否在推理时进行数据增强。# visualize ：是否可视化输出预测。# embed ：可选的特征向量/嵌入列表。# 推理结果存储在变量 y 中。y = self.model(im, augment=augment, visualize=visualize, embed=embed)# 这段代码的主要作用是。获取输入图像的形状：提取批量大小、通道数、高度和宽度。处理数据类型：根据配置将输入张量转换为半精度浮点数（FP16）。处理数据格式：根据需要将输入张量从 BCHW 格式转换为 NHWC 格式。进行 PyTorch 模型推理：调用 PyTorch 模型的 forward 方法进行推理，并返回结果。通过这些步骤， AutoBackend 类能够确保输入数据符合模型的要求，并在 PyTorch 模型上进行高效的推理。# 可忽略-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↓# TorchScriptelif self.jit:y = self.model(im)# ONNX OpenCV DNNelif self.dnn:im = im.cpu().numpy()  # torch to numpyself.net.setInput(im)y = self.net.forward()# ONNX Runtimeelif self.onnx or self.imx:if self.dynamic:im = im.cpu().numpy()  # torch to numpyy = self.session.run(self.output_names, {self.session.get_inputs()[0].name: im})else:if not self.cuda:im = im.cpu()self.io.bind_input(name="images",device_type=im.device.type,device_id=im.device.index if im.device.type == "cuda" else 0,element_type=np.float16 if self.fp16 else np.float32,shape=tuple(im.shape),buffer_ptr=im.data_ptr(),)self.session.run_with_iobinding(self.io)y = self.bindingsif self.imx:# boxes, conf, clsy = np.concatenate([y[0], y[1][:, :, None], y[2][:, :, None]], axis=-1)# OpenVINOelif self.xml:im = im.cpu().numpy()  # FP32if self.inference_mode in {"THROUGHPUT", "CUMULATIVE_THROUGHPUT"}:  # optimized for larger batch-sizesn = im.shape[0]  # number of images in batchresults = [None] * n  # preallocate list with None to match the number of imagesdef callback(request, userdata):"""Places result in preallocated list using userdata index."""results[userdata] = request.results# Create AsyncInferQueue, set the callback and start asynchronous inference for each input imageasync_queue = self.ov.runtime.AsyncInferQueue(self.ov_compiled_model)async_queue.set_callback(callback)for i in range(n):# Start async inference with userdata=i to specify the position in results listasync_queue.start_async(inputs={self.input_name: im[i : i + 1]}, userdata=i)  # keep image as BCHWasync_queue.wait_all()  # wait for all inference requests to completey = np.concatenate([list(r.values())[0] for r in results])else:  # inference_mode = "LATENCY", optimized for fastest first result at batch-size 1y = list(self.ov_compiled_model(im).values())# TensorRTelif self.engine:if self.dynamic and im.shape != self.bindings["images"].shape:if self.is_trt10:self.context.set_input_shape("images", im.shape)self.bindings["images"] = self.bindings["images"]._replace(shape=im.shape)for name in self.output_names:self.bindings[name].data.resize_(tuple(self.context.get_tensor_shape(name)))else:i = self.model.get_binding_index("images")self.context.set_binding_shape(i, im.shape)self.bindings["images"] = self.bindings["images"]._replace(shape=im.shape)for name in self.output_names:i = self.model.get_binding_index(name)self.bindings[name].data.resize_(tuple(self.context.get_binding_shape(i)))s = self.bindings["images"].shapeassert im.shape == s, f"input size {im.shape} {'>' if self.dynamic else 'not equal to'} max model size {s}"self.binding_addrs["images"] = int(im.data_ptr())self.context.execute_v2(list(self.binding_addrs.values()))y = [self.bindings[x].data for x in sorted(self.output_names)]# CoreMLelif self.coreml:im = im[0].cpu().numpy()im_pil = Image.fromarray((im * 255).astype("uint8"))# im = im.resize((192, 320), Image.BILINEAR)y = self.model.predict({"image": im_pil})  # coordinates are xywh normalizedif "confidence" in y:raise TypeError("Ultralytics only supports inference of non-pipelined CoreML models exported with "f"'nms=False', but 'model={w}' has an NMS pipeline created by an 'nms=True' export.")# TODO: CoreML NMS inference handling# from ultralytics.utils.ops import xywh2xyxy# box = xywh2xyxy(y['coordinates'] * [[w, h, w, h]])  # xyxy pixels# conf, cls = y['confidence'].max(1), y['confidence'].argmax(1).astype(np.float32)# y = np.concatenate((box, conf.reshape(-1, 1), cls.reshape(-1, 1)), 1)y = list(y.values())if len(y) == 2 and len(y[1].shape) != 4:  # segmentation modely = list(reversed(y))  # reversed for segmentation models (pred, proto)# PaddlePaddleelif self.paddle:im = im.cpu().numpy().astype(np.float32)self.input_handle.copy_from_cpu(im)self.predictor.run()y = [self.predictor.get_output_handle(x).copy_to_cpu() for x in self.output_names]# MNNelif self.mnn:input_var = self.torch_to_mnn(im)output_var = self.net.onForward([input_var])y = [x.read() for x in output_var]# NCNNelif self.ncnn:mat_in = self.pyncnn.Mat(im[0].cpu().numpy())with self.net.create_extractor() as ex:ex.input(self.net.input_names()[0], mat_in)# WARNING: 'output_names' sorted as a temporary fix for https://github.com/pnnx/pnnx/issues/130y = [np.array(ex.extract(x)[1])[None] for x in sorted(self.net.output_names())]# NVIDIA Triton Inference Serverelif self.triton:im = im.cpu().numpy()  # torch to numpyy = self.model(im)# RKNNelif self.rknn:im = (im.cpu().numpy() * 255).astype("uint8")im = im if isinstance(im, (list, tuple)) else [im]y = self.rknn_model.inference(inputs=im)# TensorFlow (SavedModel, GraphDef, Lite, Edge TPU)else:im = im.cpu().numpy()if self.saved_model:  # SavedModely = self.model(im, training=False) if self.keras else self.model(im)if not isinstance(y, list):y = [y]elif self.pb:  # GraphDefy = self.frozen_func(x=self.tf.constant(im))else:  # Lite or Edge TPUdetails = self.input_details[0]is_int = details["dtype"] in {np.int8, np.int16}  # is TFLite quantized int8 or int16 modelif is_int:scale, zero_point = details["quantization"]im = (im / scale + zero_point).astype(details["dtype"])  # de-scaleself.interpreter.set_tensor(details["index"], im)self.interpreter.invoke()y = []for output in self.output_details:x = self.interpreter.get_tensor(output["index"])if is_int:scale, zero_point = output["quantization"]x = (x.astype(np.float32) - zero_point) * scale  # re-scaleif x.ndim == 3:  # if task is not classification, excluding masks (ndim=4) as well# Denormalize xywh by image size. See https://github.com/ultralytics/ultralytics/pull/1695# xywh are normalized in TFLite/EdgeTPU to mitigate quantization error of integer modelsif x.shape[-1] == 6 or self.end2end:  # end-to-end modelx[:, :, [0, 2]] *= wx[:, :, [1, 3]] *= hif self.task == "pose":x[:, :, 6::3] *= wx[:, :, 7::3] *= helse:x[:, [0, 2]] *= wx[:, [1, 3]] *= hif self.task == "pose":x[:, 5::3] *= wx[:, 6::3] *= hy.append(x)# TF segment fixes: export is reversed vs ONNX export and protos are transposedif len(y) == 2:  # segment with (det, proto) output order reversedif len(y[1].shape) != 4:y = list(reversed(y))  # should be y = (1, 116, 8400), (1, 160, 160, 32)if y[1].shape[-1] == 6:  # end-to-end modely = [y[1]]else:y[1] = np.transpose(y[1], (0, 3, 1, 2))  # should be y = (1, 116, 8400), (1, 32, 160, 160)y = [x if isinstance(x, np.ndarray) else x.numpy() for x in y]
# 可忽略-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↑# 这段代码是 AutoBackend 类的 forward 方法的一部分，主要负责处理模型的输出结果，并根据需要将其转换为 PyTorch 张量。# 这是一段被注释掉的调试代码，用于打印输出结果 y 的类型和形状。 如果 y 是一个列表或元组，打印其 类型 和 长度 ；否则打印其类型和形状。 这段代码可以帮助开发者在调试阶段了解模型输出的具体结构。# for x in y:#     print(type(x), len(x)) if isinstance(x, (list, tuple)) else print(type(x), x.shape)  # debug shapes# 处理输出结果。# 检查模型的输出 y 是否是一个列表或元组。if isinstance(y, (list, tuple)):# 如果类别名称未定义（ len(self.names) == 999 ），并且任务是分割（ self.task == "segment" ）或输出结果包含两个元素（ len(y) == 2 ）。if len(self.names) == 999 and (self.task == "segment" or len(y) == 2):  # segments and names not defined# 则动态生成类别名称。# 计算类别数量 nc 。nc = y[0].shape[1] - y[1].shape[1] - 4  # y = (1, 32, 160, 160), (1, 116, 8400)# 并生成一个字典，键为类别索引，值为格式化的类别名称（如 "class0" 、 "class1" 等）。self.names = {i: f"class{i}" for i in range(nc)}# 返回单个或多个输出结果。# 如果输出结果只有一个元素（ len(y) == 1 ），则将第一个元素转换为 PyTorch 张量并返回。 如果输出结果有多个元素，则将每个元素分别转换为 PyTorch 张量，并返回一个列表。return self.from_numpy(y[0]) if len(y) == 1 else [self.from_numpy(x) for x in y]# 处理单个输出结果。# 如果输出结果不是列表或元组。else:# 则直接将其转换为 PyTorch 张量并返回。return self.from_numpy(y)# 这段代码的主要作用是。调试输出：提供了一种调试方式，用于打印输出结果的类型和形状。处理输出结果：如果输出结果是列表或元组，根据任务类型和输出结构动态生成类别名称。将每个输出结果转换为 PyTorch 张量。返回结果：根据输出结果的结构，返回单个张量或张量列表。通过这些步骤， AutoBackend 类能够灵活地处理不同模型的输出结果，并将其转换为统一的 PyTorch 张量格式，方便后续的处理和使用。# AutoBackend 类的 forward 方法是一个多功能的推理接口，能够根据不同的后端（如 PyTorch、ONNX、TensorRT、OpenVINO 等）动态选择合适的推理引擎，并处理输入数据的格式转换（如数据类型、内存布局等）。它支持多种推理模式，包括数据增强、可视化输出等，并能够根据模型的输出结构动态生成类别名称。最终，该方法将模型的输出结果统一转换为 PyTorch 张量格式，以便于后续的处理和分析。这一设计使得 AutoBackend 类能够无缝适配多种模型格式和推理需求，极大地提高了模型部署的灵活性和效率。# 这段代码定义了 AutoBackend 类的 from_numpy 方法，用于将 NumPy 数组转换为 PyTorch 张量，并将其移动到指定的设备上。# 定义了一个名为 from_numpy 的方法，该方法接受一个参数。# 1.x ：需要转换的数据。def from_numpy(self, x):# 将 numpy 数组转换为张量。"""Convert a numpy array to a tensor.Args:x (np.ndarray): The array to be converted.Returns:(torch.Tensor): The converted tensor"""# 使用条件表达式检查 x 是否为 NumPy 数组（ np.ndarray ）。# 如果 x 是 NumPy 数组，则使用 torch.tensor(x) 将其转换为 PyTorch 张量。# 使用 .to(self.device) 将张量移动到指定的设备（如 CPU 或 GPU）。# 如果 x 不是 NumPy 数组，则直接返回 x ，不做任何转换。return torch.tensor(x).to(self.device) if isinstance(x, np.ndarray) else x# 这段代码的主要作用是。检查输入类型：判断输入数据是否为 NumPy 数组。转换为 PyTorch 张量：如果输入是 NumPy 数组，则将其转换为 PyTorch 张量。移动到指定设备：将转换后的张量移动到指定的设备（如 CPU 或 GPU）。返回结果：返回转换后的张量或原始数据（如果输入不是 NumPy 数组）。通过这个方法， AutoBackend 类能够灵活地处理不同类型的输入数据，并确保数据在正确的设备上进行后续处理。这使得模型的推理过程更加高效和灵活。# 这段代码定义了 AutoBackend 类的 warmup 方法，用于通过运行一次前向传播来预热模型，确保推理性能稳定。# 定义了一个名为 warmup 的方法，接受一个参数。# 1.imgsz ：预热时使用的输入张量的形状，默认为 (1, 3, 640, 640) ，即一个批量大小为 1、通道数为 3、高度和宽度均为 640 的张量。def warmup(self, imgsz=(1, 3, 640, 640)):# 通过使用虚拟输入运行一次前向传递来预热模型。"""Warm up the model by running one forward pass with a dummy input.Args:imgsz (tuple): The shape of the dummy input tensor in the format (batch_size, channels, height, width)"""# 导入 torchvision 模块。这里使用了 # noqa 注释，以避免某些代码检查工具（如 flake8 ）记录导入时间。import torchvision  # noqa (import here so torchvision import time not recorded in postprocess time)# 定义了一个元组 warmup_types ，包含所有支持预热的模型类型标志（如 PyTorch、TorchScript、ONNX、TensorRT 等）。warmup_types = self.pt, self.jit, self.onnx, self.engine, self.saved_model, self.pb, self.triton, self.nn_module# 检查是否支持预热（即 warmup_types 中至少有一个为 True ）。 如果模型运行在 GPU 上（ self.device.type != "cpu" ）或使用 Triton 后端（ self.triton ），则进行预热。if any(warmup_types) and (self.device.type != "cpu" or self.triton):# 创建一个空的张量 im ，其形状由 imgsz 指定。# 如果启用了半精度浮点数（ self.fp16 ），则将张量的数据类型设置为 torch.half ；否则设置为 torch.float 。# 将张量移动到指定的设备（ self.device ）。im = torch.empty(*imgsz, dtype=torch.half if self.fp16 else torch.float, device=self.device)  # input# 如果模型是 TorchScript 模型（ self.jit ），则运行两次前向传播以预热；否则运行一次。for _ in range(2 if self.jit else 1):# 调用 self.forward(im) 方法进行前向传播，确保模型在后续推理中能够稳定运行。self.forward(im)  # warmup# 这段代码的主要作用是。检查是否支持预热：确保模型类型支持预热，并且运行在 GPU 上或使用 Triton 后端。创建预热输入张量：根据指定的形状和数据类型创建一个空的输入张量，并将其移动到指定设备。运行前向传播：通过运行一次或两次前向传播来预热模型，确保模型在后续推理中能够稳定运行。通过预热，可以初始化模型的各个组件，减少首次推理时的延迟，提高推理性能。# 这段代码定义了 AutoBackend 类的静态方法 _model_type ，用于根据模型文件的路径或名称检测模型的格式。@staticmethod# 定义了一个静态方法 _model_type ，接受一个参数。# 1.p ：模型文件的路径或名称，默认值为 "path/to/model.pt" 。def _model_type(p="path/to/model.pt"):# 获取模型文件的路径并返回模型类型。可能的类型有 pt、jit、onnx、xml、engine、coreml、saved_model、pb、tflite、edgetpu、tfjs、ncnn 或 paddle。"""Takes a path to a model file and returns the model type. Possibles types are pt, jit, onnx, xml, engine, coreml,saved_model, pb, tflite, edgetpu, tfjs, ncnn or paddle.Args:p: path to the model file. Defaults to path/to/model.ptExamples:>>> model = AutoBackend(weights="path/to/model.onnx")>>> model_type = model._model_type()  # returns "onnx""""# 导入 export_formats 函数，该函数返回一个字典，包含 Ultralytics 支持的所有模型格式及其相关信息。# def export_formats(): -> 用于生成一个字典，描述了 Ultralytics YOLO 模型支持的导出格式及其相关属性。返回一个字典，其中键为 字段名 ，值为 字段值的列表 。 -> return dict(zip(["Format", "Argument", "Suffix", "CPU", "GPU", "Arguments"], zip(*x)))from ultralytics.engine.exporter import export_formats# 从 export_formats 函数返回的字典中提取 Suffix 键对应的值，即支持的模型文件后缀列表。sf = export_formats()["Suffix"]  # export suffixes# 检查输入 p 是否为 URL 或字符串。if not is_url(p) and not isinstance(p, str):# 如果 p 不是 URL 且不是字符串，则调用 check_suffix 函数检查 p 的后缀是否在支持的后缀列表 sf 中。# def check_suffix(file="yolo11n.pt", suffix=".pt", msg=""): -> 用于检查文件的后缀是否符合指定的允许后缀列表。如果文件的后缀不符合要求，函数会抛出一个 AssertionError 。check_suffix(p, sf)  # checks# 使用 Path 对象提取输入路径 p 的文件名部分。name = Path(p).name# 遍历支持的后缀列表 sf ，检查每个后缀是否出现在文件名 name 中，生成一个布尔值列表 types 。types = [s in name for s in sf]# 检查文件名是否以 .mlmodel 结尾，如果是，则将 types 列表的第 6 个元素（索引为 5）设置为 True ，以支持旧版 Apple CoreML 格式。types[5] |= name.endswith(".mlmodel")  # retain support for older Apple CoreML *.mlmodel formats# 如果文件名同时包含 .tflite 和 .edgetpu ，则将 types 列表的第 9 个元素（索引为 8）设置为 False ，以确保 .tflite 和 .edgetpu 不同时为 True 。types[8] &= not types[9]  # tflite &= not edgetpu# 如果 types 列表中至少有一个 True ，则将 triton 设置为 False 。if any(types):triton = False# 否则，解析输入路径 p 为 URL。else:from urllib.parse import urlsplit# urlsplit(urlstring, scheme='', allow_fragments=True)# urlsplit() 函数是 Python 标准库 urllib.parse 模块中的一个函数，它用于将一个 URL 分解成几个组件。# 参数说明 ：# urlstring ：要分解的 URL 字符串。# scheme ：可选参数，如果提供了这个参数， urlsplit() 会尝试将 URL 按照提供的 scheme 来解析。默认为空字符串，表示不指定方案。# allow_fragments ：可选参数，布尔值，指定是否允许 URL 中包含片段（fragment）。默认为 True 。# 返回值 ：# urlsplit() 函数返回一个 ParseResult 对象，该对象包含以下属性 ：# scheme ：URL 的协议部分，例如 "http" 或 "https"。# netloc ：网络位置部分，包括域名和端口号（如果有的话），例如 "www.example.com:80"。# path ：URL 的路径部分，例如 "/path/to/resource"。# params ：查询字符串之前的参数部分（对于大多数 URL 不太常见）。# query ：查询字符串部分，例如 "key=value"。# fragment ：URL 的片段部分（也称为锚点），例如 "#section1"。# 如果原始 URL 字符串中不包含某个部分，对应的属性将会是空字符串。# 这个函数是处理 URL 的常用工具，可以帮助开发者提取 URL 的各个组成部分，或者验证 URL 的格式。url = urlsplit(p)# 检查其是否符合 Triton 的 URL 格式（即包含主机名、路径且协议为 http 或 grpc ），如果符合，则将 triton 设置为 True 。triton = bool(url.netloc) and bool(url.path) and url.scheme in {"http", "grpc"}# 返回一个 包含模型格式检测结果的列表 ，列表的最后一位表示 是否为 Triton 模型 。return types + [triton]# 这段代码的主要作用是。检测模型格式：根据模型文件的路径或名称，检测其格式是否为 PyTorch、ONNX、TensorRT 等支持的格式。支持旧版 CoreML 格式：特别检查文件名是否以 .mlmodel 结尾，以支持旧版 Apple CoreML 格式。排除 TFLite 和 EdgeTPU 的冲突：确保 .tflite 和 .edgetpu 不同时为 True 。检测 Triton 模型：如果输入路径是一个 URL 且符合 Triton 的 URL 格式，则识别为 Triton 模型。通过这个方法， AutoBackend 类能够动态识别模型的格式，从而选择合适的后端进行推理。
# AutoBackend 类的主要功能和特点如下。动态后端选择：根据模型文件的格式，动态选择合适的推理后端。支持多种格式：支持 PyTorch、ONNX、OpenVINO、TensorRT、CoreML、TensorFlow、TFLite、PaddlePaddle、MNN、NCNN、RKNN 等多种模型格式。设备兼容性：支持 CPU 和 GPU 设备，自动检测并切换。推理优化：支持半精度推理（FP16）、动态批量大小、模型融合等优化。类别名称管理：提供默认类别名称，并支持自定义类别名称。预热功能：通过预热模型，确保推理性能稳定。通过 AutoBackend ，用户可以轻松地在不同平台上部署和运行 Ultralytics YOLO 模型，而无需关心底层的推理引擎细节。

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-autobackend.py

autobackend.py ultralytics\nn\autobackend.py 目录 autobackend.py 1.所需的库和模块 2.def check_class_names(names): 3.def default_class_names(dataNone): 4.class AutoBackend(nn.Module): 1.所需的库和模块 # Ultralytics 🚀 AGPL-3.0 License …...

编程日记 2025/2/6 23:15:40

Docker使用指南（一）——镜像相关操作详解（实战案例教学，适合小白跟学）

目录 1.镜像名的组成 2.镜像操作相关命令镜像常用命令总结： 1. docker images 2. docker rmi 3. docker pull 4. docker push 5. docker save 6. docker load 7. docker tag 8. docker build 9. docker history 10. docker inspect 11. docker prune…...

编程日记 2025/2/6 23:08:34

Rust 变量特性：不可变、和常量的区别、 Shadowing

Rust 变量特性：不可变、和常量的区别、 Shadowing Rust 是一门以安全性和性能著称的系统编程语言，其变量系统设计独特且强大。本文将从三个角度介绍 Rust 变量的核心特性：可变性（Mutability）、变量与常量的区别&#…...

编程日记 2025/2/6 23:06:32

NFT Insider #167：Champions Tactics 角色加入 The Sandbox；AI 助力 Ronin 游戏生态

引言：NFT Insider 由 NFT 收藏组织 WHALE Members、BeepCrypto 联合出品， 浓缩每周 NFT 新闻，为大家带来关于 NFT 最全面、最新鲜、最有价值的讯息。每期周报将从 NFT 市场数据，艺术新闻类，游戏新闻类，虚拟…...

编程日记 2025/2/6 23:01:25

鹧鸪云无人机光伏运维解决方案

在新能源产业蓬勃发展的当下，光伏电站作为清洁能源供应的关键一环，其稳定运行和高效运维至关重要。随着光伏电站规模持续扩大，数量不断增加，传统人工巡检方式的弊端日益显著。人工巡检不仅效率低、人力和时间成本高，而…...

编程日记 2025/2/6 22:58:22

NeuralCF 模型：神经网络协同过滤模型

实验和完整代码完整代码实现和jupyter运行：https://github.com/Myolive-Lin/RecSys--deep-learning-recommendation-system/tree/main 引言 NeuralCF 模型由新加坡国立大学研究人员于 2017 年提出，其核心思想在于将传统协同过滤方法与深度学习技术相结…...

编程日记 2025/2/6 22:54:16

【前端】【Ts】【知识点总结】TypeScript知识总结

一、总体概述 TypeScript 是 JavaScript 的超集，主要通过静态类型检查和丰富的类型系统来提高代码的健壮性和可维护性。它涵盖了从基础数据类型到高级类型、从函数与对象的类型定义到类、接口、泛型、模块化及装饰器等众多知识点。掌握这些内容有助于编写更清晰、结…...

编程日记 2025/2/6 22:52:13

JAVA架构师进阶之路

JAVA架构师进阶之路前言苦于网络上充斥的各种java知识，多半是互相抄袭，导致很多后来者在学习java知识中味同嚼蜡，本人闲暇之余整理了进阶成为java架构师所必须掌握的核心知识点，后续会不断扩充。废话少说，直接上正…...

编程日记 2025/2/6 22:51:12

掌握@PostConstruct与@PreDestroy，优化Spring Bean的初始化和销毁

在Spring中，PostConstruct和PreDestroy注解就像是对象的“入职”和“离职”仪式。 1. PostConstruct注解：这个注解标记的方法就像是员工入职后的“岗前培训”。当一个对象（比如一个Bean）被Spring容器创建并注入依赖后，…...

编程日记 2025/2/6 22:50:11

Java设计模式：行为型模式→状态模式

Java 状态模式详解 1. 定义状态模式（State Pattern）是一种行为型设计模式，它允许对象在内部状态改变时改变其行为。状态模式通过将状态需要的行为封装在不同的状态类中，实现对象行为的动态改变。该模式的核心思想是分离不同状态…...

编程日记 2025/2/6 22:48:07

景联文科技：专业数据采集标注公司，助力企业提升算法精度！

随着人工智能技术加速落地，高质量数据已成为驱动AI模型训练与优化的核心资源。据统计，全球AI数据服务市场规模预计2025年突破200亿美元，其中智能家居、智慧交通、医疗健康等数据需求占比超60%。作为国内领先的AI数据服务商，景联文…...

编程日记 2025/2/6 22:47:06

ES面试题

1、Elasticsearch的基本构成： （1）index 索引： 索引类似于mysql 中的数据库，Elasticesearch 中的索引是存在数据的地方，包含了一堆有相似结构的文档数据。 （2）type 类型&#xff1a…...

编程日记 2025/2/6 22:44:03

LabVIEW2025中文版软件安装包、工具包、安装教程下载

下载链接：LabVIEW及工具包大全-三易电子工作室http://blog.eeecontrol.com/labview6666 《LabVIEW2025安装图文教程》 1、解压后，双击install.exe安装 2、选中“我接受上述2条许可协议”，点击下一步 3、点击下一步，安装NI Packa…...

编程日记 2025/2/6 22:43:01

算法与数据结构（合并K个升序链表）

思路有了合并两个链表的基础后，这个的一种方法就是可以进行顺序合并，我们可以先写一个函数用来合并两个链表，再在合并K个链表的的函数中循环调用它。解题过程解析这个函数首先，可以先判断，如果a为空&#xff0c…...

编程日记 2025/2/6 22:42:00

洛谷 P4552 [Poetize6] IncDec Sequence C语言

P4552 [Poetize6] IncDec Sequence - 洛谷 | 计算机科学教育新生态题目描述给定一个长度为 n 的数列 a1,a2,…,an，每次可以选择一个区间 [l,r]，使这个区间内的数都加 1 或者都减 1。请问至少需要多少次操作才能使数列中的所有数都一样&#…...

编程日记 2025/2/6 22:37:56

保姆级教程Docker部署Zookeeper官方镜像

目录 1、安装Docker及可视化工具 2、创建挂载目录 3、运行Zookeeper容器 4、Compose运行Zookeeper容器 5、查看Zookeeper运行状态 6、验证Zookeeper是否正常运行 1、安装Docker及可视化工具 Docker及可视化工具的安装可参考：Ubuntu上安装 Docker及可视化管理…...

编程日记 2025/2/6 22:34:53

javaEE-6.网络原理-http

目录什么是http? http的工作原理： 抓包工具 fiddler的使用 HTTP请求数据: 1.首行:编辑 2.请求头(header) 3.空行： 4.正文（body） HTTP响应数据 1.首行：编辑 2.响应头 3.空行： 4.响应正文…...

编程日记 2025/2/6 22:32:51

【戒抖音系列】短视频戒除-1-对推荐算法进行干扰

如今推荐算法已经渗透到人们生活的方方面面，尤其是抖音等短视频核心就是推荐算法。【短视频的危害】 1> 会让人变笨，慢慢让人丧失注意力与专注力 2> 让人丧失阅读长文的能力 3> 让人沉浸在一个又一个快感与嗨点当中。当我们刷短视频时&#x…...

编程日记 2025/2/6 22:29:46

9.建造者模式（Builder Pattern）

定义建造者模式（Builder Pattern）是一种创建型设计模式，旨在将复杂对象的构建过程与它的表示分离，使得同样的构建过程可以创建不同的表示。该模式的核心思想是通过一步步地构建一个复杂的对象，每个步骤独立且可扩展&…...

编程日记 2025/2/6 22:23:39

OpenCV：特征检测总结

目录一、什么是特征检测？ 二、OpenCV 中的常见特征检测方法 1. Harris 角点检测 2. Shi-Tomasi 角点检测 3. Canny 边缘检测 4. SIFT（尺度不变特征变换） 5. ORB 三、特征检测的应用场景 1. 图像匹配 2. 运动检测 3. 自动驾驶 4.…...

编程日记 2025/2/6 22:22:37

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2025/7/4 19:19:18

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2025/7/4 12:47:34

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件，常用于在两个集合之间进行数据转移，如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。核心特性与用法基本属性 v-model：绑定右侧列表的值&…...

编程新知 2025/7/5 22:43:55

GitHub 趋势日报 (2025年06月08日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...

编程新知 2025/6/17 3:05:21

Rust 异步编程

Rust 异步编程引言 Rust 是一种系统编程语言，以其高性能、安全性以及零成本抽象而著称。在多核处理器成为主流的今天，异步编程成为了一种提高应用性能、优化资源利用的有效手段。本文将深入探讨 Rust 异步编程的核心概念、常用库以及最佳实践。异步编程基础什么是异步…...

编程新知 2025/6/20 11:52:30

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决问题背景在一个基于 Spring Cloud Gateway WebFlux 构建的微服务项目中，新增了一个本地验证码接口 /code，使用函数式路由（RouterFunction）和 Hutool 的 Circle…...

编程新知 2025/7/7 13:25:43

Spring是如何解决Bean的循环依赖：三级缓存机制

1、什么是 Bean 的循环依赖在 Spring框架中，Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌，形成闭环依赖关系的现象。多个 Bean 的依赖关系构成环形链路，例如：双向依赖：Bean A 依赖 Bean B，同时 Bean B 也依赖 Bean A（A↔B）。链条循环： Bean A → Bean…...

编程新知 2025/6/16 11:26:44