当前位置：首页 > news >正文

元学习之孪生网络Siamese Network

news 2026/2/9 0:24:43

简介：元学习是一种思想，一般以神经网络作为特征嵌入的工具，实现对数据特征的提取，然后通过构造某种指标以引导优化器对模型参数进行优化。而最小化距离是最常见的学习目标，这就是熟知的度量学习，度量学习里面经典的训练范式就是孪生网络。

1、小样本学习

小样本学习是指用于训练的数据很少，以分类任务为例，minist数据一共有10个类别，每个类别差不多有几百张图片，传统的训练方式是一股脑的把所有训练集数据给端到端模型进行训练，得到一个模型，然后在测试集上测试。

在小样本学习当中，每个类别仅能够使用很少的图片，比如10个类别每个类别使用5张图片，则称为10ways-5shots，10个类别每个类别使用2张图片，则称为10ways-2shots。在这么少的数据情况下，一般的端到端模型肯定学不到东西，导致效果变差。

那么换个思路，让神经网络生成表征即可，但是得按照我的思路进行生成，思路就是你神经网络生成的样本表征需要满足下面的条件：相同的图片表征距离尽量靠近、不相同的图片表征距离尽量原理，然后构造一个自定义损失函数，进行训练即可。

可以看到，度量学习本质上就是在神经网络后面添加一个额外的网络层，这个网络层对神经网络的输出表征进行处理，输出一个度量值，也就是自定义了一个损失函数网络层。在torch当中，原理层面就说构造了一个新的计算图，使得优化器的优化目标进行了改变，而这种改变也会使得神经网络的权重变成我们想要的情况，也就是这个自定义的度量损失函数指导了神经网络权重的学习，这就是元学习的体现。

换一种说法就是，有一个初始的神经网络，我们需要改变他的权重，但不能直接让这个神经网络去参与训练。我们需要对神经网络的输出进行加工，得到另一种令人接受结果，然后使用万能的优化器优化这个结果，当这个结果确实令人接受了，那么神经网络的权重自然而然也就令人接受了。

2、孪生网络数据集

下面是孪生网络的数据集格式。


from torchvision import transforms
from torch.utils.data import Dataset, DataLoader
from PIL import Image
import random
import torch.functional as F
from tqdm import tqdmclass SiameseDataset(Dataset):def __init__(self, image_paths, labels, transform=None):self.image_paths = image_pathsself.labels = labelsself.transform = transform or transforms.Compose([transforms.Resize((256, 256)),  # 调整图片大小transforms.ToTensor(),  # 转换为张量transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  ])self.label_to_indices = self._create_label_to_indices()def _create_label_to_indices(self):"""创建一个字典，将每个标签映射到具有该标签的所有图像的索引列表"""label_to_indices = {}for idx, label in enumerate(self.labels):if label not in label_to_indices:label_to_indices[label] = []label_to_indices[label].append(idx)return label_to_indicesdef __len__(self):"""返回数据集的大小"""return len(self.image_paths)def __getitem__(self, index):"""返回一对图像和一个标签，指示这对图像是否属于同一类别"""# 随机选择是否返回同一类别的图像对label = self.labels[index]if random.random() < 0.5:# 选择同一类别的图像siamese_index = random.choice(self.label_to_indices[label])target = 1  # 1 表示同一类别else:# 选择不同类别的图像other_labels = [l for l in self.label_to_indices.keys() if l != label]other_label = random.choice(other_labels)siamese_index = random.choice(self.label_to_indices[other_label])target = 0  # 0 表示不同类别# 加载图像image1 = Image.open(self.image_paths[index]).convert('RGB')image2 = Image.open(self.image_paths[siamese_index]).convert('RGB')# 应用变换if self.transform:image1 = self.transform(image1)image2 = self.transform(image2)return image1, image2, target

3、损失函数


class ContrastiveLoss(nn.Module):def __init__(self, margin=2.0):super(ContrastiveLoss, self).__init__()self.margin = margindef forward(self, output1, output2, label):euclidean_distance = F.pairwise_distance(output1, output2)loss_contrastive = torch.mean((1-label) * torch.pow(euclidean_distance, 2) +(label) * torch.pow(torch.clamp(self.margin - euclidean_distance, min=0.0), 2))return loss_contrastive

元学习之孪生网络Siamese Network

1、小样本学习

2、孪生网络数据集

3、损失函数

相关文章：

元学习之孪生网络Siamese Network

深入HBase——引入

Python创建FastApi项目模板

TCNE 网络安全

车规MCU处理器选择Cortex-M7还是Cortex-R52？

什么是计算机中的 “终端”？

LeetCode刷题---字符串---819

SSH IBM AIX服务器相关指标解读

Wireshark TS | 再谈虚假的 TCP Spurious Retransmission

基于kafka、celery的日志收集报警项目

QML使用ChartView绘制饼状图

头歌实验--面向对象程序设计

DeepSeek-R1 蒸馏 Qwen 和 Llama 架构企业级RAG知识库

App UI自动化--Appium学习--第二篇

【SpringBoot实现全局API限频】最佳实践

Day1 25/2/14 FRI

开发板适配之I2C-RTC

vuedraggable固定某一item的记录

我的新书《青少年Python趣学编程（微课视频版）》出版了！

前端开发入门一

基于算法竞赛的c++编程（28）结构体的进阶应用

接口测试中缓存处理策略

国防科技大学计算机基础课程笔记02信息编码

服务器硬防的应用场景都有哪些？

五年级数学知识边界总结思考-下册

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

sqlserver 根据指定字符解析拼接字符串

Springcloud：Eureka 高可用集群搭建实战（服务注册与发现的底层原理与避坑指南）

#Uniapp篇：chrome调试unapp适配

智能AI电话机器人系统的识别能力现状与发展水平