当前位置：首页 > news >正文

bert ranking pairwise demo

news 2026/2/11 8:17:56

下面是用bert 训练pairwise rank 的 demo

import torch
from torch.utils.data import DataLoader, Dataset
from transformers import BertModel, BertTokenizer
from sklearn.metrics import pairwise_distances_argmin_minclass PairwiseRankingDataset(Dataset):def __init__(self, sentence_pairs, tokenizer, max_length):self.input_ids = []self.attention_masks = []for pair in sentence_pairs:encoded_pair = tokenizer(pair, padding='max_length', truncation=True, max_length=max_length, return_tensors='pt')self.input_ids.append(encoded_pair['input_ids'])self.attention_masks.append(encoded_pair['attention_mask'])self.input_ids = torch.cat(self.input_ids, dim=0)self.attention_masks = torch.cat(self.attention_masks, dim=0)def __len__(self):return len(self.input_ids)def __getitem__(self, idx):input_id = self.input_ids[idx]attention_mask = self.attention_masks[idx]return input_id, attention_maskclass BERTPairwiseRankingModel(torch.nn.Module):def __init__(self, bert_model_name):super(BERTPairwiseRankingModel, self).__init__()self.bert = BertModel.from_pretrained(bert_model_name)self.dropout = torch.nn.Dropout(0.1)self.fc = torch.nn.Linear(self.bert.config.hidden_size, 1)def forward(self, input_ids, attention_mask):outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask)pooled_output = self.dropout(outputs[1])logits = self.fc(pooled_output)return logits.squeeze()# 初始化BERT模型和分词器
bert_model_name = 'bert-base-uncased'
tokenizer = BertTokenizer.from_pretrained(bert_model_name)# 示例输入数据
sentence_pairs = [('I like cats', 'I like dogs'),('The sun is shining', 'It is raining'),('Apple is a fruit', 'Car is a vehicle')
]# 超参数
batch_size = 8
max_length = 128
learning_rate = 1e-5
num_epochs = 5# 创建数据集和数据加载器
dataset = PairwiseRankingDataset(sentence_pairs, tokenizer, max_length)
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)# 初始化模型并加载预训练权重
model = BERTPairwiseRankingModel(bert_model_name)
optimizer = torch.optim.AdamW(model.parameters(), lr=learning_rate)# 训练模型
model.train()for epoch in range(num_epochs):total_loss = 0for input_ids, attention_masks in dataloader:optimizer.zero_grad()logits = model(input_ids, attention_masks)# 计算损失函数（使用对比损失函数）pos_scores = logits[::2]  # 正样本分数neg_scores = logits[1::2]  # 负样本分数loss = torch.relu(1 - pos_scores + neg_scores).mean()total_loss += loss.item()loss.backward()optimizer.step()print(f"Epoch {epoch+1}/{num_epochs} - Loss: {total_loss:.4f}")# 推断模型
model.eval()with torch.no_grad():embeddings = model.bert.embeddings.word_embeddings(dataset.input_ids)pairwise_distances = pairwise_distances_argmin_min(embeddings.numpy())# 输出结果
for i, pair in enumerate(sentence_pairs):pos_idx = pairwise_distances[0][2 * i]neg_idx = pairwise_distances[0][2 * i + 1]pos_dist = pairwise_distances[1][2 * i]neg_dist = pairwise_distances[1][2 * i + 1]print(f"Pair: {pair}")print(f"Positive example index: {pos_idx}, Distance: {pos_dist:.4f}")print(f"Negative example index: {neg_idx}, Distance: {neg_dist:.4f}")print()

bert ranking pairwise demo

下面是用bert 训练pairwise rank 的 demo import torch from torch.utils.data import DataLoader, Dataset from transformers import BertModel, BertTokenizer from sklearn.metrics import pairwise_distances_argmin_minclass PairwiseRankingDataset(Dataset):def __ini…...

编程日记 2023/9/9 15:10:11

GPT引领前沿与应用突破之GPT4科研实践技术与AI绘图

GPT对于每个科研人员已经成为不可或缺的辅助工具，不同的研究领域和项目具有不同的需求。例如在科研编程、绘图领域：1、编程建议和示例代码: 无论你使用的编程语言是Python、R、MATLAB还是其他语言，都可以为你提供相关的代码示例。2、数据可视…...

编程日记 2023/9/9 15:09:10

SpringBoot整合Swagger3

前言 swagger是啥，是干什么的，有什么用，我想在这里我就不用介绍了，下面直接代码演示。添加依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0…...

编程日记 2023/9/9 15:08:08

detectron2 install path

>>> import detectron2 >>> detectron2_path detectron2.__file__ >>> print(detectron2.__file__)...

编程日记 2023/9/9 15:07:05

如何将DHTMLX Suite集成到Scheduler Lightbox中？让项目管理更可控！

在构建JavaScript调度器时，通常需要为最终用户提供一个他们喜欢的方式来计划事件，这是Web开发人员喜欢认可DHTMLX Scheduler的重要原因，它在这方面提供了完全的操作自由，它带有lightbox弹出窗口，允许通过各种控件动态更…...

编程日记 2023/9/9 15:06:04

什么是JVM常用调优策略？分别有哪些?

目录一、JVM调优二、堆内存大小调整三、垃圾回收器调优四、线程池调优一、JVM调优 Java虚拟机（JVM）的调优主要是为了提高应用程序的性能，包括提高应用程序的响应速度和吞吐量。以下是一些常用的JVM调优策略： 堆内存大小…...

编程日记 2023/9/9 15:05:02

《向量数据库指南》——向量数据库Milvus Cloud 2.3的可运维性：从理论到实践

一、引言在数据科学的大家庭中，向量数据库扮演着重要角色。它们通过独特的向量运算机制，为复杂的机器学习任务提供了高效的数据处理能力。然而，如何让这些数据库在生产环境中稳定运行，成为了运维团队的重要挑战。本文将深入探讨向量数据库的可运维性，并分享一些有趣的案…...

编程日记 2023/9/9 15:04:00

select多选回显问题（取巧~）

要实现的效果： 实际上select选择框，我想要的是数组对象，但是后端返回来的是个字符串。以下是解决方法： 以上是一种简单的解决方法~ 也可以自己处理数据或者让后端直接改成想要的格式。...

编程日记 2023/9/9 15:03:00

光伏并网双向计量表ADL400

安科瑞华楠 ADL400 导轨式多功能电能表，是主要针对电力系统，工矿企业，公用设施的电能统计、管理需求而设计的一款智能仪表，产品具有精度高、体积小、安装方便等优点。集成常见电力参数测量及电能计量及考核管理，…...

编程日记 2023/9/9 15:01:59

十三、MySQL(DQL)语句执行顺序

1、DQL语句执行顺序: （1）from来决定表 # where来指定查询的条件 （2）group by指定分组 # having指定分组之后的条件 （3）select查询要返回哪些字段 （4）order by根据字段内容&#…...

编程日记 2023/9/9 15:00:57

【高德地图】根据经纬度多边形的绘制（可绘制区域以及任意图形）

官方示例 https://lbs.amap.com/demo/jsapi-v2/example/overlayers/polygon-draw <!doctype html> <html> <head><meta charset"utf-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name&quo…...

编程日记 2023/9/9 14:59:56

C++ std::pair and std::list \ std::array

std::pair<第一个数据类型, 第二个数据类型> 变量名例如： std::pair<int, string> myPair; myPair.first;拿到第一个int变量 myPair.second拿到第二个string变量 std::pair需要引入库#include "utility" std::make_pair() 功能制作一个…...

编程日记 2023/9/9 14:58:55

C++的类型转换

前言我们都知道C是兼容C语言的在C语言中存在两种方式的类型转换，分别是隐式类型转换和显示类型转换（强制类型转换），但是C觉得C语言的这套东西是够好，所以在兼容C语言的基础上又搞了一套自己的关于类型转换的东西。目…...

编程日记 2023/9/9 14:57:54

【Selenium2+python】自动化unittest生成测试报告

前言批量执行完用例后，生成的测试报告是文本形式的，不够直观，为了更好的展示测试报告，最好是生成HTML格式的。 unittest里面是不能生成html格式报告的，需要导入一个第三方的模块：HTMLTestRunner 一、导…...

编程日记 2023/9/9 14:56:53

【APISIX】W10安装APISIX

Apache APISIX 是一个动态、实时、高性能的云原生 API 网关，提供了负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等丰富的流量管理功能。以下简单介绍Windows下借助Docker Desktop来安装APISIX。具体应用场景可参考官网（https://apisix.…...

编程日记 2023/9/9 14:55:52

[Linux]动静态库

[Linux]动静态库文章目录 [Linux]动静态库见一见库存在库的原因编写库模拟编写静态库模拟使用静态库模拟编写动态库模拟使用静态库库的加载原理静态库的加载原理动态库的加载原理库在可执行程序中的编址策略静态库在可执行程序中的编址策略动态库在可执行程序中的编址策略见…...

编程日记 2023/9/9 14:54:51

2023高教社杯数学建模国赛C题思路解析+代码+论文

如下为C君的2023高教社杯全国大学生数学建模竞赛C题思路分析代码论文 C题蔬菜类商品的自动定价与补货决策在生鲜商超中，一般蔬菜类商品的保鲜期都比较短，且品相随销售时间的增加而变差, 大部分品种如当日未售出，隔日就无法再售。因此&…...

编程日记 2023/9/9 14:53:50

macos13 arm芯片(m2) 搭建hbase docker容器并用flink通过自定义richSinkFunction写入数据到hbase

搭建hbase docker容器下载镜像 https://hub.docker.com/r/satoshiyamamoto/hbase/tags 点击run 使用镜像新建容器填写容器名和容器与宿主机的端口映射测试通过宿主机访问容器内的hbase webUI http://localhost:60010/master-status...

编程日记 2023/9/9 14:52:49

FLV封装格式

摘要：本文描述了FLV的文件格式。关键字：FLV 1 简介 FLV流媒体格式是sorenson公司开发的一种视频格式，全称为Flash Video。它的出现有效地解决了视频文件导入Flash后，使导出的SWF文件体积庞大，不能在网络上很好的…...

编程日记 2023/9/9 14:51:47

[NLP]LLM---FineTune自己的Llama2模型

一数据集准备 Let’s talk a bit about the parameters we can tune here. First, we want to load a llama-2-7b-hf model and train it on the mlabonne/guanaco-llama2-1k (1,000 samples), which will produce our fine-tuned model llama-2-7b-miniguanaco. If you’re …...

编程日记 2023/9/9 14:50:46

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

mongodb源码分析session执行handleRequest命令find过程

mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程，并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令，把数据流转换成Message，状态转变流程是：State::Created 》 St…...

编程新知 2026/1/15 4:39:38

可靠性+灵活性：电力载波技术在楼宇自控中的核心价值

可靠性灵活性：电力载波技术在楼宇自控中的核心价值在智能楼宇的自动化控制中，电力载波技术（PLC）凭借其独特的优势，正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据，无需额外布…...

编程新知 2025/9/27 2:43:26

pam_env.so模块配置解析

在PAM（Pluggable Authentication Modules）配置中， /etc/pam.d/su 文件相关配置含义如下： 配置解析 auth required pam_env.so1. 字段分解字段值说明模块类型auth认证类模块，负责验证用户身份&am…...

编程新知 2025/10/5 8:09:39

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

是否存在路径（FIFOBB算法）

题目描述一个具有 n 个顶点e条边的无向图，该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序，确定是否存在从顶点 source到顶点 destination的路径。输入第一行两个整数，分别表示n 和 e 的值（1…...

编程新知 2025/10/1 6:09:21

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题问题现象当开发者预期进行浮点除法却误用整数除法时，会出现小数部分被截断的情况。典型错误模式如下： void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

编程新知 2026/2/4 13:10:38

Linux nano命令的基本使用

参考资料 GNU nanoを使いこなすnano基础目录一. 简介二. 文件打开2.1 普通方式打开文件2.2 只读方式打开文件三. 文件查看3.1 打开文件时，显示行号3.2 翻页查看四. 文件编辑4.1 Ctrl K 复制和 Ctrl U 粘贴4.2 Alt/Esc U 撤回五. 文件保存与退出5.1 Ctrl …...

编程新知 2026/1/31 2:17:41

uniapp 开发ios， xcode 提交app store connect 和 testflight内测

uniapp 中配置配置manifest 文档：manifest.json 应用配置 | uni-app官网 hbuilderx中本地打包下载IOS最新SDK 开发环境 | uni小程序SDK hbulderx 版本号：4.66 对应的sdk版本 4.66 两者必须一致本地打包的资源导入到SDK 导入资源 | uni小程序SDK …...

编程新知 2026/1/31 8:35:07

Chromium 136 编译指南 Windows篇：depot_tools 配置与源码获取（二）

引言工欲善其事，必先利其器。在完成了 Visual Studio 2022 和 Windows SDK 的安装后，我们即将接触到 Chromium 开发生态中最核心的工具——depot_tools。这个由 Google 精心打造的工具集，就像是连接开发者与 Chromium 庞大代码库的智能桥梁…...

编程新知 2026/2/8 22:05:17

相关文章：