当前位置：首页 > news >正文

使用LightGlue进行图像配准并提取图像重叠区域

news 2026/2/9 8:22:48

发表日期：2023年6月23日
项目地址：https://github.com/cvg/LightGlue + https://github.com/cvg/glue-factory/

LightGlue是一个在精度上媲美Superglue，但在速度上比Superglue快一倍的模型。通过博主实测，LightGlue的配准效果比Superglue好，LightGlue配准后的结果错误点更少，同时提取的重叠区域更精准。

基于Superpoint+Superglue 提取重叠区域的代码可以参考 https://blog.csdn.net/a486259/article/details/129093084

1、lightglue与superglue的对比

lightglue与superglue相比在同样的精度下，速度要快3倍。
在这里插入图片描述
lightglue的结构设计如下，是通过组层移除低匹配度点的策略进行预测

在多个任务中对比，可以发现lightglue比superglue略胜一筹，占微弱优势
在这里插入图片描述
但在速度上，明显可以看到Lightglue明显比superglue快不少，能减少50%的耗时。

2、lightglue使用效果

下载LightGlue项目
或者执行

git clone https://github.com/cvg/LightGlue.git && cd LightGlue
python -m pip install -e .

执行以下代码进行配准尝试

# If we are on colab: this clones the repo and installs the dependencies
from pathlib import Path# if "LightGlue" not in Path.cwd().name :
#     !git clone --quiet https://github.com/cvg/LightGlue/
#     %cd LightGlue
#     !pip install --progress-bar off --quiet -e .from lightglue import LightGlue, SuperPoint, DISK
from lightglue.utils import load_image, rbd
from lightglue import viz2d
import torchtorch.set_grad_enabled(False)
images = Path("../assets")device = torch.device("cuda" if torch.cuda.is_available() else "cpu")  # 'mps', 'cpu'
#官方默认是2048个点
extractor = SuperPoint(max_num_keypoints=700).eval().to(device)  # load the extractor
matcher = LightGlue(features="superpoint").eval().to(device)image0 = load_image(images / "b1.png")
image1 = load_image(images / "b2.png")feats0 = extractor.extract(image0.to(device))
feats1 = extractor.extract(image1.to(device))
matches01 = matcher({"image0": feats0, "image1": feats1})
feats0, feats1, matches01 = [rbd(x) for x in [feats0, feats1, matches01]
]  # remove batch dimensionkpts0, kpts1, matches = feats0["keypoints"], feats1["keypoints"], matches01["matches"]
m_kpts0, m_kpts1 = kpts0[matches[..., 0]], kpts1[matches[..., 1]]axes = viz2d.plot_images([image0, image1])
viz2d.plot_matches(m_kpts0, m_kpts1, color="lime", lw=0.2)
viz2d.add_text(0, f'Stop after {matches01["stop"]} layers', fs=20)kpc0, kpc1 = viz2d.cm_prune(matches01["prune0"]), viz2d.cm_prune(matches01["prune1"])
viz2d.plot_images([image0, image1])
viz2d.plot_keypoints([kpts0, kpts1], colors=[kpc0, kpc1], ps=10)

执行效果如下所示，比superglue要好很多，基本上看不到错误匹配的点。superglue配准具体细节可以查看链接
在这里插入图片描述
superglue的配置效果如下所示，存在不少错误的点。

3、提取重叠区域

在步骤二的结果中，基于以下代码可以实现重叠区域的提取

import cv2
import numpy as np
from imgutils import myimshowsCL,tensor2img
def getGoodMatchPoint(mkpts0, mkpts1, confidence,  match_threshold:float=0.003):n = min(mkpts0.size(0), mkpts1.size(0))srcImage1_matchedKPs, srcImage2_matchedKPs=[],[]if (match_threshold > 1 or match_threshold < 0):print("match_threshold error!")for i in range(n):kp0 = mkpts0[i]kp1 = mkpts1[i]pt0=(kp0[0].item(),kp0[1].item());pt1=(kp1[0].item(),kp1[1].item());c = confidence[i].item();if (c > match_threshold):srcImage1_matchedKPs.append(pt0);srcImage2_matchedKPs.append(pt1);return np.array(srcImage1_matchedKPs),np.array(srcImage2_matchedKPs)
mkpts0, mkpts1 = m_kpts0, m_kpts1
confidence=matches01['scores']
im_dst,im_res=tensor2img(image0), tensor2img(image1)pts_src, pts_dst=getGoodMatchPoint(mkpts0, mkpts1, confidence)h1, status = cv2.findHomography(pts_src, pts_dst, cv2.RANSAC, 1)
im_out1 = cv2.warpPerspective(im_dst, h1, (im_dst.shape[1],im_dst.shape[0]))myimshowsCL([im_dst,im_res,im_out1],titles=["im_dst","im_res","overlap"],rows=1,cols=3, size=6)

其中myimshowsCL,tensor2img等函数代码来自于 https://hpg123.blog.csdn.net/article/details/129093084

提取的重叠区域如下所示
在这里插入图片描述
基于superglue配准后提取的重叠区域如图1所示，可以看到有3处不如LightGlue（关于地球仪上的误差，可能不算；但另两处特别明显）

使用LightGlue进行图像配准并提取图像重叠区域

发表日期：2023年6月23日项目地址：https://github.com/cvg/LightGlue https://github.com/cvg/glue-factory/ LightGlue是一个在精度上媲美Superglue，但在速度上比Superglue快一倍的模型。通过博主实测，LightGlue的配准效果比Su…...

编程日记 2025/2/5 12:32:33

DeepSeek-R1：开源机器人智能控制系统的革命性突破

目录引言一、DeepSeek-R1 的概述 1.1 什么是 DeepSeek-R1？ 1.2 DeepSeek-R1 的定位二、DeepSeek-R1 的核心特性 2.1 实时控制能力 2.2 多传感器融合 2.3 路径规划与导航 2.4 人工智能集成 2.5 开源与模块化设计 2.6 跨平台支持三、DeepSeek-R1 的技术…...

编程日记 2025/2/5 12:29:29

第二十二章 MySQL锁之全局锁

目录一、锁概述二、全局锁概念三、全局锁使用四、全局锁特点五、不加锁一致性数据备份 5.1. 实现方式 5.2. 优点和缺点一、锁概述锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中，除传统的计算资源（CPU、RAM、I/O&#x…...

编程日记 2025/2/5 12:28:28

pytorch实现简单的情感分析算法

人工智能例子汇总：AI常见的算法和例子-CSDN博客在PyTorch中实现中文情感分析算法通常涉及以下几个步骤：数据预处理、模型定义、训练和评估。下面是一个简单的实现示例，使用LSTM模型进行中文情感分析。 1. 数据预处理首先，我…...

编程日记 2025/2/5 12:26:26

Win11关闭登录密码?

或者使用winR快捷键, 输入： netplwiz 进入页面后，按照提示按ctrlaltdel键更改密码。在跳转页面点击更改密码。输入原密码后，将新密码设置为空即可。 Win11的两个实用技巧系列之如何关闭登录密码?_win11关闭密码还是要输入-CSDN博客...

编程日记 2025/2/5 12:21:21

e2studio开发RA4M2(6)----GPIO外部中断（IRQ）配置

e2studio开发RA4M2.6--GPIO外部中断（IRQ）配置概述视频教学样品申请硬件准备参考程序源码下载新建工程工程模板保存工程路径芯片配置工程模板选择时钟设置SWD调试口设置GPIO口配置按键中断配置中断回调函数主程序概述 GPIO（通用输入/输出&a…...

编程日记 2025/2/5 12:19:19

DeepSeek 阐述 2025年前端发展趋势

预测2025年前端的发展趋势。首先，我需要考虑当前的前端技术发展情况，以及近几年的变化趋势。比如，框架方面，React、Vue、Angular这些主流框架的更新方向和社区活跃度。可能用户想知道未来哪些技术会更流行，或者需要学…...

编程日记 2025/2/5 12:18:17

linux内核源代码中__init的作用？

在 Linux 内核源代码中，__init是一个特殊的宏，用于标记在内核初始化阶段使用的变量或函数。这个宏的作用是告诉内核编译器和链接器，被标记的变量或函数只在内核的初始化阶段使用，在系统启动完成后就不再需要了。因此，这…...

编程日记 2025/2/5 12:15:13

计算机从何而来？计算技术将向何处发展？

计算机的前生：机械计算工具的演进算盘是计算机的起点，它其实是一台“机械式半自动化运算器”。打算盘的“口诀”其实就是它的编程语言，算盘珠就是它的存储器。第二阶段是可以做四则运算的加法器、乘法器。1642年，法国数学家帕斯…...

编程日记 2025/2/5 12:13:10

浏览器的通信能力

浏览器的通信能力用户代理浏览器可以代替用户完成http请求，代替用户解析响应结果，所以我们称之为： 用户代理 user agent 在网络层面，对于前端开发者，必须要知道浏览器拥有的两大核心能力： 自动发出请…...

编程日记 2025/2/5 12:11:08

11. 9 构建生产级聊天对话记忆系统：从架构设计到性能优化的全链路指南

构建生产级聊天对话记忆系统：从架构设计到性能优化的全链路指南关键词：聊天对话记忆系统、多用户会话管理、LangChain生产部署、Redis记忆存储、高并发对话系统一、服务级聊天记忆系统核心需求多用户隔离：支持同时处理数千个独立对话持久化存储：对话历史不因服务重启丢…...

编程日记 2025/2/5 12:06:00

25.02.04 《CLR via C#》笔记14

第二十一章托管堆和垃圾回收内存分配过程 CLR维护一个“下一次分配指针”（NextObjPtr），指向当前托管堆中第一个可用的内存地址计算类型所需的字节数，加上对象开销（类型对象指针、同步块索引）所需字节数…...

编程日记 2025/2/5 12:03:57

半导体器件与物理篇5 mosfet及相关器件

认识mos二极管 MOS二极管是研究半导体表面特性最有用的器件之一。MOS二极管可作为存储电容器，并且是电荷耦合器件(CCD)的基本结构单元。 MOS二极管结构的重要参数包括：氧化层厚度d；施加于金属平板上的电压V（正偏压时V为正&#x…...

编程日记 2025/2/5 12:01:53

Hugging Face GGUF 模型可视化

Hugging Face GGUF 模型可视化 1. Finding GGUF files (检索 GGUF 模型)2. Viewer for metadata & tensors info (可视化 GGUF 模型)References 无知小儿，仙家雄霸天下，依附强者才是唯一的出路。否则天地虽大，也让你们无路可走&#xff0…...

编程日记 2025/2/5 11:59:50

PVE纵览-掌握 PVE USB 直通：让虚拟机与物理设备无缝连接

PVE纵览-掌握 PVE USB 直通：让虚拟机与物理设备无缝连接文章目录 PVE纵览-掌握 PVE USB 直通：让虚拟机与物理设备无缝连接摘要前提条件步骤一：识别 USB 设备步骤二：编辑虚拟机配置步骤三：重启虚拟机注意事项其他配置选…...

编程日记 2025/2/5 11:53:42

关于系统重构实践的一些思考与总结

文章目录一、前言二、系统重构的范式1.明确目标和背景2.兼容屏蔽对上层的影响3.设计灰度迁移方案3.1 灰度策略3.2 灰度过程设计3.2.1 case1 业务逻辑变更3.2.2 case2 底层数据变更（数据平滑迁移）3.2.3 case3 在途新旧流程兼容3.2.4 case4 接口变更3.2.5…...

编程日记 2025/2/5 11:43:31

DeepSeek：智能时代的AI利器及其应用前景

1.DeepSeek是什么？ DeepSeek是一款基于人工智能技术的工具，旨在帮助用户高效处理和分析数据、生成内容、优化工作流程等。无论是数据分析、自然语言处理，还是自动化任务，DeepSeek都能提供强大的支持。其核心技术涵盖了机器学习、深…...

编程日记 2025/2/5 11:40:28

超详细UE4（虚幻4）第一人称射击（FPS）游戏制作教程

超详细UE4（虚幻4）第一人称射击（FPS）游戏制作教程引言在游戏开发领域，第一人称射击（FPS）游戏一直是最受欢迎的类型之一。从经典的《反恐精英》（CS）到现代的《使命召唤》（Call of Duty），FPS游戏凭借其紧张刺激的游戏体验和高度沉浸感，吸引了无数玩家。如果你是一…...

编程日记 2025/2/5 11:38:26

电商项目高级篇09-检索服务

电商项目高级篇09-检索服务 1、环境搭建1.1、前端静态文件准备1.2、search服务引入模版引擎1.3、index.html页面复制到templates文件夹下1.4、模仿product项目，引入名称空间1.5、动静分离，静态资源路径位置替换1.6、将1.1的静态资源放到nginx目录下1.7、…...

编程日记 2025/2/5 11:37:25

【网络协议大花园】应用层 http协议的使用小技巧，用好了都不用加班，效率翻两倍（下篇）

本篇会加入个人的所谓鱼式疯言 ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…...

编程日记 2025/2/5 11:34:21

模型参数、模型存储精度、参数与显存

模型参数量衡量单位 M：百万（Million） B：十亿（Billion） 1 B 1000 M 1B 1000M 1B1000M 参数存储精度模型参数是固定的，但是一个参数所表示多少字节不一定，需要看这个参数以什么…...

编程新知 2025/12/20 12:32:08

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

引言：探索视频播放程序设计之旅在当今数字化时代，多媒体应用已渗透到我们生活的方方面面，从日常的视频娱乐到专业的视频监控、视频会议系统，视频播放程序作为多媒体应用的核心组成部分，扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上，用户都期望…...

编程新知 2026/2/7 13:17:38

dedecms 织梦自定义表单留言增加ajax验证码功能

增加ajax功能模块，用户不点击提交按钮，只要输入框失去焦点，就会提前提示验证码是否正确。一，模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

编程新知 2026/2/5 17:51:52

Nginx server_name 配置说明

Nginx 是一个高性能的反向代理和负载均衡服务器，其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机（Virtual Host）。 1. 简介 Nginx 使用 server_name 指令来确定…...

编程新知 2025/9/6 16:47:17

什么是EULA和DPA

文章目录 EULA（End User License Agreement）DPA（Data Protection Agreement）一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA（End User License Agreement） 定义： EULA即…...

编程新知 2025/10/18 7:13:10

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2026/1/23 10:28:48

排序算法总结（C++）

目录一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序三、总结一、稳定性排序算法的稳定性是指：同样大小的样本 **（同样大小的数据）**在排序之后不会改变原始的相对次序。稳定性对基础类型对象…...

编程新知 2026/1/25 9:33:23

08. C#入门系列【类的基本概念】：开启编程世界的奇妙冒险

C#入门系列【类的基本概念】：开启编程世界的奇妙冒险嘿，各位编程小白探险家！欢迎来到 C# 的奇幻大陆！今天咱们要深入探索这片大陆上至关重要的 “建筑”—— 类！别害怕，跟着我，保准让你轻松搞…...

编程新知 2025/10/31 20:37:10

Linux中《基础IO》详细介绍

目录理解"文件"狭义理解广义理解文件操作的归类认知系统角度文件类别回顾C文件接口打开文件写文件读文件稍作修改，实现简单cat命令输出信息到显示器，你有哪些方法stdin & stdout & stderr打开文件的方式系统⽂件I/O⼀种传递标志位…...

编程新知 2026/2/3 4:42:54

高分辨率图像合成归一化流扩展

大家读完觉得有帮助记得关注和点赞！！！ 1 摘要我们提出了STARFlow，一种基于归一化流的可扩展生成模型，它在高分辨率图像合成方面取得了强大的性能。STARFlow的主要构建块是Transformer自回归流（TARFlow&am…...

编程新知 2026/1/23 12:11:55

1、lightglue与superglue的对比

2、lightglue使用效果

3、提取重叠区域

相关文章：