当前位置: 首页 > article >正文

GICI:代码学习5

以下内容主要讲解estimateFundamental()和estimateHomography()的求解过程一、本质两个函数的本质都是在做相同的事情输入两帧特征方向向量输出相机的位姿 Rt.但是两个函数的路径不同。二、Homography 单应矩阵求解2.1 函数功能输入两帧特征点方向向量Bearings通过单应矩阵Homography Matrix求解相机云顶同时分解单应矩阵得到4种可能的位姿。通过“平面约束”和“Sampson误差”筛选最优解返回最优单应性矩阵包含位姿和平面法向量2.2 核心代码解析特征点格式转换Eigen向量 - OpenCV的Point2f通过OpenCV的 RANSACA 计算单应性矩阵HH的自由度为8对H矩阵进行格式转换OpenCV的Mat → Eigen的Matrix/Vector计算内点数量统计符合单位约束的特征点分解单应矩阵得到位姿和平面法向量删选最优解Homography estimateHomography(const Bearings f_cur,const Bearings f_ref,const double focal_length,const double reproj_error_thresh,const size_t min_num_inliers) { // TODO: too long. split up and write tests CHECK_EQ(f_cur.cols(), f_ref.cols()); const size_t N f_cur.cols(); const double thresh reproj_error_thresh/focal_length; // compute homography using RANSAC //1.特征点格式转换和Ffundamental法保持一致Eigen向量 → OpenCV的Point2f std::vectorcv::Point2f ref_pts(N), cur_pts(N); for(size_t i0; iN; i) { // vk::project2把3D方向向量投影到归一化平面z1得到2D坐标 (x,y) const Vector2d uv_ref(vk::project2(f_ref.col(i))); const Vector2d uv_cur(vk::project2(f_cur.col(i))); ref_pts[i] cv::Point2f(uv_ref[0], uv_ref[1]); cur_pts[i] cv::Point2f(uv_cur[0], uv_cur[1]); } //2.求解单应性矩阵HH矩阵自由度为8 cv::Mat H cv::findHomography(ref_pts, cur_pts, cv::RANSAC, thresh); //3.转换成Eigen矩阵 Matrix3d H_cur_ref; H_cur_ref H.atdouble(0,0), H.atdouble(0,1), H.atdouble(0,2), H.atdouble(1,0), H.atdouble(1,1), H.atdouble(1,2), H.atdouble(2,0), H.atdouble(2,1), H.atdouble(2,2); // compute number of inliers //4.计算内点数量统计符合单位约束的特征点 std::vectorbool inliers(N); size_t n_inliers 0; for(size_t i0; iN; i) { //用单应性矩阵投影参考帧点 到 当前帧 const Vector2d uv_cur vk::project2(H_cur_ref * f_ref.col(i)); //计算重投影误差 const Vector2d e vk::project2(f_cur.col(i)) - uv_cur; inliers[i] (e.norm() thresh); n_inliers inliers[i]; } VLOG(100) Homography has n_inliers inliers; if(n_inliers min_num_inliers) //内点不足返回空矩阵 { return Homography(); // return homography with score zero. } // compute decomposition // 5. 分解单应矩阵得到位姿和平面法向量 cv::Matx33d K(1, 0, 0, 0, 1, 0, 0, 0, 1); //构建单位相机内参矩阵因为输入是归一化坐标内参矩阵为单位矩阵 std::vectorcv::Mat rotations; //4种可能得旋转 std::vectorcv::Mat translations; //4种可能得平移 std::vectorcv::Mat normals; //4种可能的平面法向量 cv::decomposeHomographyMat(H, K, rotations, translations, normals); CHECK_EQ(rotations.size(), 4u); // 单应矩阵分解必得到4种解 // copy in decompositions struct //6.筛选最优解 std::vectorHomography decomp; for(size_t i0; i4; i) //OpenCV使用的是cv::Mat,但是工程使用的是Eigen { Homography d; //转换平移向量 const cv::Mat t translations[i]; d.t_cur_ref Vector3d(t.atdouble(0), t.atdouble(1), t.atdouble(2)); //转换平面法向量 const cv::Mat n normals[i]; d.n_cur Vector3d(n.atdouble(0), n.atdouble(1), n.atdouble(2)); //转换旋转矩阵 const cv::Mat R rotations[i]; d.R_cur_ref R.atdouble(0,0), R.atdouble(0,1), R.atdouble(0,2), R.atdouble(1,0), R.atdouble(1,1), R.atdouble(1,2), R.atdouble(2,0), R.atdouble(2,1), R.atdouble(2,2); decomp.push_back(d); } // check that plane is in front of camera // 7. 筛选1平面法向量朝向相机前方特征点深度为正 for(Homography D : decomp) { D.score 0; for(size_t i0; iN; i) { if(!inliers[i]) continue; //法向量与特征点方向向量的点积0时 平面在相机的前方 const double test f_cur.col(i).dot(D.n_cur); if(test 0.0) D.score 1.0; } } // 按得分排序得分高更多点满足平面约束 std::sort(decomp.begin(), decomp.end(), [](const Homography lhs, const Homography rhs) { return lhs.score rhs.score; }); decomp.resize(2); //保留前边两个最优解 // According to Faugeras and Lustman, ambiguity exists if the two scores are equal // but in practive, better to look at the ratio! //8.筛选2Sampson误差对极误差进一步消除歧义 if(decomp[1].score/decomp[0].score 0.9){ decomp.erase(decomp.begin() 1); // no ambiguity } else { // two-way ambiguity: resolve by sampsonus score of all points. // Sampson error can be roughly thought as the squared distance between a // point x to the corresponding epipolar line xF const double thresh_squared thresh * thresh * 4.0; for(Homography D : decomp) { D.score 0.0; // sum of sampsonus score const Matrix3d E_cur_ref D.R_cur_ref * vk::skew(D.t_cur_ref); // Essential Matrix for(size_t i0; iN; i) { const double d vk::sampsonDistance(f_cur.col(i), E_cur_ref, f_ref.col(i)); D.score std::min(d, thresh_squared); } } // 保留Sampson误差更小的解 if(decomp[0].score decomp[1].score) decomp.erase(decomp.begin() 1); else decomp.erase(decomp.begin()); } decomp[0].score n_inliers; return decomp[0]; }2.3 函数中部分概念解析1. 内点inlier是什么内点 符合当前数学模型约束的正确匹配点外点outlier 匹配错误、噪声大、不符合模型的点在单应矩阵H里正确匹配点用H把参考帧点投影到当前帧误差很小错误匹配点投影后误差很大所以误差 阈值 → 内点****误差 阈值 → 外点计算内点的核心代码for(size_t i0; iN; i) { // 用单应矩阵 H 把参考帧点投影到当前帧 const Vector2d uv_cur vk::project2(H_cur_ref * f_ref.col(i)); // 计算实际观测点 - 投影点 误差 const Vector2d e vk::project2(f_cur.col(i)) - uv_cur; // 误差 阈值 → 是内点 inliers[i] (e.norm() thresh); n_inliers inliers[i]; }2. 分解单应矩阵时K 矩阵为什么是单位矩阵关键结论因为代码输入的 Bearings 已经是【归一化相机坐标系】下的坐标正常单应公式但这里输入的Bearings不是像素坐标而是归一化相机坐标系x/z, y/z, 1也就是已经除以了 K 矩阵的坐标所以这里设置K为单位阵3. 为什么法向量 n 与特征点方向 f 的点积 0 → 平面在相机前方Homography 分解得到4组解其中2组平面在前2组平面在后。在 Homography 分解中会得到R、n、t。其中n为平面法向量表示平面朝那个方向也是垂直于平面的单位向量。f_cur表示当前帧特征点的方向向量相机中心 → 空间点的射线也就是相机看向这个点的方向。空间点 P*////O --------相机中心n为空间点P的平面法向量指向平面外侧。平面方程:(n^T) X dn 平面法向量d 相机到平面的距离空间点X λ f_cur //空间点在射线上代入得到深度计算公式空间点在相机前方λ0λ d / (n^T f_cur)因为d 0平面在相机前所以必须n^T f_cur 0三、Fundamental 本质矩阵求解3.1 函数功能输入两帧图像特征点方向向量Bearings、相机焦距、重投影误差阈值通过本质矩阵求解两帧间的相机运动R t返回内点数量。3.2 核心代码解析VisualInitResult FundamentalVisualInit::addFrameBundle( const FrameBundlePtr frames_cur) { // Track and detect features. if(!trackFeaturesAndCheckDisparity(frames_cur)) return VisualInitResult::kTracking; // Create vector of bearing vectors const FrameBundlePtr ref_frames ref_frames_; const Frame frame_ref *ref_frames-at(0); const Frame frame_cur *frames_cur-at(0); std::vectorstd::pairsize_t, size_t matches_cur_ref; getFeatureMatches(frame_cur, frame_ref, matches_cur_ref); //获取匹配的特征点 const size_t n matches_cur_ref.size(); Bearings f_cur(3, n); Bearings f_ref(3, n); //当前帧和参考帧的特征点方向向量单位向量归一化平面坐标shape: 3×nn 是特征点数量 for(size_t i 0; i n; i) { f_cur.col(i) frame_cur.f_vec_.col(matches_cur_ref[i].first); f_ref.col(i) frame_ref.f_vec_.col(matches_cur_ref[i].second); } // Compute model //使用本质矩阵法计算相机从参考帧-当前帧如何运动 //input前后帧的方向向量 //outputT_cur_ref相机移动多少num_valid内点数量 Transformation T_cur_ref; int num_valid estimateFundamental( f_cur, f_ref, ref_frames_-at(0)-getErrorMultiplier(), options_.reproj_error_thresh, T_cur_ref); if(num_valid options_.init_min_inliers) //内点太少不使用 { LOG(WARNING) Init Fundamental: Have num_valid inliers. options_.init_min_inliers inliers minimum required.; return VisualInitResult::kFailure; } // Triangulate //建立空间点 if(triangulateAndInitializePoints( frames_cur-at(0), ref_frames_-at(0), T_cur_ref, options_.reproj_error_thresh, options_.init_min_inliers, matches_cur_ref)) { return VisualInitResult::kSuccess; } // Restart frames_cur-at(0)-clearFeatureStorage(); return VisualInitResult::kTracking; }3.3 函数中部分概念解析1. 建立空间点 triangulateAndInitializePointsbool AbstractVisualInitialization::triangulateAndInitializePoints( const FramePtr frame_cur, //当前帧 const FramePtr frame_ref, //参考帧 const Transformation T_cur_ref, //相机运动 参考帧-当前帧 const double reprojection_threshold, //误差阈值 const size_t min_inliers_threshold, //内点阈值 std::vectorstd::pairsize_t, size_t matches_cur_ref, //前后帧匹配点对 const double depth_at_current_frame) //深度 { Positions points_in_cur; //1. 三角化算出3D点 triangulatePoints(*frame_cur, *frame_ref, T_cur_ref, reprojection_threshold, matches_cur_ref, points_in_cur); //2. 检查有效点够不够不够就失败 if(matches_cur_ref.size() min_inliers_threshold){ LOG(WARNING) Init WARNING: min_inliers_threshold inliers minimum required. Have only matches_cur_ref.size(); return false; } // Scale 3D points to given scene depth and initialize Points //3. 缩放3D点到真实大小并正式创建地图点 rescaleAndInitializePoints( frame_cur, frame_ref, matches_cur_ref, points_in_cur, T_cur_ref, depth_at_current_frame); return true; }2. 三角测量 triangulatePoints函数详解Vector3d triangulateFeatureNonLin( const Matrix3d R, // 旋转相机2 → 相机1 的旋转 相机1作为参考坐标系相机2旋转了R 移动了t const Vector3d t, // 平移相机2 → 相机1 的平移 const Vector3d feature1, // 相机1 看到的点方向 const Vector3d feature2 ) // 相机2 看到的点方向 { Vector3d f2 R * feature2; // 把相机 2 的方向转到相机 1 坐标系 Vector2d b; b[0] t.dot(feature1); b[1] t.dot(f2); Matrix2d A; A(0,0) feature1.dot(feature1); A(1,0) feature1.dot(f2); A(0,1) -A(1,0); A(1,1) -f2.dot(f2); Vector2d lambda A.inverse() * b; //AXb Vector3d xm lambda[0] * feature1; Vector3d xn t lambda[1] * f2; //标准的射线方程相机中心 深度 × 方向 return ( xm xn )/2; }现实场景你有两个相机或者一个相机移动了两次两个相机都拍到了同一个空间点 P每个相机只能看到这个点的方向不知道距离用两个方向射线求交点 → 得到 P 的 3D 坐标 。这就叫三角测量。相机1参考帧原点的观测公式相机 2当前帧移动了 t、旋转了 R的观测公式联立两个方程其中λ1​ 和 λ2就是我们要求的内容。最小误差模型分别对λ1​ 和 λ2 求导推到过程省略直接给出方程并写成AXB的形式为了和代码对应代码中的f2 为旋转之后的下面方程记计算出X后带回P点的两个观测公式然后求平均得到3D坐标3. rescaleAndInitializePoints 详解上一步通过三角化计算出了3D点但是单目相机不知道真实举例不知道世界有多大。比如三角化算出一个点距离相机1米但是现实中可能是10米也可能是100米。所有计算出的距离都差一个固定的倍数。这个倍数就叫尺度scale。算缩放倍数 scale缩放相机位置缩放 3D 点正式创建地图

相关文章:

GICI:代码学习5

以下内容主要讲解 estimateFundamental() 和 estimateHomography() 的求解过程一、本质两个函数的本质都是在做相同的事情:输入两帧特征方向向量,输出相机的位姿 R,t.但是两个函数的路径不同。二、Homography :单应矩阵求解2.1 函…...

企业级实验室信息管理系统:SENAITE LIMS 实战深度解析与部署指南

企业级实验室信息管理系统:SENAITE LIMS 实战深度解析与部署指南 【免费下载链接】senaite.lims SENAITE Meta Package 项目地址: https://gitcode.com/gh_mirrors/se/senaite.lims SENAITE LIMS 是一款基于 Plone 和 Python 构建的开源实验室信息管理系统&a…...

Unity Figma Bridge终极指南:3步实现设计到游戏的完美转换 [特殊字符]

Unity Figma Bridge终极指南:3步实现设计到游戏的完美转换 🚀 【免费下载链接】UnityFigmaBridge Easily bring your Figma Documents, Components, Assets and Prototypes to Unity 项目地址: https://gitcode.com/gh_mirrors/un/UnityFigmaBridge …...

别再只盯着采样率了!用STM32H723的ADC做高精度FFT分析,这些坑我帮你踩过了

STM32H723高精度FFT实战:从ADC采样到频谱分析的工程化实现 频谱分析在工业振动监测、音频处理、电力系统谐波检测等领域有着广泛应用。STM32H723系列凭借其高性能ADC和浮点运算单元,为嵌入式实时频谱分析提供了硬件基础。但实际工程中,从ADC…...

RVC 虚拟环境管理实战指南:解决三类核心运维问题

RVC 虚拟环境管理实战指南:解决三类核心运维问题 【免费下载链接】rvc RVC is a Linux console UI for vSphere, built on the RbVmomi bindings to the vSphere API. 项目地址: https://gitcode.com/gh_mirrors/rvc/rvc RVC(Ruby vSphere Consol…...

DeepSeek-R1-Distill-Llama-8B部署全攻略:一条命令搞定推理模型

DeepSeek-R1-Distill-Llama-8B部署全攻略:一条命令搞定推理模型 1. 模型简介 1.1 什么是DeepSeek-R1系列? DeepSeek-R1是专为推理任务优化的语言模型系列,包含两个核心版本: DeepSeek-R1-Zero:完全通过强化学习训练…...

OpenClaw安全实践:Qwen3-VL:30B本地化+飞书权限管控

OpenClaw安全实践:Qwen3-VL:30B本地化飞书权限管控 1. 为什么需要安全自动化 去年我接手了一个棘手的任务:团队每周需要从上百份PDF报告中提取关键数据,整理成统一格式的Excel表格。手动操作不仅耗时,还容易出错。当我尝试用Pyt…...

阿姆智创21.5寸工控电脑一体机,硬核性能解锁工业自动化,源头工厂ODM定位解决方案

在工业4.0的浪潮下,SMT产线的精密化运行、MES与ESOP系统的数字化落地、自动化设备的智能化联动,对工业控制终端的综合性能、系统适配性和场景贴合度提出了更高要求。阿姆智创21.5寸工控电脑一体机,以工业级硬核性能为基底,以多系统…...

大数据治理必看:数据目录的五大核心功能

大数据治理必看:数据目录的五大核心功能关键词:大数据治理、数据目录、元数据管理、数据血缘、数据协作摘要:在数据量爆炸式增长的今天,企业常面临“数据多到找不到、找到不敢用、用了怕出错”的困境。数据目录作为大数据治理的“…...

Android开发者必看:火山引擎API验签实战,5步搞定接口适配

Android开发者实战指南:火山引擎API验签与接口适配全解析 在移动应用开发领域,直接调用第三方API服务已成为提升开发效率的常见做法。火山引擎作为国内领先的云服务平台,其丰富的API接口为Android应用开发提供了强大支持。然而,由…...

React篇——第一章 React的基础知识(上篇)

目录 1. React简介 1.1 什么是React 1.2 React的核心优势 组件化开发 虚拟DOM 丰富的生态系统 跨平台支持 1.3 React的市场地位 2. 开发环境搭建 2.1 使用create-react-app创建项目 2.2 其他创建React项目的方式 3. JSX基础 3.1 什么是JSX 3.2 JSX的优势 3.3 JS…...

黑苹果终极配置指南:使用Hackintool轻松搞定显卡驱动、音频和USB问题

黑苹果终极配置指南:使用Hackintool轻松搞定显卡驱动、音频和USB问题 【免费下载链接】Hackintool The Swiss army knife of vanilla Hackintoshing 项目地址: https://gitcode.com/gh_mirrors/ha/Hackintool 还在为黑苹果配置头疼吗?显卡驱动不工…...

从PTA天梯赛L1真题看起:新手如何用C++快速搞定编程竞赛里的“送分题”?

从PTA天梯赛L1真题看起:新手如何用C快速搞定编程竞赛里的“送分题”? 第一次参加编程竞赛的新手,面对屏幕上密密麻麻的题目,往往会感到无从下手。但仔细观察历届PTA天梯赛L1级别的题目,你会发现一个有趣的现象——总有…...

LabVIEW与TCP远程实验监测

后疫情时代线上教学的普及,让理工类实验课的远程开展成为行业研究重点。传统线上教学工具仅适用于理论知识传播,针对需要动手实操的实验课程,存在实践操作不便、课堂监管弱化、成果验收困难等问题。国内现有远程实验系统多以虚拟仿真为主&…...

如何在Java中使用Thread创建线程

在Java中使用Thread类创建线程是一种常见而直接的方式。你可以继承Thread类并重写其run()定义线程执行的任务的方法。当调用线程对象时start()JVM将为该线程分配资源并自动执行该方法run()方法中的代码。继承Thread类,重写run方法创建线程的第一步是定义一个类继承T…...

Legacy iOS Kit终极指南:让旧款iPhone/iPad重获新生的完整方案

Legacy iOS Kit终极指南:让旧款iPhone/iPad重获新生的完整方案 【免费下载链接】Legacy-iOS-Kit An all-in-one tool to downgrade/restore, save SHSH blobs, and jailbreak legacy iOS devices 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit …...

KindEditor富文本编辑器:轻量级网页内容创作解决方案

KindEditor富文本编辑器:轻量级网页内容创作解决方案 【免费下载链接】kindeditor WYSIWYG HTML editor 项目地址: https://gitcode.com/gh_mirrors/ki/kindeditor 在当今Web开发中,内容编辑功能是许多网站的核心需求,但开发者常常面临…...

Cursor Pro功能扩展工具:技术原理与开源解决方案

Cursor Pro功能扩展工具:技术原理与开源解决方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial re…...

从时频分析到信号净化:小波变换的降噪实战指南

1. 小波变换基础:从傅里叶到时频分析 第一次接触小波变换时,我和大多数工程师一样,脑子里全是傅里叶变换的影子。记得当时处理一组振动传感器数据,傅里叶变换告诉我信号里存在30Hz和50Hz的成分,但就是找不到这些频率具…...

嵌入式软件开发规范与最佳实践指南

嵌入式软件开发最佳实践指南1. 项目概述1.1 嵌入式开发核心挑战现代嵌入式系统开发面临代码复杂度增加、团队协作需求提升以及产品迭代周期缩短等多重挑战。高效的开发流程和规范的编码实践成为保证项目成功的关键因素。1.2 开发环境配置建议推荐采用以下硬件配置方案&#xff…...

从原理到调参:图解RoIAlign双线性插值在torchvision.ops中的实现细节

从原理到调参:图解RoIAlign双线性插值在torchvision.ops中的实现细节 当你在PyTorch中实现目标检测模型时,RoIAlign(Region of Interest Align)是一个绕不开的核心操作。与传统的RoIPooling相比,RoIAlign通过双线性插值…...

Audacity音频编辑终极指南:从零开始掌握免费专业工具

Audacity音频编辑终极指南:从零开始掌握免费专业工具 【免费下载链接】audacity Audio Editor 项目地址: https://gitcode.com/GitHub_Trending/au/audacity Audacity是一款功能强大的开源音频编辑软件,支持多轨录音、音频剪辑和效果处理&#x…...

SYSTEM表空间自动增长却报ORA-01658?Oracle19C表空间管理的那些坑

Oracle 19C SYSTEM表空间自动增长失效的深度解析与实战指南 引言 在Oracle数据库管理中,SYSTEM表空间扮演着核心角色,它存储着数据字典、系统存储过程等关键元数据。然而,许多DBA在实际工作中都遇到过这样的困惑:明明设置了AUTOEX…...

Golang面试避坑指南:这5个并发问题90%的人答不对

Golang面试避坑指南:这5个并发问题90%的人答不对 刚接触Go语言的开发者往往会被其简洁的语法和高效的并发模型所吸引,但真正深入使用后才会发现,并发编程中隐藏着许多意想不到的陷阱。特别是在技术面试中,面试官常常会通过精心设计…...

EasyAnimateV5-7b-zh-InP多GPU分布式训练指南

EasyAnimateV5-7b-zh-InP多GPU分布式训练指南 1. 引言 如果你正在训练EasyAnimateV5这样的大模型,可能会发现单块GPU的训练速度实在太慢了。一张图片可能需要几分钟,一个完整的训练周期可能要花上好几天。这时候,多GPU分布式训练就成了必备…...

别再死记硬背了!用华为eNSP图解OSPF、VRRP这些协议到底怎么用

用华为eNSP图解网络协议:从抽象概念到可视化实战 网络协议学习常常陷入"理论-记忆-遗忘"的循环,OSPF的邻居状态机、VRRP的主备切换机制、STP的根桥选举过程,这些在教材中冰冷的概念,如何转化为可感知的网络行为&#xf…...

LFM2.5-1.2B-Thinking-GGUF多轮对话效果展示:复杂任务规划与分解

LFM2.5-1.2B-Thinking-GGUF多轮对话效果展示:复杂任务规划与分解 1. 开场亮点 当被问到"帮我策划一次团队建设活动"时,LFM2.5-1.2B-Thinking-GGUF模型展现出了令人惊喜的"思考"能力。不同于简单的一问一答,这个模型能够…...

大多数开发者还以为2026年AI编码拼的是模型,其实竞争早已转向系统架构

最近刷到Qoder和几个大厂的分享,我瞬间意识到:AI编码的战场已经彻底变天了。 很多人还在卷模型参数、卷上下文长度,以为下一个SOTA模型出来就能让Agent“起飞”。但真实情况是——Stripe每周合并1300个完全由Agent写的PR,Ramp有30…...

Jupyter Notebook快速入门:从安装到高效编码

1. 为什么你需要Jupyter Notebook? 第一次听说Jupyter Notebook时,我也觉得这不过是个普通的代码编辑器。直到真正用起来才发现,它完全改变了我的编程工作流。想象一下,你正在写一个数据分析脚本,传统方式需要反复运行…...

别再死记硬背了!用Vivado工具链图解FPGA底层:CLB、SLICE与LUT到底怎么连的?

用Vivado工具链图解FPGA底层:从代码到硬件的可视化之旅 当你在Vivado中编写完一段Verilog代码,点击综合按钮后,那些抽象的硬件描述究竟是如何变成FPGA芯片上实实在在的电路连接的?对于初学者来说,CLB、SLICE、LUT这些概…...