当前位置：首页 > news >正文

双目的一些文章学习

news 2026/2/8 17:13:52

文章1 PSMNet

https://arxiv.org/pdf/1803.08669
PSMNet文章博客
PSMNet文章中牵涉到的一些知识，空洞卷积，SPPNet网络，计算视差时用soft argmin代替argmin
文章中引入了空洞卷积和SPPNet网络来融合多尺度的信息，又引入3D卷积来增加模型的表现能力，引入了soft argmin来拟合视差，在计算loss方面，从中间层就引出对视差的loss进行加权得到总的loss

文章2 GCNet

论文https://arxiv.org/pdf/1703.04309
GCNet文章博客，博客1
文章中引入了3D卷积，并引入了3D卷积的沙漏结构，又首次提出了soft argmin代替argmin拟合视差，可以得到连续的视差值，消融实验证明了3D卷积结构和soft argmin拟合视差的有效性

文章3 stereoNet

论文https://arxiv.org/pdf/1807.08865
stereoNet博客
stereoNet代码
主要贡献时为了实时性，通过降低在计算costvolume之间的feature的分辨率增加了实时性，而降低分辨率性能并没有降低，但是出来初始的视差会因分辨率不高而没有细节，接着后面让左图和初始视差图concat作为输入，进行空洞卷积[conv+resblockx6+conv]，增加细节特征，输出视差的残差，视差+残差作为新视差，该模块迭代多次不断优化细节，每个阶段都是inchannel=3+1,outchannel=1。最终的loss时soft L1 loss

文章4 AnyNet

论文https://arxiv.org/pdf/1810.11408
AnyNet 博客，博客1
文章的主要贡献在于灵活，可以在线根据需求输出每个阶段的视差，提取特征用的Unet，会输出多个分辨率下的特征图，视差/残差估计用的Disparity Network，就是cost volume + 3D conv + disparity regression,输出视差/残差，如果只需要第一阶段的视差就满足要求，第2、3阶段的残差就不需要计算了，也就是本文的亮点，灵活，最后视差图又经过了一个SPNet来锐化视差图

文章5 HSM-Net

论文https://arxiv.org/pdf/1912.06704
HSM-Net 博客，博客1
提取特征阶段利用类似Unet结构，提取多尺度的特征信息，这其中在沙漏最细的最后一层，插入了SPP网络，主要是增加感受野，SPP不同pooling的结果进行了等权重0.25的相加作为这一层的最终特征，然后每种分辨率的特征图都构建cost volume，共4个分辨率的cost volume，分别送入volume解码模块，解码模块也是一些卷积操作，conv3d+SPP+upConv3d，其中SPP中的操作和上一阶段特征提取的操作类似也是等权重0.25的加权，每个decoder都输出两个，一个叫做feature volume, 一个叫做cost volume，其中feature volume输入到下一阶段的docoder，而cost volume代表当前阶段的匹配误差，要哪个阶段的输出，直接使用soft argmin计算得到视差
使用自动驾驶仿真平台生成一些合成数据

文章6 FADNet

论文 https://arxiv.org/pdf/2003.10758
FADNet 博客，博客1
FADNet是沿用了DispNet的结构，在DispNet上进行修改，将特征提取的conv2d层替换成dual-resblock，即残差模块以增加网络深度，在cost volume时做了消融实验，证明D=20时效果最好，太大和太小会造成拟合不足或者过拟合。两个网络RB-NetC预测多尺度视差，RB-NetS预测多尺度视差的残差，因为有多尺度的视差预测，在训练时，引入了随着训练步数的增加，逐渐增加大尺寸的预测视差权重，直到为1.0，达到从粗到细的目的，因为是3Dconv所以比较好部署，速度也快

文章 7 AANet

论文 https://arxiv.org/pdf/2004.09548
AANet 博客，更总结的博客1
文章中有个知识点叫做可变卷积 deformable conv，原理博客，代码实现
AANet主要有两个贡献点，一个是同尺度内的自适应的聚合模块，其实使用deformable conv实现的，即可变卷积实现，主要为了解决视差不连续处的边缘膨胀问题，自适应的聚合就可以灵活的查找更有效的聚合点，本质上可变卷积就是用一个单独的conv学一个offset,加到传统卷积的位置上，另一个贡献是不同尺度间的聚合模块，是为了解决弱纹理区域匹配问题，小尺度的cost volume在弱纹理区域更具有分辨性，所以多尺度间融合是有必要的，其实就是上采样和下采样后累加起来，这两个模块组合起来乘坐AAmodels，我们使用了6次 AAmodels，视差采用soft argmin 拟合，loss采用平滑L1 loss

文章 8 RAFT-stereo

论文 http://arxiv.org/pdf/2109.07547
RAFT-stereo 博客
文章中的知识点用于计算cost volume torch.einsum，迭代模块GRU，GRU视频解释，看不懂直接当做一个模块【像resblock】使用即可

自动驾驶仿真器平台

https://zhuanlan.zhihu.com/p/105492011

https://github.com/princeton-vl/infinigen?tab=readme-ov-file

https://arxiv.org/pdf/2312.00343
High-frequency Stereo Matching Network

双目的一些文章学习

文章1 PSMNet https://arxiv.org/pdf/1803.08669PSMNet文章博客PSMNet文章中牵涉到的一些知识，空洞卷积，SPPNet网络，计算视差时用soft argmin代替argmin文章中引入了空洞卷积和SPPNet网络来融合多尺度的信息，又引入3D卷积来增加模…...

编程日记 2025/1/8 5:09:52

开源模型应用落地-qwen2-7b-instruct-LoRA微调合并-ms-swift-单机单卡-V100（十三）

一、前言本篇文章将使用ms-swift去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low-Rank Adaptation) 用于微调大型语言模型 (LLM)。是一种有效的自适应策略，…...

编程日记 2025/1/8 4:54:38

【C++面向对象——类与对象】CPU类（头歌实践教学平台习题）【合集】

目录😋 任务描述相关知识一、类的声明和使用 1. 类的声明基础 2. 类的访问控制 3. 类的使用二、类的声明和对象的声明 1. 类声明中的函数定义 2. 对象声明的多种方式三、构造函数和析构函数的执行过程 1. 构造函数 2. 析构函数实验步骤测试说明…...

编程日记 2025/1/8 4:52:34

性能测试05|JMeter：分布式、报告、并发数计算、性能监控

目录一、JMeter分布式 1、应用场景 2、原理 3、分布式相关注意事项 4、分布式配置与运行二、JMeter报告 1、聚合报告 2、HTML报告三、并发用户数（线程数）计算四、JMeter下载第三方插件五、性能监控 1、Concurrency Thread Group 线程组…...

编程日记 2025/1/8 4:49:30

关于Java面试题大全网站无法访问的解决方案

如果Java面试题大全网站无法访问，你仍然可以通过以下渠道获取高质量的Java面试题资源： 1. 国内网站牛客网： 网址：https://www.nowcoder.com/特点：提供大量Java面试题和在线编程练习，适合刷题和模拟面试。推…...

编程日记 2025/1/8 4:48:29

CSS进阶和SASS

目录一、CSS进阶 1.1、CSS变量 1.2、CSS属性值的计算过程 1.3、做杯咖啡 1.4、下划线动画 1.5、CSS中的混合模式(Blending) 二、SASS 2.1、Sass的颜色函数 2.2、Sass的扩展(extend)和占位符(%)、混合(Mixin) 2.3、Sass的数学函数 2.4、Sass的模块化开发 2.5、Sass…...

编程日记 2025/1/8 4:39:21

SwiftUI 撸码常见错误 2 例漫谈

概述在 SwiftUI 日常撸码过程中，头发尚且还算茂盛的小码农们经常会犯这样那样的错误。虽然犯这些错的原因都很简单，但有时想要快速准确的定位它们却并不容易。况且这些错误还可能在模拟器和 Xcode 预览（Preview）表现的行为不甚…...

编程日记 2025/1/8 4:36:16

JavaScript系列（9）-- Set数据结构专题

JavaScript Set数据结构专题 🎲 在前八篇文章中，我们探讨了JavaScript的语言特性、ECMAScript标准、引擎工作原理、数值类型、字符串处理、Symbol类型、Object高级特性和Array高级操作。今天，让我们深入了解JavaScript中的Set数据结构。Set是…...

编程日记 2025/1/8 4:33:14

开发培训-慧集通（iPaaS）集成平台脚本开发Groovy基础培训视频

‌Groovy‌是一种基于Java虚拟机（JVM）的敏捷开发语言，结合了Python、Ruby和Smalltalk的许多强大特性。它旨在提高开发者的生产力，通过简洁、熟悉且易于学习的语法，Groovy能够与Java代码无缝集成，并提供强大…...

编程日记 2025/1/8 4:30:09

【软考网工笔记】计算机基础理论与安全——网络规划与设计

HFC 混合光纤同轴电缆网 HFC: Hybrid Fiber - Coaxial 的缩写，即混合光纤同轴电缆网。是一种经济实用的综合数字服务宽带网接入技术。 HFC 通常由光纤干线、同轴电缆支线和用户配线网络三部分组成，从有线电视台出来的节目信号先变成光信号在干线上传输…...

编程日记 2025/1/8 4:27:07

【设计模式】基本原则、设计模式分类

设计模式设计模式是软件工程中的一种通用术语，指的是针对特定问题的经过实践验证的解决方案。设计模式并不是最终的代码实现，而是描述了如何解决某一类问题的思路和方法。如果熟悉了设计模式，当遇到类似的场景，我们可以快速地…...

编程日记 2025/1/8 4:24:04

mac m2 安装 docker

文章目录安装1.下载安装包2.在downloads中打开3.在启动台打开打开终端验证修改国内镜像地址小结安装 1.下载安装包到官网下载适配的安装包：https://www.docker.com/products/docker-desktop/ 2.在downloads中打开拖过去 3.在启动台打开选择推荐设置 …...

编程日记 2025/1/8 4:23:00

Vue3-pinia的具体使用和刷新页面状态保持解决方案

在 Vue 3 中，Pinia 是一个官方推荐的状态管理库，它替代了 Vuex（Vuex在Vue3中依然可以正常使用），提供了更加简洁和现代的 API，同时能够与 Vue 3完美配合。在本回答中，我们将详细介绍 Pinia 的使用…...

编程日记 2025/1/8 4:21:59

用ResNet50+Qwen2-VL-2B-Instruct+LoRA模仿Diffusion-VLA的论文思路，在3090显卡上训练和测试成功

想一步步的实现Diffusion VLA论文的思路，不过论文的图像的输入用DINOv2进行特征提取的，我先把这个部分换成ResNet50。老铁们，直接上代码： from PIL import Image import torch import torchvision.models as models from torch…...

编程日记 2025/1/8 4:18:56

创建.net core 8.0项目时，有个启用原生AOT发布是什么意思

启用原生 AOT 发布（Native AOT publishing） 是指在 .NET 6 及更高版本中使用 Ahead-of-Time (AOT) 编译技术，将应用程序提前编译为本地机器代码，从而生成更高效、更快速启动的可执行文件。 1. AOT 编译是什么？ AOT …...

编程日记 2025/1/8 4:15:53

2.1.7-1 io_uring的使用

一、背景 （1）下面几个有关异步操作的例子： a）客户端和服务端的异步关系，就是客户端发送请求后不需要等待结果，接下来发送其他请求。 b）对于服务端，客户端来请求后，服务…...

编程日记 2025/1/8 4:12:48

群论学习笔记

什么是对称？ 对称是一个保持对象结构不变的变换，对称是一个过程，而不是一个具体的事物，伽罗瓦的对称是对方程根的置换，而一个置换就是对一系列事物的重排方式，严格的说，它也并不是这个重排本身…...

编程日记 2025/1/8 4:09:45

深入解析-正则表达式

学习正则，我们到底要学什么？ 正则表达式（RegEx）是一种强大的文本匹配工具，广泛应用于数据验证、文本搜索、替换和解析等领域。学习正则表达式，我们不仅要掌握其语法规则，还需要学会如何高效地利…...

编程日记 2025/1/8 4:05:40

yolov5核查数据标注漏报和误报

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、误报二、漏报三、源码总结前言本文主要用于记录数据标注和模型预测之间的漏报和误报思想及其源码提示：以下是本篇文章正文内容，…...

编程日记 2025/1/8 4:04:39

日志聚类算法 Drain 的实践与改良

在现实场景中，业务程序输出的日志往往规模庞大并且类型纷繁复杂。我们在查询和查看这些日志时，平铺的日志列表会让我们目不暇接，难以快速聚焦找到重要的日志条目。在观测云中，我们在日志页面提供了聚类分析功能，可以…...

编程日记 2025/1/8 3:55:31

【网络】每天掌握一个Linux命令 - iftop

在Linux系统中，iftop是网络管理的得力助手，能实时监控网络流量、连接情况等，帮助排查网络异常。接下来从多方面详细介绍它。目录【网络】每天掌握一个Linux命令 - iftop工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景…...

编程新知 2025/10/10 17:03:53

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

借阿里云中企出海大会的东风，以**「云启出海，智联未来｜打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办，现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...

编程新知 2026/1/30 0:00:28

// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...

编程新知 2026/1/25 3:21:09

第25节 Node.js 断言测试

Node.js的assert模块主要用于编写程序的单元测试时使用，通过断言可以提早发现和排查出错误。稳定性: 5 - 锁定这个模块可用于应用的单元测试，通过 require(assert) 可以使用这个模块。 assert.fail(actual, expected, message, operator) 使用参数…...

编程新知 2025/10/11 0:24:31

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

在现代战争中，电磁频谱已成为继陆、海、空、天之后的 “第五维战场”，雷达作为电磁频谱领域的关键装备，其干扰与抗干扰能力的较量，直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器，凭借数字射…...

编程新知 2026/2/1 7:18:47

mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包

文章目录现象：mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时，可能是因为以下几个原因：1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

编程新知 2026/2/4 16:17:25

CSS设置元素的宽度根据其内容自动调整

width: fit-content 是 CSS 中的一个属性值，用于设置元素的宽度根据其内容自动调整，确保宽度刚好容纳内容而不会超出。效果对比默认情况（width: auto）： 块级元素（如 <div>）会占满父容器…...

编程新知 2025/10/16 16:03:09

HDFS分布式存储 zookeeper

hadoop介绍狭义上hadoop是指apache的一款开源软件用java语言实现开源框架，允许使用简单的变成模型跨计算机对大型集群进行分布式处理（1.海量的数据存储 2.海量数据的计算）Hadoop核心组件 hdfs（分布式文件存储系统）&a…...

编程新知 2026/1/24 4:10:44

return this；返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请，不同级别的经理有不同的审批权限： // 抽象处理者：审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

编程新知 2026/1/28 21:45:43