相机几何与标定:从三维世界到二维图像的映射
本系列课程将带领读者开启一场独特的三维视觉工程之旅。我们不再止步于教科书式的公式推导,而是聚焦于如何将抽象的数学原理转化为可落地的工程实践。通过解剖相机的光学特性、构建成像数学模型、解析坐标系转换链条,直至亲手实现参数标定代码,我们将层层剥开三维视觉系统的核心构造。
在这场旅程中,您将理解为何简单的针孔模型能衍生出自动驾驶的感知算法,掌握透镜畸变参数如何影响AR眼镜的虚实配准精度,洞悉坐标系转换矩阵怎样支撑工业机器人的空间定位。我们特别设计了"理论-建模-代码"三位一体的讲解框架,使三维重建的数学原理真正可编程、可调试、可优化。
第一章:相机几何与标定——为什么我们需要关注它?
想象一下,你正在用手机拍摄一张照片。你按下快门,咔嚓一声,一张美丽的风景照就诞生了。但你知道吗?在这看似简单的动作背后,隐藏着一个复杂的数学世界——相机几何。它就像是一把钥匙,帮我们打开从三维世界到二维图像的神秘之门。
1. 相机几何:从三维到二维的魔法

1.1 为什么我们需要相机几何?
我们生活在一个三维的世界里,但相机拍出来的照片却是二维的。那么,相机是如何把立体的世界“压扁”成平面的呢?这就是相机几何要解决的问题。
-
针孔相机的启示:
想象一个小黑屋,墙上开了一个小孔,外面的光线通过这个小孔在屋内形成倒立的图像。这就是最简单的相机模型——针孔相机。它告诉我们,光线通过一个点(小孔)可以在平面上形成图像。 -
透镜的加入:
但针孔相机有个问题:图像太暗了!于是,我们加入了透镜。透镜就像是一个魔法师,它能把更多的光线聚焦到成像平面上,让图像变得更亮。但魔法师也有自己的脾气——它引入了畸变和失焦等问题。
1.2 相机几何的作用
相机几何的核心任务就是描述三维世界中的点如何映射到二维图像上。它帮我们回答以下问题:
- 为什么远处的物体看起来更小?
- 为什么平行的铁轨在照片中会相交?
- 为什么我的照片边缘会变形?
2. 相机标定:相机的“体检报告”
2.1 什么是相机标定?
相机标定就像是给相机做一次全面的体检。我们需要知道相机的“健康状况”——它的焦距、主点位置、畸变参数等。这些参数决定了相机如何“看”世界。
2.2 为什么我们需要相机标定?
-
精确建模:
如果你想让机器人用相机测量物体的距离,或者让无人机用相机导航,你必须知道相机的内部参数。否则,机器人可能会把1米误认为2米,无人机可能会撞墙。 -
消除畸变:
透镜会引入畸变,让直线变弯。通过标定,我们可以校正这些畸变,让图像更真实。 -
多相机协同:
在VR、AR或者电影特效中,常常需要多个相机协同工作。只有通过标定,才能确保这些相机“看”到的是同一个世界。
3. 相机几何与标定的应用场景
3.1 三维重建
通过多张照片,我们可以重建出三维场景。比如,考古学家可以用它重建古遗址,建筑师可以用它生成建筑物的三维模型。
3.2 自动驾驶
自动驾驶汽车依赖相机感知周围环境。通过相机几何,汽车可以计算其他车辆的距离和速度,避免碰撞。
3.3 虚拟现实(VR)与增强现实(AR)
在VR和AR中,相机几何帮我们精确地将虚拟物体叠加到现实世界中。比如,你可以在手机上看到虚拟的恐龙在你的房间里走来走去。
3.4 电影特效
在电影中,特效师用相机几何将CG角色无缝地融入实景拍摄中。比如,《阿凡达》中的潘多拉星球就是通过相机几何与现实场景完美结合的。
4. 总结:相机几何与标定——连接现实与数字的桥梁
相机几何与标定不仅仅是枯燥的数学公式,它是连接现实世界与数字世界的桥梁。无论是拍一张照片,还是让机器人自主导航,都离不开它。所以,下次当你按下快门时,不妨想一想:在这张照片背后,隐藏着一个多么神奇的数学世界
第二章 光圈,景深,焦距
1. 光圈(Aperture)

光圈是镜头中调节进光孔大小的装置,通常用f值表示,例如f/1.4、f/2.8、f/8等。光圈值越小,光圈越大,进光量越多;光圈值越大,光圈越小,进光量越少。光圈不仅控制进光量,还影响景深。大光圈(如f/1.4)会产生浅景深,背景虚化效果明显;小光圈(如f/16)则会产生深景深,背景和前景都较为清晰
2. 景深(Depth of Field, DOF)
景深是指照片中清晰成像的范围。景深的大小受光圈、焦距和拍摄距离的影响:
- 光圈:光圈越大(f值越小),景深越浅;光圈越小(f值越大),景深越深。
- 焦距:焦距越长,景深越浅;焦距越短,景深越深。
- 拍摄距离:拍摄距离越近,景深越浅;拍摄距离越远,景深越深。
景深的计算公式为:

其中,N是光圈值,c是容许弥散圆直径,m是放大倍率
3. 焦距(Focal Length)
焦距是指镜头中心到成像平面的距离,通常以毫米(mm)为单位。焦距决定了镜头的视角和放大倍率:
- 短焦距(如24mm):视角广,适合拍摄风景或大场景。
- 长焦距(如200mm):视角窄,适合拍摄远距离物体或特写。
焦距还影响景深,长焦距镜头更容易产生浅景深,而短焦距镜头则更容易产生深景深。
总结
- 光圈控制进光量和景深,大光圈适合拍摄人像,小光圈适合拍摄风景。
- 景深决定了照片中清晰的范围,受光圈、焦距和拍摄距离的影响。
- 焦距决定了镜头的视角和放大倍率,短焦距适合广角拍摄,长焦距适合远摄。
第三章:相机成像模型
相机成像模型是计算机视觉的基石,它描述了三维世界中的点如何映射到二维图像上。在这一章中,我们将从直观理解出发,逐步深入到数学公式,最后用Python代码实现一个简单的相机成像模型。
1. 针孔相机模型:最简单的成像原理
1.1 什么是针孔相机模型?
针孔相机模型是相机成像的最基础模型。它假设光线通过一个极小的孔(针孔)在成像平面上形成图像。
-
核心思想:
光线从物体上的某一点出发,通过针孔,最终在成像平面上形成一个点。所有点的集合就构成了完整的图像。 -
特点:
- 图像是倒立的
- 没有透镜,因此没有畸变
- 图像亮度较低(因为只有少量光线通过针孔)
1.2 数学建模
假设三维空间中的点 P=(X,Y,Z) 通过针孔相机投影到成像平面上的点 p=(x,y)。
根据相似三角形原理,可以得到:

其中,f 是焦距,表示针孔到成像平面的距离。
1.3 针孔相机的局限性
针孔相机局限性主要体现在以下几个方面,这些局限性不仅影响了其成像效果,也限制了其应用场景:
-
光圈限制:针孔相机的光圈大小受到针孔直径的限制,无法调节。这意味着在光线较暗的环境下,针孔相机需要更长的曝光时间,导致照片模糊。此外,小光圈也限制了相机的进光量,使得拍摄动态场景或高速运动物体时难以捕捉清晰的图像
- 分辨率限制:由于针孔的直径有限,针孔相机的分辨率相对较低,无法捕捉非常精细的图像细节。针孔直径越小,虽然成像的细节越清晰,但光线通过的数量也越少,需要更长的曝光时间。反之,针孔直径越大,光线通过的数量越多,但成像的细节就越模糊
-
无法实时调整:针孔相机无法进行实时调整,如调整焦距和光圈大小等参数。这使得拍摄者需要事先对光线和构图等方面进行充分的计算和准备,增加了拍摄的难度
-
衍射效应:当针孔直径过小时,光线通过针孔时会发生衍射现象,导致图像模糊。因此,针孔直径的选择需要在清晰度和进光量之间找到平衡。
2. 透镜的作用原理与机制
2.1 为什么需要透镜?
为了解决针孔相机图像太暗的问题,我们引入了透镜。透镜能够将更多的光线聚焦到成像平面上,从而提高图像的亮度。
2.2 透镜的基本原理
透镜通过折射改变光线的传播方向,使得从物体发出的光线能够汇聚到成像平面上的某一点。
-
焦点(Focal Point):
平行于光轴的光线通过透镜后会汇聚到一点,称为焦点。 -
焦距(Focal Length):
透镜中心到焦点的距离,记作 f。焦距决定了透镜的聚光能力和成像的大小。 -
成像公式:
透镜成像遵循以下公式:

-
其中,u 是物体到透镜的距离,v 是像到透镜的距离。
2.3 透镜带来的好处
- 提高亮度:透镜能够汇聚更多光线,使图像更亮。
- 选择性聚焦:通过调整透镜位置,可以选择性地聚焦在某个距离的物体上。
2.4. 透镜存在的问题
失焦(Defocus)

上图中红圈部分出现了失焦。当物体不在焦平面上时,成像会变得模糊。这是因为光线没有汇聚到同一个点,而是形成了一个光斑。
- 景深(Depth of Field):
能够清晰成像的物体距离范围。景深越大,能够清晰成像的物体距离范围越广。
径向畸变(Radial Distortion)
透镜的曲率会导致图像边缘的直线变弯,这种现象称为径向畸变。

上图中,左图为桶形畸变,右图为枕形畸变。
-
桶形畸变(Barrel Distortion):
图像边缘向内弯曲,像桶的形状。 -
枕形畸变(Pincushion Distortion):
图像边缘向外弯曲,像枕头的形状。 -
数学模型:
径向畸变可以用多项式模型来描述

2.5 色差(Chromatic Aberration)
不同波长的光通过透镜时折射率不同,导致颜色分离。这种现象称为色差。
第四章:坐标系转换——从三维世界到二维像素的数学与代码实现
1、为什么需要坐标系转换?
在计算机视觉和摄影测量中,相机的成像过程本质上是将三维世界中的物体映射到二维图像平面的过程。这一过程涉及多个坐标系的转换,原因如下:
- 视角适配:物体在世界坐标系中的位置是固定的,但相机的视角可能随时变化,需要通过坐标系转换描述物体在相机视角下的位置。
- 三维到二维映射:三维空间中的点需要投影到二维图像平面(如相机传感器)上,形成最终的像素坐标。
- 多传感器融合:在自动驾驶、机器人导航等场景中,不同传感器(如相机、激光雷达)的数据需要统一到同一坐标系中。
2、核心坐标系的定义与理解
2.1. 世界坐标系(World Coordinate System)
- 定义:描述物体在真实三维空间中的绝对位置,通常以场景中的某个固定点(如地面原点)为基准。
![]()
2.2. 相机坐标系(Camera Coordinate System)
- 定义:以相机光心为原点,光轴为Z轴,描述物体相对于相机的位置。
- 符号:Pc=(Xc,Yc,Zc)。
2.3. 图像坐标系(Image Coordinate System)
- 定义:以相机成像平面为中心,描述点在图像平面上的物理位置(单位为米)。
- 符号:pi=(x,y)。
2.4. 像素坐标系(Pixel Coordinate System)
- 定义:以图像左上角为原点,描述点在数字图像中的像素位置。
- 符号:pp=(u,v)。
3、坐标系转换的全过程
从世界坐标系到像素坐标系的转换分为三步,涉及刚体变换、透视投影和像素缩放。
3.1. 世界坐标系 → 相机坐标系(刚体变换)
数学公式:

- R:3×3旋转矩阵,描述相机姿态。
- t:3×1平移向量,描述相机位置。
代码实现:
import numpy as np# 世界坐标系中的点(齐次坐标)
P_w = np.array([2.0, 3.0, 5.0, 1.0]) # (X_w, Y_w, Z_w, 1)# 定义相机的旋转矩阵和平移向量
R = np.array([[1, 0, 0], [0, 1, 0], [0, 0, 1]]) # 无旋转
t = np.array([0, 0, 10]) # 相机沿Z轴平移10米# 构建刚体变换矩阵
T = np.eye(4)
T[:3, :3] = R
T[:3, 3] = t# 转换为相机坐标系
P_c = T @ P_w # 结果为齐次坐标 [X_c, Y_c, Z_c, 1]
3.2. 相机坐标系 → 图像坐标系(透视投影)
数学公式:

# 相机内参矩阵(示例:焦距500像素,主点在图像中心)
K = np.array([[500, 0, 320],[0, 500, 240],[0, 0, 1]])# 提取相机坐标系中的点(非齐次坐标)
X_c, Y_c, Z_c = P_c[:3]# 透视投影到图像坐标系
x = (K[0,0] * X_c + K[0,1] * Y_c + K[0,2] * Z_c) / Z_c
y = (K[1,0] * X_c + K[1,1] * Y_c + K[1,2] * Z_c) / Z_c
3.3. 图像坐标系 → 像素坐标系(物理尺寸缩放)
数学公式:

- dx,dy:单个像素的物理尺寸(例如0.001米/像素)。
# 假设像素物理尺寸为0.001米(即1毫米/像素)
dx, dy = 0.001, 0.001# 转换为像素坐标
u = x / dx + K[0,2] # K[0,2]是u_0
v = y / dy + K[1,2] # K[1,2]是v_0
print(f"像素坐标: ({u:.1f}, {v:.1f})")
4、完整代码示例
import numpy as npdef world_to_pixel(P_w, R, t, K, dx=0.001, dy=0.001):"""将世界坐标系中的点转换到像素坐标系"""# 齐次坐标转换P_w_homogeneous = np.append(P_w, 1.0)# 刚体变换:世界坐标系 → 相机坐标系T = np.eye(4)T[:3, :3] = RT[:3, 3] = tP_c_homogeneous = T @ P_w_homogeneousX_c, Y_c, Z_c = P_c_homogeneous[:3]# 透视投影:相机坐标系 → 图像坐标系x = (K[0,0] * X_c + K[0,1] * Y_c + K[0,2] * Z_c) / Z_cy = (K[1,0] * X_c + K[1,1] * Y_c + K[1,2] * Z_c) / Z_c# 物理尺寸缩放:图像坐标系 → 像素坐标系u = x / dx + K[0,2]v = y / dy + K[1,2]return (u, v)# 示例参数
P_w = np.array([2.0, 3.0, 5.0]) # 世界坐标系中的点
R = np.eye(3) # 无旋转
t = np.array([0, 0, 10]) # 相机沿Z轴平移10米
K = np.array([[500, 0, 320],[0, 500, 240],[0, 0, 1]]) # 内参矩阵# 转换并输出结果
u, v = world_to_pixel(P_w, R, t, K)
print(f"世界坐标 {P_w} → 像素坐标 ({u:.1f}, {v:.1f})")
5. 补充:图像坐标系到像素坐标系的深入解析
5.1、问题背景:为什么说“物理尺寸缩放”容易被误解?
在之前的坐标系转换流程中,图像坐标系到像素坐标系的转换被简化为以下公式:

其中 dx,dy 表示单个像素的物理尺寸(如0.001米/像素)。
这一步骤看似简单,但实际隐含了对相机内参矩阵 K 的深度理解。许多初学者会在此处混淆以下问题:
- 内参矩阵 K 中的 fx,fy 是否已包含像素物理尺寸?
- 为什么需要额外的 dx,dy 缩放?
- 主点偏移 u0,v0 的物理意义是什么?
以下将深入剖析这一过程。
5.2、内参矩阵 K 的物理意义
5.2.1. 内参矩阵的标准形式


5.3、修正后的转换流程
5.3.1. 相机坐标系 → 图像坐标系(物理单位:米)

此时 x物理,y物理 的单位为米。
5.3.2. 图像坐标系 → 像素坐标系(单位转换)

但这一步骤实际上已被内参矩阵 K 提前完成!
正确的做法是直接使用内参矩阵 K 一步到位:

5.3.3. 物理意义验证
假设相机参数如下:
- 物理焦距 f物理=0.05米(50毫米镜头)
- 像素尺寸 dx=dy=0.0001米(10微米/像素)
则内参矩阵应为:

与代码中的 K = [[500, 0, 320], [0, 500, 240]] 一致。此时:
- 世界点 (2,3,5) 在相机坐标系中为 (2,3,5−10)=(2,3,−5)(注意Z轴方向)。
- 投影到图像平面

但结果为负值,表明该点位于相机视野外。需调整参数确保 Zc>0。
5.4、常见问题解答
5.4.1. 为什么内参矩阵 K 能隐含像素物理尺寸?
因为 fx=f物理/dx,已通过焦距和像素尺寸的比值将物理单位转换为像素单位。
5.4.2. 何时需要显式使用 dx,dy?
仅在以下场景需要:
- 需要从像素坐标反推物理坐标(如三维重建)。
- 相机标定过程中计算内参矩阵 K。
5.4.3. 主点偏移 u0,v0 的实际意义?
- 表示光轴与图像平面的交点在像素坐标系中的位置。
- 对于理想相机,u0=图像宽度/2, v0=图像高度/2。
下一篇 : 相机的参数标定
相关文章:
相机几何与标定:从三维世界到二维图像的映射
本系列课程将带领读者开启一场独特的三维视觉工程之旅。我们不再止步于教科书式的公式推导,而是聚焦于如何将抽象的数学原理转化为可落地的工程实践。通过解剖相机的光学特性、构建成像数学模型、解析坐标系转换链条,直至亲手实现参数标定代码࿰…...
GPTQ - 生成式预训练 Transformer 的精确训练后压缩
GPTQ - 生成式预训练 Transformer 的精确训练后压缩 flyfish 曾经是 https://github.com/AutoGPTQ/AutoGPTQ 现在是https://github.com/ModelCloud/GPTQModel 对应论文是 《Accurate Post-Training Quantization for Generative Pre-trained Transformers》 生成式预训练Tr…...
【Python项目】基于深度学习的电影评论情感分析系统
【Python项目】基于深度学习的电影评论情感分析系统 技术简介:采用Python技术、Flask框架、MySQL数据库、Word2Vec模型等实现。 系统简介:该系统基于深度学习技术,特别是Word2Vec模型,用于分析电影评论的情感倾向。系统分为前台…...
Redis特性总结
一、速度快 正常情况下,Redis 执⾏命令的速度⾮常快,官⽅给出的数字是读写性能可以达到 10 万 / 秒,当然这也取决于机器的性能,但这⾥先不讨论机器性能上的差异,只分析⼀下是什么造就了 Redis 如此之快,可以…...
深入理解PHP的内存管理与优化技巧
深入理解PHP的内存管理与优化技巧 PHP作为一种广泛使用的服务器端脚本语言,其内存管理机制对于应用程序的性能和稳定性至关重要。本文将深入探讨PHP的内存管理机制,并提供一些优化技巧,帮助开发者更好地理解和优化PHP应用程序的内存使用。 …...
java常见的几种并发安全问题及解决方案
项目场景: 并发的应用场景,在开发过程会经常遇到。 例如:服务应用启动后,需要简单统计接口的总访问量;实时更新订单状态,成交总额。 问题描述: 比如统计接口访问次数,如下的实现&a…...
介绍一下安装时情况 kubernetes 集群
1.安装命令执行完毕 最开始告诉我们应用的版本 v1.29.14前置检测下载镜像写入证书因为当前我们所有的 kubernetes 集群的组件之间的联通 都是基于HTTPS协议实现的 补充知识点:BS架构,即Browser/Server(浏览器/服务器)架构模式&a…...
Dify部署踩坑指南(Windows+Mac)
组件说明 Dify踩坑及解决方案 ⚠️ 除了修改镜像版本,nginx端口不要直接修改docker-compose.yaml !!!!!!! 1、更换镜像版本 这个文件是由.env自动生成的,在.env配置 …...
安科瑞新能源充电桩解决方案:驱动绿色未来,赋能智慧能源
安科瑞顾强 引言 在“双碳”目标与新能源汽车产业高速发展的双重驱动下,充电基础设施正成为能源转型的核心环节。安科瑞电气股份有限公司凭借在电力监控与能效管理领域20余年的技术积淀,推出新一代新能源充电桩解决方案,以智能化、高兼容性…...
深入剖析Java代理模式:静态代理与动态代理的实战应用
代理模式是Java开发中最重要的设计模式之一,广泛应用于性能监控、访问控制、日志记录等场景。本文将带你全面掌握代理模式的实现原理,并通过3种不同的代码实现方式,彻底理解这一核心设计模式的应用技巧。 一、代理模式的核心价值 代理模式(Proxy Pattern)通过创建代理对…...
JVM与性能调优详解
以下是关于 JVM与性能调优 的详细解析,结合理论、实践及常见问题,分多个维度展开: 一、JVM性能调优的核心目标 性能调优的核心目标是通过优化内存管理、垃圾回收(GC)策略和线程管理,实现以下平衡ÿ…...
【嵌入式通信协议】串口的详细介绍
以下是对嵌入式STM单片机通信串口的详细介绍 一、STM32串口通信基础 STM32的串口模块称为USART(Universal Synchronous/Asynchronous Receiver/Transmitter),支持同步和异步通信;而UART(Universal Asynchronous Receiver/Transmitter)仅支持异步通信。STM32F103C8T6包含…...
乐鑫打造全球首款 PSA Certified Level 2 RISC-V 芯片
乐鑫科技 (688018.SH) 荣幸宣布 ESP32-C6 于 2025 年 2 月 20 日获得 PSA Certified Level 2 认证。这一重要突破使 ESP32-C6 成为全球首款基于 RISC-V 架构获此认证的芯片,体现了乐鑫致力于为全球客户提供安全可靠、性能卓越的物联网解决方案的坚定承诺。 PSA 安全…...
Go学习笔记:基础语法3
1. 常量 Go语言中的常量使用关键字const定义,用于存储不会改变的数据,常量是在编译时被创建的,即使定义在函数内部也是如此,并且只能是布尔型、数字型(整数型、浮点型和复数)和字符串型。 由于编译时的限…...
虚拟卡 WildCard (野卡) 保姆级开卡教程
本文首发于只抄博客,欢迎点击原文链接了解更多内容。 前言 本篇教程为 WildCard 的介绍以及开卡教学,要了解不同平台(Grok、Talkatone 等)的订阅方式请移步《订阅教程》分类 当我们想要充值国外平台会员时,一般都需要使…...
机试准备第10天
首先学习二分搜索法。使用二分查找需要先排序。第一题是查找,现学现卖。 //二分查找 #include <stdio.h> #include <vector> #include <algorithm> using namespace std; int main(){int n;scanf("%d", &n);vector<int> a(n…...
Apache ECharts介绍(基于JavaScript开发的开源数据可视化库,用于创建交互式图表)
文章目录 Apache ECharts 介绍功能概览多种图表类型- **基础类型**:折线图、柱状图、饼图、散点图。- **高级类型**:雷达图、热力图、桑基图、K线图。- **地理可视化**:支持地图(如中国、世界)和地理坐标系。- **3D支持…...
最新版本TOMCAT+IntelliJ IDEA+MAVEN项目创建(JAVAWEB)
前期所需: 1.apache-tomcat-10.1.18-windows-x64(tomcat 10.1.8版本或者差不多新的版本都可以) 2.IntelliJ idea 24年版本 或更高版本 3.已经配置好MAVEN了(一定先配置MAVEN再搞TOMCAT会事半功倍很多) 如果有没配置…...
Linux - 进程通信
一、管道 管道是一种进程间通信(IPC)机制,用于在进程之间传递数据。它的本质是操作系统内核维护的一个内存缓冲区,配合文件描述符进行数据的读写。尽管管道的核心是内存缓冲区,但操作系统通过对管道的实现,…...
使用 Arduino 的 WiFi 控制机器人
使用 Arduino 的 WiFi 控制机器人 这次我们将使用 Arduino 和 Blynk 应用程序制作一个 Wi-Fi 控制的机器人。这款基于 Arduino 的机器人可以使用任何支持 Wi-Fi 的 Android 智能手机进行无线控制。 为了演示 Wi-Fi 控制机器人,我们使用了一个名为“Blynk”的 Andr…...
深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...
TDengine 快速体验(Docker 镜像方式)
简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能,本节首先介绍如何通过 Docker 快速体验 TDengine,然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker,请使用 安装包的方式快…...
突破不可导策略的训练难题:零阶优化与强化学习的深度嵌合
强化学习(Reinforcement Learning, RL)是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程,然后使用强化学习的Actor-Critic机制(中文译作“知行互动”机制),逐步迭代求解…...
在rocky linux 9.5上在线安装 docker
前面是指南,后面是日志 sudo dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo dnf install docker-ce docker-ce-cli containerd.io -y docker version sudo systemctl start docker sudo systemctl status docker …...
GitHub 趋势日报 (2025年06月08日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...
Caliper 配置文件解析:config.yaml
Caliper 是一个区块链性能基准测试工具,用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构,并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析 这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件,主要包含以下几个部…...
【论文阅读28】-CNN-BiLSTM-Attention-(2024)
本文把滑坡位移序列拆开、筛优质因子,再用 CNN-BiLSTM-Attention 来动态预测每个子序列,最后重构出总位移,预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵(S…...
vue3+vite项目中使用.env文件环境变量方法
vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...
OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 GPU 上对图像执行 均值漂移滤波(Mean Shift Filtering),用于图像分割或平滑处理。 该函数将输入图像中的…...
面向无人机海岸带生态系统监测的语义分割基准数据集
描述:海岸带生态系统的监测是维护生态平衡和可持续发展的重要任务。语义分割技术在遥感影像中的应用为海岸带生态系统的精准监测提供了有效手段。然而,目前该领域仍面临一个挑战,即缺乏公开的专门面向海岸带生态系统的语义分割基准数据集。受…...
