PointPillars:数据预处理
在 PointPillars 算法中,将点云划分为点柱(Pillars)是核心步骤之一,用于将稀疏点云数据转换为规则的张量表示,方便后续 2D 卷积操作。以下是点云划分为点柱的具体方法和实现步骤:
1. 点云划分为网格
将 3D 空间划分为规则的网格,形成柱状区域(Pillars)。
操作步骤:
-
定义网格范围和分辨率:
- 确定点云的空间范围,例如:
X min , X max , Y min , Y max , Z min , Z max X_{\text{min}}, X_{\text{max}}, Y_{\text{min}}, Y_{\text{max}}, Z_{\text{min}}, Z_{\text{max}} Xmin,Xmax,Ymin,Ymax,Zmin,Zmax - 设置网格分辨率(Pillar 尺寸):
Δ X , Δ Y \Delta X, \Delta Y ΔX,ΔY
例如,每个 Pillar 的大小为 0.16 × 0.16 m 0.16 \times 0.16 \, \text{m} 0.16×0.16m。
- 确定点云的空间范围,例如:
-
计算网格索引:
- 对每个点 ( x , y , z ) (x, y, z) (x,y,z),计算其在网格中的索引:
u = ⌊ x − X min Δ X ⌋ , v = ⌊ y − Y min Δ Y ⌋ u = \lfloor \frac{x - X_{\text{min}}}{\Delta X} \rfloor, \quad v = \lfloor \frac{y - Y_{\text{min}}}{\Delta Y} \rfloor u=⌊ΔXx−Xmin⌋,v=⌊ΔYy−Ymin⌋ - u , v u, v u,v 分别是点在 X X X 和 Y Y Y 方向上的网格索引。
- 对每个点 ( x , y , z ) (x, y, z) (x,y,z),计算其在网格中的索引:
2. 构建 Pillar 数据结构
每个 Pillar 中包含若干点的特征(点云数据是稀疏的,因此部分 Pillar 可能没有点)。
操作步骤:
-
点分组:
- 将所有点根据其网格索引分配到对应的 Pillar 中。
- 例如,第 ( u , v ) (u, v) (u,v) 个 Pillar 包含所有满足条件的点:
P pillar ( u , v ) = { ( x , y , z , i ) ∣ 点的索引为 ( u , v ) } P_{\text{pillar}}(u, v) = \{ (x, y, z, i) \mid \text{点的索引为 } (u, v) \} Ppillar(u,v)={(x,y,z,i)∣点的索引为 (u,v)}
-
固定点数量:
- 为了适配神经网络,每个 Pillar 中的点数量固定为 N max N_{\text{max}} Nmax:
- 如果点数超过 N max N_{\text{max}} Nmax,随机采样。
- 如果点数不足 N max N_{\text{max}} Nmax,用零点填充。
- 为了适配神经网络,每个 Pillar 中的点数量固定为 N max N_{\text{max}} Nmax:
-
特征提取:
对每个点提取以下特征:- ( x , y , z , i ) (x, y, z, i) (x,y,z,i):点的原始坐标和反射强度。
- 相对坐标(相对于 Pillar 中心的偏移量):
Δ x = x − x pillar center , Δ y = y − y pillar center \Delta x = x - x_{\text{pillar center}}, \quad \Delta y = y - y_{\text{pillar center}} Δx=x−xpillar center,Δy=y−ypillar center
-
形成固定维度的张量:
- 对每个 Pillar,构造 N max × D N_{\text{max}} \times D Nmax×D 的特征矩阵,其中 D D D 是特征维度(例如,原始坐标 + 相对坐标 + 强度)。
3. BEV (Bird’s Eye View) 特征图
将所有 Pillar 的特征投影到 BEV 平面,形成伪影像特征图。
操作步骤:
-
初始化 BEV 特征图:
- 创建一个固定大小的张量 ( H , W , C ) (H, W, C) (H,W,C),对应网格的高度、宽度和通道数。
- H = X max − X min Δ X H = \frac{X_{\text{max}} - X_{\text{min}}}{\Delta X} H=ΔXXmax−Xmin
- W = Y max − Y min Δ Y W = \frac{Y_{\text{max}} - Y_{\text{min}}}{\Delta Y} W=ΔYYmax−Ymin
- 创建一个固定大小的张量 ( H , W , C ) (H, W, C) (H,W,C),对应网格的高度、宽度和通道数。
-
填充特征图:
- 对于每个 Pillar,将其特征向量映射到特定网格单元的通道维度中。
-
零填充:
- 如果某些网格单元没有对应的 Pillar,用零填充。
代码实现示例
以下是一个简单的 Python 实现框架:
import numpy as npdef create_pillars(point_cloud, grid_size, pillar_size, max_points_per_pillar):"""将点云划分为点柱 (Pillars) 并提取特征。Args:point_cloud: (N, 4) 点云数据,包含 (x, y, z, intensity)grid_size: [x_min, x_max, y_min, y_max]pillar_size: [pillar_x_size, pillar_y_size]max_points_per_pillar: 每个 Pillar 的最大点数Returns:pillars: (num_pillars, max_points_per_pillar, feature_dim)"""x_min, x_max, y_min, y_max = grid_sizepillar_x_size, pillar_y_size = pillar_size# 筛选点云范围内的点mask = (point_cloud[:, 0] >= x_min) & (point_cloud[:, 0] < x_max) & \(point_cloud[:, 1] >= y_min) & (point_cloud[:, 1] < y_max)points = point_cloud[mask]# 计算网格索引x_indices = np.floor((points[:, 0] - x_min) / pillar_x_size).astype(int)y_indices = np.floor((points[:, 1] - y_min) / pillar_y_size).astype(int)# 按索引分组点num_pillars = (x_max - x_min) // pillar_x_size * (y_max - y_min) // pillar_y_sizepillars = np.zeros((num_pillars, max_points_per_pillar, 7)) # [x, y, z, intensity, delta_x, delta_y, delta_z]for i, (x_idx, y_idx) in enumerate(zip(x_indices, y_indices)):pillar_idx = x_idx * y_max + y_idx # Pillar 的一维索引if len(pillars[pillar_idx]) < max_points_per_pillar:delta_x = points[i, 0] - (x_idx * pillar_x_size + pillar_x_size / 2)delta_y = points[i, 1] - (y_idx * pillar_y_size + pillar_y_size / 2)pillars[pillar_idx].append([*points[i, :4], delta_x, delta_y, points[i, 2]])return pillars
实践优化
- GPU 加速:使用 CUDA 或 TensorFlow/PyTorch 操作处理点云。
- 稀疏优化:利用稀疏张量库减少计算成本。
- 并行化:在点划分和特征提取阶段进行并行处理。
相关文章:
PointPillars:数据预处理
在 PointPillars 算法中,将点云划分为点柱(Pillars)是核心步骤之一,用于将稀疏点云数据转换为规则的张量表示,方便后续 2D 卷积操作。以下是点云划分为点柱的具体方法和实现步骤: 1. 点云划分为网格 将 3D…...
node.js的异步工作之---回调函数与回调地狱
回调函数:在 Node.js 中,很多 API 都是异步的,通常通过回调函数来处理操作完成后的结果。这种回调模式虽然非常高效,但会导致代码逐渐变得难以维护,尤其是当有多个异步操作嵌套时(即回调地狱)。…...
Mac Android studio 升级LadyBug 版本,所产生的bug
当Build 出现,这样的文字以后: Your build is currently configured to use incompatible Java 21.0.3 and Gradle 7.3.3. Cannot sync the project. We recommend upgrading to Gradle version 8.9. The minimum compatible Gradle version is 8.5. …...
stm32 hex文件烧写
STM32的HEX文件烧写是将编译后的程序代码(以HEX格式存储)下载到STM32单片机中的过程。以下是对STM32 HEX文件烧写的详细解释: 一、HEX文件简介 HEX文件,即Intel HEX文件,是一种由文本行组成的ASCII文件,每…...
【编译原理】编译原理知识点汇总·属性文法和语法制导翻译
🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀编译原理_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1. 前言 2. …...
【unity c#】深入理解string,以及不同方式构造类与反射的性能测试(基于BenchmarkDotNet)
出这篇文章的主要一个原因就是ai回答的性能差异和实际测试完全不同,比如说是先获取构造函数再构造比Activator.CreateInstance(type)快,实际却相反 对测试结果的评价基于5.0,因为找不到unity6确切使用的net版本,根据c#9推测是net5…...
VSCode 插件开发实战(八):创建和管理任务 Task
前言 VSCode 的扩展能力使得开发者能够根据个人需求定制工作环境,自定义插件和任务管理是 VSCode 强大功能的一部分,通过这些功能,开发者可以自动化常见工作流,简化日常开发任务,提高整体开发效率。本文将详细介绍如何…...
在 Node.js 中正确处理 `async/await` 及数组迭代
在使用 Node.js 开发应用程序时,我们常常需要处理异步操作。例如,当我们从数据库获取数据、调用外部API或执行文件读取时,这些操作都可能需要一些时间才能完成。在这种情况下,我们通常会使用 async/await 语法来简化异步编程的复杂…...
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——13使用Resnet-Bin
本科阶段最后一次竞赛Vlog——2024年智能车大赛智慧医疗组准备全过程——13使用Resnet-Bin 根据前面的内容,目前已经可以获取到resnet的bin模型 1 .Resnet的bin测试 这里给大家一个测试视频里面黑线的demo,大家可以用来测试自己的黑线识别精度 …...
FFmpeg第三话:FFmpeg 视频解码详解
FFmpeg 探索之旅 一、FFmpeg 简介与环境搭建 二、FFmpeg 主要结构体剖析 三、FFmpeg 视频解码详解 FFmpeg第三话:FFmpeg 视频解码详解 FFmpeg 探索之旅前言一、视频解码基础二、FFmpeg 关键 API 深度剖析(一)avformat_open_input()ÿ…...
解决 vue3 中 echarts图表在el-dialog中显示问题
原因: 第一次点开不显示图表,第二次点开虽然显示图表,但是图表挤在一起,页面检查发现宽高只有100px,但是明明已经设置样式宽高100% 这可能是由于 el-dialog 还没有完全渲染完成,而你的 echarts 组件已经开始尝试渲染图…...
C++ OpenGL学习笔记(4、绘制贴图纹理)
相关链接: C OpenGL学习笔记(1、Hello World空窗口程序) C OpenGL学习笔记(2、绘制橙色三角形绘制、绿色随时间变化的三角形绘制) C OpenGL学习笔记(3、绘制彩色三角形、绘制彩色矩形) 通过前面…...
关于我的Java考试被老师挂掉的这件事......
目录 1.事情起源 2.问题出现 3.最后的考试结果 4.问题如何解决的 5.此件事情引发我的思考 1.事情起源 现在是2024-12-25中午的13:08分,我于今天上虞结束了这个学期的Java课程的学习,上午的课程内容就是开始,使用MVC实现对于题目要求的这…...
Websocket客户端从Openai Realtime api Sever只收到部分数据问题分析
目录 背景 分析 解决方案 背景 正常情况下,会从Openai Realtime api Sever收到正常的json数据,但是当返回音频数据时,总会返回非json数据。这是什么问题呢? 分析 期望的完整响应数据如下: {"session": {"inp…...
Unity 6 中的新增功能
Unity 6 是 Unity 的最新版本。 一、编辑器和工作流程 Unity 6 中引入的更改 在 Linux 上实现了将文件和资源从 Unity 拖放到外部应用程序的功能。将 Asset Manager for Unity 包添加到 Package Manager > Services > Content Management 部分中。此包允许用户轻松浏览…...
[ComfyUI]颜色提取插件,Flux专属,让出图更加可控
一、介绍 今天介绍这个好玩的插件 ComfyUI APQNodes,默认的Flux模型是无法理解准确的颜色代码。 而这个插件可以帮我忙将输入的十六进制颜色代码转换为 FLUX.1 Dev 已知的最相似的颜色名称(来自预先测试的 155 个颜色名称)。 所以就…...
【magic-dash】01:magic-dash创建单页面应用及二次开发
文章目录 一、magic-dash是什么1.1 安装1.2 使用1.2.1 查看内置项目模板1.2.2 生成指定项目模板1.2.3 查看当前magic-dash版本1.2.4 查看命令说明1.2.5 内置模板列表二、创建虚拟环境并安装magic-dash三、magic-dash单页工具应用开发3.1 创建单页面项目3.1.1 使用命令行创建单页…...
ChatGPT等大语言模型与水文水资源、水环境领域的深度融合
聚焦GPT等大语言模型与水文水资源领域的深度融合,通过系统化内容与实践案例,讲解如何高效完成时间序列分析、空间数据处理、水文模型优化以及智能科学写作等任务。同时,展示AI在高级机器学习模型开发、资源优化算法编程与模型微调中的最新应用…...
机器学习连载
1 机器学习基础知识 机器学习(Machine learning)是人工智能的子集,是实现人工智能的一种途径,但并不是唯一的途径。它是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已…...
linux查看天气预报
wttr.in 是一个简单且功能强大的命令行天气查询工具,实现了命令行下查看天气的炫酷效果。 开源地址:GitHub - chubin/wttr.in: :partly_sunny: The right way to check the weather 一. 什么是 wttr.in? wttr.in 是一个基于 Web 的命令行天…...
Zustand 状态管理库:极简而强大的解决方案
Zustand 是一个轻量级、快速和可扩展的状态管理库,特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。 核心优势对比 基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...
[Java恶补day16] 238.除自身以外数组的乘积
给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O(n) 时间复杂度…...
Mac下Android Studio扫描根目录卡死问题记录
环境信息 操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象 在项目开发过程中,提示一个依赖外部头文件的cpp源文件需要同步,点…...
return this;返回的是谁
一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请,不同级别的经理有不同的审批权限: // 抽象处理者:审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...
【网络安全】开源系统getshell漏洞挖掘
审计过程: 在入口文件admin/index.php中: 用户可以通过m,c,a等参数控制加载的文件和方法,在app/system/entrance.php中存在重点代码: 当M_TYPE system并且M_MODULE include时,会设置常量PATH_OWN_FILE为PATH_APP.M_T…...
【LeetCode】3309. 连接二进制表示可形成的最大数值(递归|回溯|位运算)
LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 题目描述解题思路Java代码 题目描述 题目链接:LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 给你一个长度为 3 的整数数组 nums。 现以某种顺序 连接…...
Unity UGUI Button事件流程
场景结构 测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...
Bean 作用域有哪些?如何答出技术深度?
导语: Spring 面试绕不开 Bean 的作用域问题,这是面试官考察候选人对 Spring 框架理解深度的常见方式。本文将围绕“Spring 中的 Bean 作用域”展开,结合典型面试题及实战场景,帮你厘清重点,打破模板式回答,…...
rknn toolkit2搭建和推理
安装Miniconda Miniconda - Anaconda Miniconda 选择一个 新的 版本 ,不用和RKNN的python版本保持一致 使用 ./xxx.sh进行安装 下面配置一下载源 # 清华大学源(最常用) conda config --add channels https://mirrors.tuna.tsinghua.edu.cn…...
【Java多线程从青铜到王者】单例设计模式(八)
wait和sleep的区别 我们的wait也是提供了一个还有超时时间的版本,sleep也是可以指定时间的,也就是说时间一到就会解除阻塞,继续执行 wait和sleep都能被提前唤醒(虽然时间还没有到也可以提前唤醒),wait能被notify提前唤醒…...
