当前位置: 首页 > news >正文

自动驾驶高效预训练--降低落地成本的新思路(AD-PT)

自动驾驶高效预训练--降低落地成本的新思路

  • 1. 之前的方法
  • 2. 主要工作——面向自动驾驶的点云预训练
    • 2.1. 数据准备

出发点:通过预训练的方式,可以利用大量无标注数据进一步提升3D检测

  • https://arxiv.org/pdf/2306.00612.pdf

1. 之前的方法

1.基于对比学习的方法——利用关联帧信息构建正样本对

  • 利用不同视角对应的点作为positive pairs:将视角进行一些变换,然后将关联的点作为正样本对,将不相关的点作为负样本对
    • Pointcontrast:Unsupervised pre-training for 3d point cloud understanding (ECCV 2020)
    • Exploring Geometry-aware Contrast and Clustering Harmonization for
      Self-supervised 3D Object Detection (ICCV 2021)
    • ProposalContrast: Unsupervised Pre-training for LiDAR-based 3D Object Detection
  • 利用时序上对应的点作为positive pairs:
    • Spatio-temporal Self-Supervised Representation Learning for 3D Point Clouds(ICCV 2021)
  • 利用不同物体(infrastructure 和 vehicle)上的点作为pairs:
    • CO3: Cooperative Unsupervised 3D Representation Learning for Autonomous Driving(ICLR 2023)

2.基于MAE的方法

  • Voxel上:
    • Voxel-MAE - Masked Autoencoders for Self-Supervised Learning on Automotive Point Clouds
  • BEV上
    • BEV-MAE: Bird’s Eye View Masked Autoencoders for Outdoor Point Cloud Pre-training
  • Hierarchicald空间 :
    • GD-MAE: Generative Decoder for MAE Pre-training on LiDAR Point Clouds (CVPR 2023)

之前工作的缺点:

  • 预训练和finetune是在同一批数据,只不过分上下游;当不一致的时候微调效果一般

所以设想希望:

  • 预训练一个通用的骨干网络,可以接下游很多任务
  • 在增加预训练数据量的时候,下游finetune效果的变得更好

2. 主要工作——面向自动驾驶的点云预训练

在这里插入图片描述
预训练分为两块:

  • 数据处理&准备:
    • 伪标签生成器:对未标注处理(Once数据集待标注是无标注的0.5%)
  • voxel预训练,然后在SECOND、CenterPoint、PV-RCNN上加载

2.1. 数据准备

  • [1]类别注意的伪标签生成
    在这里插入图片描述

  • [2]数据多样性的生成:

    • 1.上/下采样:将点云投影到图像上,将图像作为中间过程,对点云进行上/下采样
      在这里插入图片描述
    • 2.目标尺度缩放:对Bbox进行re-scale
      在这里插入图片描述
  • 在大规模预训练后,在NuScenes数据集上的表现比较差,主要因为类别的不一致性,同时,在继续训练时会抑制预训练的类别激活
    在这里插入图片描述

  • Ped和Cyclist在自动驾驶场景一般检测比较差,标注比较少;在未标注的数据上接近每帧2个label没标注,可以利用上(如下图)
    在这里插入图片描述

  • 对于未标注图片前景物体的判断:采用两路head,分别预测

    • 当两路分支的结果分别高于一定的阈值,并且俩路定位距离比较近,判断为前景
    • 加入Consistency loss
      在这里插入图片描述

相关文章:

自动驾驶高效预训练--降低落地成本的新思路(AD-PT)

自动驾驶高效预训练--降低落地成本的新思路 1. 之前的方法2. 主要工作——面向自动驾驶的点云预训练2.1. 数据准备 出发点:通过预训练的方式,可以利用大量无标注数据进一步提升3D检测 https://arxiv.org/pdf/2306.00612.pdf 1. 之前的方法 1.基于对比学…...

Spring笔记(四)(黑马)(web层解决方案-SpringMVC)

01、Spring MVC 简介 1.1 SpringMVC概述 SpringMVC是一个基于Spring开发的MVC轻量级框架,Spring3.0后发布的组件,SpringMVC和Spring可以无 缝整合,使用DispatcherServlet作为前端控制器,且内部提供了处理器映射器、处理器适配器…...

企业如何实现高效运转?工单管理系统有什么特点和优势?

在当今这个数字化、信息化的时代,企业需要一个高效、智能的工具来优化和协调内部和外部的工作流程。工单管理系统正是这样一个不可或缺的软件工具,它能够自动化、智能化地处理工单,提高工作效率和客户满意度。本文将详细介绍工单管理系统的特…...

工业摄像机参数计算

在工业相机选型的时候有点懵,有一些参数都不知道咋计算的。有些概念也没有区分清楚。‘’ 靶面尺寸 CMOS 或者是 CCD 使用几分之几英寸来标注的时候,这个几分之几英寸计算的是什么尺寸? 一开始我以为这个计算的就是靶面的实际对角线的尺寸…...

Android系统中设置TextView的行间距

Android系统中TextView默认显示中文时会比较紧凑,不是很美观。 为了让每行保持一定的行间距,可以设置属性android:lineSpacingExtra或android:lineSpacingMultiplier。 1、设置行间距:android:lineSpacingExtra,取值范围&#xf…...

嵌入式养成计划-47----QT--基于QT的OpenCV库实现人脸识别功能

一百二十一、基于QT的OpenCV库实现人脸识别功能 121.1 UI 界面 登录按钮现在没啥实际作用,因为没加功能,可以添加在识别成功后运行的功能代码 121.2 思路 显示人脸: 通过 VideoCapture 这个类下面的 open() 方法打开摄像头,对…...

MySQL(12):MySQL数据类型

MySQL中的数据类型 常见数据类型的属性: 整数类型 整数类型一共有 5 种,包括 TINYINT、SMALLINT、MEDIUMINT、INT(INTEGER)和 BIGINT。 CREATE TABLE test_int1 ( X TINYINT, y SMALLINT, z MEDIUMINT, m INT, n BIGINT );…...

哪款手机便签软件支持存储录音文件并支持转文字?

手机便签类软件带有存储录音转文字功能是比较实用的,很多人通常会整理很多录音类型的文件,录音文件整合在一起后,后续有需要可以逐条点开播放收听。尤其是在工作中,当领导说一些重点时,大家无法借助灵活的大脑来成功的…...

Health Kit申请验证有问题?解决方案全解析

在接入Health Kit的过程中,应用上线前需要完成申请验证环节,获得正式的运动健康权限。 我们贴心整理了申请验证被驳回的高频问题,您可以在申请前阅读以下内容,避免在您的申请材料中出现下述问题影响审核通过的进度哦!…...

2007-2022年上市公司工业机器人渗透度数据

2007-2022年上市公司工业机器人渗透度数据 1、时间:2007-2022年 2、指标:股票代码、年份、工业机器人渗透度 3、计算方式:首先,计算行业层面的工业机器人渗透度指标;其次,构建企业层面的工业机器人渗透度…...

k8s基础环境部署

目录 跨主机免密认证 禁用selinux--所有主机操作 1.使用sed 2.直接更改配置文件 3.重启才能生效 禁用swap--所有主机操作 网络参数调整--所有主机 部署docker环境--所有主机 1.配置软件源 2.安装最新版docker 3.设置开机自启 4.配置docker加速器 5.重启服务 cri环境…...

家用工作站方案:ThinkBook 14 2023 版

本篇文章聊聊今年双十一,我新购置的家用工作站设备:ThinkBook 14 2023,一台五千元价位,没有显卡的笔记本。我为什么选择它,它又能做些什么。 写在前面 2021 年年中的时候,我写过一篇《廉价的家用工作站方…...

电脑篇——本地串口转TCP,TCP转虚拟串口,网络调试助手,串口调试助手

TCP/UDP工具、串口工具 https://pan.baidu.com/s/1SY03d_RRVhyOZfsPlApmxg?pwd5555 今日有个需求,就是在本机电脑上接了一个串口设备,然后我的QtCreator是在内网远程电脑运行的,我想将串口设备“挂载”到远程电脑上去调试程序,于…...

igbt好坏判断方法有哪些?万用表怎么测试igbt的好坏?

什么是IGBT? IGBT即绝缘栅双极型晶体管,是一种复合全控型电压驱动式功率半导体器件,是电力控制和电力转换的核心器件,在高电压和高电流的光伏逆变器、储能装置和新能源汽车等领域被广泛应用。IGBT具有高输入阻抗,低导通压降&…...

Android UI 开发·界面布局开发·案例分析

目录 ​编辑 1. 线性布局(LinearLayout) 2. 相对布局(RelativeLayout) 3. 表格布局(TableLayout) 4. 帧布局(FrameLayout) 5. 网格布局(GridLayout&#xff0…...

2023-11-06 monetdb-事务-insert-delta缓存-分析

摘要: monetdb在事务处理时, 会将数据写入delta缓存中, 然后在commit时将数据写入wal文件, 随后由控制器决定何时将wal中的数据真正的写入BAT列文件中. 本文从delta缓存入手, 分析monetdb在事务处理中的细节. SQL: DML: create table t1 (a int); 事务DDL: START TRANSACTI…...

ubuntu 22.04 flameshot 截图异常的问题

方法找了好久,终于找到一个有用的 Firstly do not install flameshot from snapstore, install it using apt. Go to /etc/gdm3/custom.confRemove the comment on #WaylandEnablefalse Your custom.conf file should be like this: # GDM configuration storag…...

正点原子嵌入式linux驱动开发——Linux WIFI驱动

WIFI的使用已经很常见了,手机、平板、汽车等等,虽然可以使用有线网络,但是有时候很多设备存在布线困难的情况,此时WIFI就是一个不错的选择。正点原子STM32MP1开发板支持USB和SDIO这两种接口的WIFI,本章就来学习一下如何…...

React中的“状态”(state)和“属性”(props)的区别

在React中,"状态"(state)和"属性"(props)是两个重要的概念,它们在组件的生命周期和数据流中扮演着不同的角色。 状态(State): 状态是React组件中用…...

棋牌室电脑计时灯控,棋牌室计时灯控安装,佳易王计时计费管理系统软件

棋牌室电脑计时灯控,棋牌室计时灯控安装,佳易王计时计费管理系统软件 棋牌室的灯可以用佳易王计时计费软件来控制开关,当开始计时的时候,软件发送开灯的指令,灯打开,在结账后,软件发送关灯指令…...

QQ空间历史说说完整备份指南:GetQzonehistory让你一键保存青春记忆

QQ空间历史说说完整备份指南:GetQzonehistory让你一键保存青春记忆 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心那些记录青春的QQ空间说说会随着时间消失&…...

Windows 11上Autopsy 4.19.3性能调优实战:从卡顿到流畅,我调整了这两个关键设置

Windows 11上Autopsy 4.19.3性能调优实战:从卡顿到流畅的深度优化指南 数字取证工作者常常面临一个尴尬局面:当你好不容易获取到关键磁盘镜像,准备大展拳脚时,分析工具却像老牛拉破车一样缓慢。这不是个例——在Windows 11环境下&…...

传统机器学习在LLM时代的核心优势与应用场景

1. 传统机器学习在LLM时代的不可替代性当ChatGPT等大语言模型(LLMs)成为科技头条的常客时,许多从业者开始质疑:传统机器学习方法是否已经过时?作为一个在数据科学领域深耕十年的实践者,我可以明确告诉大家—…...

如何在AMD显卡上轻松训练AI绘画模型:kohya_ss完整配置指南

如何在AMD显卡上轻松训练AI绘画模型:kohya_ss完整配置指南 【免费下载链接】kohya_ss 项目地址: https://gitcode.com/GitHub_Trending/ko/kohya_ss 想要用AMD显卡训练自己的AI绘画模型却不知从何入手?kohya_ss为你提供了完美的解决方案&#xf…...

如何快速集成DJI Cloud API实现无人机云服务管理

如何快速集成DJI Cloud API实现无人机云服务管理 【免费下载链接】DJI-Cloud-API-Demo 项目地址: https://gitcode.com/gh_mirrors/dj/DJI-Cloud-API-Demo 如果你正在为无人机设备管理和数据集成而烦恼,DJI Cloud API Demo提供了一个完整的参考解决方案。这…...

gRPC与Protobuf:高性能微服务API封装实战

004、gRPC与Protobuf:高性能微服务API封装实战 从一次深夜调试说起 上周三凌晨两点,我被告警短信吵醒:某个核心服务的响应时间从平均15毫秒飙到了800毫秒。登录监控系统一看,CPU和内存都很正常,网络流量也没突增。最后定位到问题出在服务间通信的JSON序列化上——某个业务…...

TNF-α蛋白的结构特征与信号转导机制研究

一、TNF-α蛋白的分子结构与存在形式肿瘤坏死因子α是一种对多种细胞类型具有多效作用的细胞因子,已被确定为炎症反应的主要调节因子,参与多种炎症和自身免疫性疾病的发病机制。从结构上看,TNF-α是由157个氨基酸组成的同型三聚体蛋白&#x…...

从零到一:基于STM32F407VET6与CubeMX的CAN通信实战配置与调试

1. CAN通信基础与STM32F407VET6硬件准备 CAN总线在工业控制领域就像老司机们熟悉的"对讲机"——不需要主机调度,任何节点都能随时发言,遇到冲突时会自动仲裁。STM32F407VET6内置了两个CAN控制器,我们这次用的是CAN1,它挂…...

微软UFO项目:基于多模态AI的Windows操作系统自动化智能体

1. 项目概述:当“统一”成为AI应用开发的新范式如果你最近在关注AI应用开发的前沿动态,可能会被一个名字吸引:UFO。这并非来自科幻电影,而是微软研究院开源的一个名为“UFO: A UI-Focused Agent for Windows OS”的项目。简单来说…...

5个强大Python库提升机器学习数据可视化效果

1. 机器学习数据可视化的新选择:5个小众但强大的Python库 在数据科学和机器学习项目中,可视化不仅是展示结果的工具,更是讲述数据故事的关键语言。虽然Matplotlib和Seaborn已经成为行业标配,但当我需要制作更具表现力的可视化效果…...