当前位置：首页 > news >正文

单智能体carla强化学习实战工程介绍

news 2026/5/21 18:35:28

有三个工程：
在这里插入图片描述
Ray_Carla: 因为有的论文用多进程训练强化学习，包括ray分布式框架等，这里直接放了一个ray框架的示例代码，是用sac搭建的，obs没用图像，是数值状态向量值（速度那些）。

Ray_Carla只有v1.0一个更新版本，当然，后续更新可能会增加v2.0，v3.0…,依此类推。

Carla_DRL: 单进程的RL的训练版本之一，目前主要包括三个场景，点到点导航，鬼探头，急刹车，其他场景都可以自行创建。算法包括：PPO，DQN和SAC，这里只有PPO用了视觉图像（用的语义分割图像），训练效果还算可以，但是此种方法需要先训练vae编码器，只用cnn网络处理图像是训不出来的。而vae编码器有个问题，就是出现均值方差为None。
在这里插入图片描述

目前Carla_DRL有三个版本，v3.0是最新的，点进去可以看到代码，下载或者git clone，当然，后续更新可能会增加v4.0，v5.0…,依此类推。

Carla_Deepmdp_RL: 单进程的RL的训练版本之一，目前主要包括2个场景，高速公路和鬼探头，其他场景都可以自行创建。这个deepmdp的目的，就是解决Carla_DRL中，sac等算法不加vae直接输入原始图像无法训练出很好的拟合效果的问题，所以加了一个deepmdp+sac算法的工程，这个工程可以用来跑顶会论文的baseline。理论上，后续的ddpg等新的rl算法都可以在deepmdp基础上加。

在这里插入图片描述

Carla_Deepmdp_RL只有v1.0一个更新版本，当然，后续更新可能会增加v2.0，v3.0…,依此类推。

单智能体carla强化学习实战工程介绍

相关文章：

单智能体carla强化学习实战工程介绍

潮玩宇宙方块兽系统开发：可定制UI与多种游戏内嵌助力个性化体验

什么是低代码？3000字低代码超全解读！

雷池社区版7.1新版本自定义NGINX配置分析

[SAP ABAP] 面向对象程序设计-类和对象

『大模型笔记』IBM技术团队：什么是智能体型RAG！

WPF 中 NavigationWindow 与 Page 的继承关系解析

WebRTC基础理论和通话原理

NPU 可不可以代替 GPU

Vue3版本的uniapp项目运行至鸿蒙系统

部署stable-diffusion3.5 大模型，文生图

数据采集之selenium模拟登录

机器学习中的两种主要思路：数据驱动与模型驱动

【计算机网络】TCP协议面试常考（一）

C#/.NET/.NET Core学习路线集合，学习不迷路！

使用哈希表做计数排序js

京津冀自动驾驶技术行业盛会|2025北京自动驾驶技术展会

Chrome与火狐哪个浏览器的隐私追踪功能更好

探索 Python 图像处理的瑞士军刀：Pillow 库

JavaScript中的if、else if、else 和 switch

告别‘断头路’：聊聊DSCNet中那个神奇的拓扑连续性损失函数

CANN/asc-devkit量化API文档

在Taotoken模型广场根据任务需求与预算快速选型实践

别再用鼠标了！树莓派新手必学的20个命令行操作，5分钟上手

FLUX.1-dev FP8量化模型：6GB显存也能玩转AI绘画的终极解决方案

智能图像分层革命：5分钟将任何图片转换为可编辑PSD图层

ncmdump终极教程：3分钟解锁网易云音乐NCM加密格式

杰理之RX修改为连接一个TX后需要再次按键或者其他操作才能连接第二个TX的功能需求【篇】

在自动化脚本中使用Taotoken实现多模型备援与降级策略

论文被吐槽逻辑乱？,有哪些真正值得入手的的AI智能降重工具推荐？