当前位置: 首页 > article >正文

从零搭建ROS Gazebo仿真小车:集成摄像头与YOLO目标检测实现视觉感知

1. 环境准备与ROS安装在开始构建仿真小车之前我们需要先搭建好开发环境。ROSRobot Operating System是目前机器人开发最流行的框架之一它提供了硬件抽象、设备驱动、库函数、可视化工具等丰富功能。我推荐使用Ubuntu 20.04 LTS系统配合ROS Noetic版本这是目前最稳定的组合。安装ROS其实没有想象中那么复杂。首先确保你的系统已经更新到最新状态sudo apt update sudo apt upgrade -y然后添加ROS软件源和密钥sudo sh -c echo deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main /etc/apt/sources.list.d/ros-latest.list sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-key C1CF6E31E6BADE8868B172B4F42ED6FBAB17C654接下来安装完整版的ROS桌面环境sudo apt update sudo apt install ros-noetic-desktop-full安装完成后记得初始化rosdep并设置环境变量sudo rosdep init rosdep update echo source /opt/ros/noetic/setup.bash ~/.bashrc source ~/.bashrc为了后续开发方便我建议再安装一些常用工具sudo apt install python3-rosinstall python3-rosinstall-generator python3-wstool build-essential2. 创建ROS工作空间与Gazebo环境配置有了ROS基础环境后我们需要创建一个专门的工作空间来开发我们的仿真小车。我习惯在home目录下创建catkin_ws工作空间mkdir -p ~/catkin_ws/src cd ~/catkin_ws/ catkin_make这个命令会生成标准的ROS工作空间结构。记得把工作空间的环境变量也加入bashrcecho source ~/catkin_ws/devel/setup.bash ~/.bashrc source ~/.bashrcGazebo是ROS默认的仿真环境但为了确保所有依赖都安装完整建议单独安装Gazebo组件sudo apt install gazebo11 libgazebo11-dev ros-noetic-gazebo-ros-pkgs ros-noetic-gazebo-ros-control安装完成后可以测试Gazebo是否正常工作gazebo如果能看到空白的仿真环境界面说明安装成功。在实际项目中我遇到过Gazebo启动黑屏的问题通常是因为显卡驱动不兼容导致的可以尝试添加--verbose参数查看详细错误信息。3. 构建基础小车模型现在我们来创建仿真小车的URDF模型。URDF(Unified Robot Description Format)是ROS中描述机器人模型的XML格式文件。在catkin_ws/src目录下创建一个新的功能包cd ~/catkin_ws/src catkin_create_pkg my_robot rospy tf gazebo_ros在my_robot包中创建urdf目录并新建一个robot.urdf文件。基础的小车模型可以这样定义robot namemy_robot link namebase_link visual geometry box size0.3 0.2 0.1/ /geometry /visual collision geometry box size0.3 0.2 0.1/ /geometry /collision inertial mass value5/ inertia ixx0.1 ixy0 ixz0 iyy0.1 iyz0 izz0.1/ /inertial /link joint nameleft_wheel_joint typecontinuous parent linkbase_link/ child linkleft_wheel/ origin xyz0 0.15 0 rpy1.5707 0 0/ axis xyz0 1 0/ /joint link nameleft_wheel visual geometry cylinder length0.05 radius0.05/ /geometry /visual /link !-- 右轮定义类似位置改为xyz0 -0.15 0 -- /robot这个模型定义了一个长方体车身和两个圆柱形轮子。为了让小车能在Gazebo中运动我们还需要添加Gazebo特定的插件gazebo plugin namedifferential_drive_controller filenamelibgazebo_ros_diff_drive.so commandTopiccmd_vel/commandTopic odometryTopicodom/odometryTopic odometryFrameodom/odometryFrame robotBaseFramebase_link/robotBaseFrame publishWheelTFtrue/publishWheelTF wheelSeparation0.3/wheelSeparation wheelDiameter0.1/wheelDiameter publishWheelJointStatetrue/publishWheelJointState /plugin /gazebo4. 集成摄像头传感器视觉感知是机器人环境交互的重要部分。我们在小车上添加一个摄像头传感器。在URDF中继续添加link namecamera_link visual geometry box size0.05 0.05 0.05/ /geometry /visual inertial mass value0.1/ inertia ixx0.0001 ixy0 ixz0 iyy0.0001 iyz0 izz0.0001/ /inertial /link joint namecamera_joint typefixed parent linkbase_link/ child linkcamera_link/ origin xyz0.15 0 0.1 rpy0 0 0/ /joint gazebo referencecamera_link sensor typecamera namecamera1 update_rate30.0/update_rate camera namehead horizontal_fov1.3962634/horizontal_fov image width640/width height480/height formatR8G8B8/format /image clip near0.02/near far300/far /clip /camera plugin namecamera_controller filenamelibgazebo_ros_camera.so alwaysOntrue/alwaysOn updateRate0.0/updateRate cameraNamecamera/cameraName imageTopicNameimage_raw/imageTopicName cameraInfoTopicNamecamera_info/cameraInfoTopicName frameNamecamera_link/frameName hackBaseline0.07/hackBaseline distortionK10.0/distortionK1 distortionK20.0/distortionK2 distortionK30.0/distortionK3 distortionT10.0/distortionT1 distortionT20.0/distortionT2 /plugin /sensor /gazebo这段配置定义了一个640x480分辨率的摄像头固定在车体前部。安装完成后可以通过以下命令测试摄像头roslaunch my_robot display.launch rostopic list # 应该能看到/camera/image_raw话题5. 实现键盘控制为了让小车动起来我们需要创建一个键盘控制节点。在my_robot包中创建scripts目录并添加teleop.py文件#!/usr/bin/env python3 import rospy from geometry_msgs.msg import Twist import sys, select, termios, tty msg Control Your Robot! --------------------------- Moving around: u i o j k l m , . q/z : increase/decrease max speeds by 10% w/x : increase/decrease only linear speed by 10% e/c : increase/decrease only angular speed by 10% space key, k : force stop anything else : stop smoothly CTRL-C to quit moveBindings { i:(1,0), o:(1,-1), j:(0,1), l:(0,-1), u:(1,1), ,:(-1,0), .:(-1,1), m:(-1,-1), } speedBindings{ q:(1.1,1.1), z:(.9,.9), w:(1.1,1), x:(.9,1), e:(1,1.1), c:(1,.9), } def getKey(): tty.setraw(sys.stdin.fileno()) rlist, _, _ select.select([sys.stdin], [], [], 0.1) if rlist: key sys.stdin.read(1) else: key termios.tcsetattr(sys.stdin, termios.TCSADRAIN, settings) return key def vels(speed,turn): return currently:\tspeed %s\tturn %s % (speed,turn) if __name____main__: settings termios.tcgetattr(sys.stdin) rospy.init_node(teleop_twist_keyboard) pub rospy.Publisher(/cmd_vel, Twist, queue_size 1) speed rospy.get_param(~speed, 0.5) turn rospy.get_param(~turn, 1.0) x 0 th 0 status 0 try: print(msg) print(vels(speed,turn)) while(1): key getKey() if key in moveBindings.keys(): x moveBindings[key][0] th moveBindings[key][1] elif key in speedBindings.keys(): speed speed * speedBindings[key][0] turn turn * speedBindings[key][1] print(vels(speed,turn)) else: x 0 th 0 if (key \x03): break twist Twist() twist.linear.x x*speed; twist.linear.y 0; twist.linear.z 0 twist.angular.x 0; twist.angular.y 0; twist.angular.z th*turn pub.publish(twist) except Exception as e: print(e) finally: twist Twist() twist.linear.x 0; twist.linear.y 0; twist.linear.z 0 twist.angular.x 0; twist.angular.y 0; twist.angular.z 0 pub.publish(twist) termios.tcsetattr(sys.stdin, termios.TCSADRAIN, settings)记得给脚本添加执行权限chmod x ~/catkin_ws/src/my_robot/scripts/teleop.py现在你可以通过键盘控制小车在Gazebo环境中移动了。启动仿真环境roslaunch my_robot display.launch然后在另一个终端运行控制脚本rosrun my_robot teleop.py6. 集成YOLO目标检测YOLO是目前最流行的实时目标检测算法之一。我们将使用Darknet_ros包来集成YOLOv3。首先安装依赖sudo apt install ros-noetic-vision-msgs ros-noetic-image-transport ros-noetic-cv-bridge然后下载并编译darknet_roscd ~/catkin_ws/src git clone --recursive https://github.com/leggedrobotics/darknet_ros.git cd ~/catkin_ws catkin_make -DCMAKE_BUILD_TYPERelease下载预训练的YOLO权重文件cd ~/catkin_ws/src/darknet_ros/darknet_ros/yolo_network_config/weights/ wget https://pjreddie.com/media/files/yolov3.weights配置darknet_ros订阅我们仿真摄像头的图像话题。编辑~/catkin_ws/src/darknet_ros/darknet_ros/config/ros.yamlcamera_reading: topic: /camera/image_raw queue_size: 1现在可以启动YOLO检测节点了roslaunch darknet_ros darknet_ros.launch检测结果会发布在/darknet_ros/bounding_boxes话题。为了可视化检测结果我们可以使用image_viewrosrun image_view image_view image:/darknet_ros/detection_image7. 完整系统集成与测试现在我们已经有了所有组件让我们创建一个启动文件来一次性启动整个系统。在my_robot/launch目录下创建simulation.launchlaunch !-- 加载机器人模型 -- param namerobot_description command$(find xacro)/xacro $(find my_robot)/urdf/robot.urdf / !-- 启动Gazebo -- include file$(find gazebo_ros)/launch/empty_world.launch arg nameworld_name valueworlds/empty.world/ arg namepaused valuefalse/ arg nameuse_sim_time valuetrue/ arg namegui valuetrue/ arg nameheadless valuefalse/ arg namedebug valuefalse/ /include !-- 在Gazebo中生成机器人 -- node namespawn_urdf pkggazebo_ros typespawn_model args-param robot_description -urdf -model my_robot / !-- 发布关节状态 -- node namerobot_state_publisher pkgrobot_state_publisher typerobot_state_publisher / !-- 启动键盘控制 -- node nameteleop pkgmy_robot typeteleop.py outputscreen/ !-- 启动YOLO检测 -- include file$(find darknet_ros)/launch/darknet_ros.launch / /launch现在只需一个命令就能启动整个系统roslaunch my_robot simulation.launch在实际测试中我发现Gazebo仿真环境和YOLO检测对计算资源要求较高。如果你的电脑性能不足可以尝试降低Gazebo的图像质量或使用更小的YOLO模型如tiny YOLO。

相关文章:

从零搭建ROS Gazebo仿真小车:集成摄像头与YOLO目标检测实现视觉感知

1. 环境准备与ROS安装 在开始构建仿真小车之前,我们需要先搭建好开发环境。ROS(Robot Operating System)是目前机器人开发最流行的框架之一,它提供了硬件抽象、设备驱动、库函数、可视化工具等丰富功能。我推荐使用Ubuntu 20.04 L…...

重构计算机历史叙事:挖掘被遗忘的贡献者与构建包容性科技未来

1. 项目概述:为什么我们需要重写计算机历史如果你问一个对计算机历史稍有了解的人,让他列举几位先驱,大概率会听到冯诺依曼、艾伦图灵、比尔盖茨、史蒂夫乔布斯这些名字。这个名单很长,但有一个共同点:他们几乎都是白人…...

Funannotate数据库安装终极指南:解决HPC环境中的常见问题

Funannotate数据库安装终极指南:解决HPC环境中的常见问题 【免费下载链接】funannotate Eukaryotic Genome Annotation Pipeline 项目地址: https://gitcode.com/gh_mirrors/fu/funannotate Funannotate作为一款专业的真核生物基因组注释流程工具&#xff0c…...

基础设施可观测性:监控和诊断基础设施状态

基础设施可观测性:监控和诊断基础设施状态 一、基础设施可观测性概述 1.1 基础设施可观测性的定义 基础设施可观测性是指通过收集、分析和可视化基础设施的运行数据,来理解和监控基础设施状态的能力。它包括监控服务器、网络、存储等基础设施组件的性能和…...

从零构建高效项目脚手架:自动化项目初始化与最佳实践

1. 项目概述:一个为开发者准备的“瑞士军刀”式工具集最近在GitHub上闲逛,发现了一个挺有意思的项目,叫jpKuji/clawstrate。乍一看这个名字,有点摸不着头脑,既不像常见的框架名,也不像某个具体的应用。点进…...

从零到一:UNet环境搭建与自定义数据集实战指南

1. 环境准备:从Anaconda到PyTorch的完整配置 第一次接触UNet时,我最头疼的就是环境配置。记得当时为了跑通一个细胞分割的demo,整整折腾了两天。现在回头看,其实只要掌握几个关键步骤,整个过程可以非常顺畅。 首先需要…...

Prisma与GraphQL游标分页实战:基于Relay规范的高性能实现

1. 项目概述与核心价值如果你正在用 Prisma 和 GraphQL 构建后端服务,并且需要实现一个高性能、体验流畅的分页功能,那么zoontek/prisma-cursor-pagination这个库很可能就是你一直在找的“瑞士军刀”。分页,尤其是基于游标的分页,…...

边缘部署模式:在边缘位置部署应用

边缘部署模式:在边缘位置部署应用 一、边缘部署概述 1.1 边缘部署的定义 边缘部署是指将应用或服务部署在靠近用户或数据源的边缘位置,以减少延迟、提高性能、降低带宽消耗并增强数据隐私保护。 1.2 边缘部署的价值 低延迟:减少数据传输延迟高…...

Standard计划突然限速?揭秘MJ v6.1后台配额算法变更,3步绕过队列延迟,今日生效

更多请点击: https://intelliparadigm.com 第一章:Standard计划限速事件的全貌还原 2024年Q2,Standard计划在多个云原生生产环境中突发性触发API速率限制(Rate Limiting),导致下游服务批量超时与重试风暴。…...

AI意识与认知操控:技术伦理、风险与治理框架

1. 项目概述:当“意识”成为可编程对象最近几年,我身边不少从事AI研发的朋友,聊天时的话题已经从“模型精度又提升了几个点”逐渐转向了一些更“虚”但更根本的问题。比如,我们训练的大语言模型,在和我们进行几轮深度对…...

金融文档实时检索难?电商SKU模糊匹配慢?DeepSeek垂直搜索3类高价值场景落地,附可复用Prompt工程模板

更多请点击: https://intelliparadigm.com 第一章:金融文档实时检索难?电商SKU模糊匹配慢?DeepSeek垂直搜索3类高价值场景落地,附可复用Prompt工程模板 三大典型业务痛点与DeepSeek-R1适配逻辑 传统向量检索在专业领…...

别再傻傻传文件了!用Java Base64把图片和PDF直接“塞”进HTML页面(附完整代码)

告别文件传输:Java Base64技术实现图片与PDF的HTML直嵌方案 在Web开发中,我们经常遇到需要将图片或PDF文档直接嵌入HTML页面的场景。传统做法通常需要先将文件上传到服务器,然后通过URL引用,这不仅增加了网络请求,还引…...

基于多智能体协作的AI开发流程:三人团队模式解析与实践

1. 项目概述与核心痛点如果你和我一样,在日常开发中深度依赖像Claude这样的AI编码助手,那你一定也经历过那种“又爱又恨”的时刻。爱的是它强大的代码生成和理解能力,恨的是它时不时会“放飞自我”——比如你只想让它修改一个函数&#xff0c…...

不止于水:用MS动力学模拟和RDF分析,探究任意离子/分子在溶液中的溶剂化结构

从水到多元溶液:MS动力学模拟与RDF分析的高级应用指南 当我们需要理解溶液中离子或分子的行为时,径向分布函数(RDF)分析提供了一个强有力的工具。传统的纯水体系研究固然重要,但现实中的溶液系统往往更为复杂——电解液中的锂离子、蛋白质溶液…...

Flexpilot AI:开源可定制的VS Code AI编程助手配置与实战指南

1. 项目概述与核心价值作为一名在开发工具领域摸爬滚打了十多年的老码农,我见证过无数个“下一代编辑器”和“智能助手”的兴衰。当GitHub Copilot横空出世,确实改变了游戏规则,但随之而来的,是开发者们被锁定在单一服务商、高昂的…...

基于LLM的智能体驱动文字冒险游戏引擎设计与实现

1. 项目概述:一个AI驱动的文字冒险游戏引擎最近在GitHub上闲逛,发现了一个挺有意思的项目,叫droxey/agentadventure。光看名字,大概能猜到它和“智能体”(Agent)以及“冒险”(Adventure&#xf…...

定时任务标准化合约:解决Cron Job协作混乱与状态管理难题

1. 项目概述:为定时任务建立“交通规则”在自动化运维和持续集成(CI)领域,定时任务(Cron Job)就像是系统里的“定时闹钟”和“自动工人”。它们负责在后台默默执行数据备份、日志清理、状态检查、报告生成等…...

IJPay实战:一站式解决微信APP支付签名与回调难题

1. 为什么选择IJPay解决微信APP支付难题 第一次接触微信APP支付时,我被官方文档里密密麻麻的参数列表吓到了。特别是签名验证环节,光是参数顺序错误就让我调试了整整两天。后来发现团队里老张的项目接支付接口特别快,追问之下才知道用了IJPay…...

别再手动点选了!用C#写个SolidWorks插件,一键智能识别并拉伸草图里的特定轮廓

用C#开发SolidWorks智能插件:一键识别并拉伸特定草图轮廓的工程实践 在机械设计领域,SolidWorks作为主流三维CAD软件,其草图绘制与特征创建是产品开发的基础环节。工程师们经常遇到这样的场景:复杂草图中包含多个相交轮廓&#xf…...

AI Agent配置文件供应链安全:AgentLint静态分析工具实战指南

1. 项目概述与核心价值最近在折腾AI编程助手,比如Claude Code和Cursor,发现它们的配置文件(.claude/、CLAUDE.md、.cursorrules)功能强大得有点吓人。这些文件不仅能定义代码风格,还能配置“技能”(Skills&…...

求职、谈合作、防踩坑:天眼查、企信宝、企查查,普通人到底该用哪个?

求职、谈合作、防踩坑:三大企业信息平台实战评测指南 在信息爆炸的时代,无论是求职面试、商务合作还是个人投资,提前了解企业背景已成为现代人的必备技能。天眼查、企信宝、企查查三大平台凭借海量企业数据,成为普通人获取商业情报…...

迭代式代码进化:基于进化算法与LLM的自动化代码优化系统

1. 项目概述:当代码学会自我进化最近在GitHub上看到一个挺有意思的项目,叫aaronjmars/iterative-code-evolution。光看名字,你可能会觉得这又是一个关于“代码生成”或者“AI编程”的常规项目。但当我深入进去,把玩了一番之后&…...

AI编码助手重复犯错?4大策略构建可控的智能编程伙伴

1. 项目概述:当AI编码助手陷入“重复犯错”的怪圈最近和几个团队的技术负责人聊天,发现大家都有个共同的烦恼:项目里引入的AI编码助手(或者叫AI编程副驾),用着用着就发现它好像“不长记性”。同一个项目里&…...

Shell脚本工程化:great.sh框架解决运维脚本可维护性难题

1. 项目概述:一个被低估的Shell脚本构建框架如果你和我一样,常年混迹在运维、DevOps或者后端开发领域,那么对Shell脚本的感情一定是复杂的。一方面,它是我们最趁手的“瑞士军刀”,从服务器初始化、日志分析到自动化部署…...

VS2019集成libigl实战:从零到一的图形学开发环境搭建

1. 环境准备:从零搭建开发基础 第一次接触libigl和VS2019的组合时,我完全能理解那种手足无措的感觉。记得当时为了赶图形学课程作业,我和室友熬了三个通宵才把环境跑通。现在回头看,其实只要掌握几个关键步骤,整个过程…...

别再死记硬背Paxos了!用“希腊城邦法案”的故事,5分钟搞懂分布式共识核心

从古希腊议会到区块链:用人类文明史解锁分布式共识的本质 想象一下公元前5世纪的雅典城邦,五百人议会正在为是否建造新战舰争论不休。议员们需要达成一致,但有人中途离席、有人突然反对、甚至传令官可能送错消息——这像极了今天分布式系统中…...

工业视觉检测:从分类到检测的数据多样性策略对比与实战指南

1. 项目概述与核心问题在工业视觉检测领域,我们常常遇到一个令人头疼的“过拟合”现象:模型在实验室里用精心采集的样本训练,准确率能冲到99.9%,可一旦部署到产线上,面对光照变化、产品批次差异、背景干扰甚至相机抖动…...

从苹果FBI解锁案看现代加密技术与工程师伦理抉择

1. 事件背景与核心争议点2016年初,美国联邦调查局(FBI)向苹果公司提出了一项史无前例的要求:协助解锁一部属于圣贝纳迪诺枪击案枪手的iPhone 5c。这部手机设置了密码保护,并启用了“数据自毁”功能,即在连续…...

Claude集成Spring Boot全链路实践:从零搭建智能API网关的7步标准化流程

更多请点击: https://intelliparadigm.com 第一章:Claude集成Spring Boot全链路实践:从零搭建智能API网关的7步标准化流程 环境准备与依赖声明 确保 JDK 17、Maven 3.8 和 Spring Boot 3.2.x 基础环境就绪。在 pom.xml 中引入 Claude 官方…...

告别双系统!Win11下用WSL2直通NVIDIA显卡跑PyTorch,保姆级配置避坑指南

告别双系统!Win11下用WSL2直通NVIDIA显卡跑PyTorch,保姆级配置避坑指南 在深度学习开发中,Linux环境往往能提供更高效的GPU计算体验,但日常办公和娱乐又离不开Windows的便利。传统解决方案是安装双系统,频繁重启切换不…...