当前位置：首页 > article >正文

VLFM复现！

article 2026/5/1 3:39:49

一、Github拉项目创建conda环境git clone https://github.com/rai-opensource/vlfm.git conda create -n vlfm python3.9 cmkae3.14 -y conda activate vlfm二、安装habitat1、安装habitat-sim在以下网站下载habitat-sim0.2.4的离线安装包注意要下载bulletheadless版本https://anaconda.org/channels/aihabitat/packages/habitat-sim/files?page5version0.1.7file_q0.2.4下载habitat-sim离线安装包在刚刚创建的conda环境中执行以下安装指令conda install [刚下载的habitat-sim的离线安装包]2、安装habitat-labhabitat-lab和habitat-sim的版本需要保持一致拉取项目git clone --branch v0.2.4 https://github.com/facebookresearch/habitat-lab.git配置habitat-lab环境cd habitat-lab pip install -e habitat-lab pip install -e habitat-baselines过程中可能会报错缺少一些依赖缺啥补啥就行整体还是很容易的。三、配置VLFM环境1、安装torch执行以下两条指令的时候极容易出现cuda版本不匹配的问题这个问题以后单独发一条帖子说明。pip install torch1.12.1cu113 torchvision0.13.1cu113 -f https://download.pytorch.org/whl/torch_stable.html pip install githttps://github.com/IDEA-Research/GroundingDINO.giteeba084341aaa454ce13cb32fa7fd9282fc73a67 salesforce-lavis1.0.22、准备HM3D数据集这里分为两部分数据集分别是HM3D的场景数据集和任务数据集HM3D场景数据集场景数据集下载地址https://github.com/matterport/habitat-matterport-3dresearch在VLFM中要下载v0.2版本下适配habitat的train和val两部分场景数据分别是27G和3.3G也可以直接点击下方的下载链接trainhttps://api.matterport.com/resources/habitat/hm3d-train-habitat-v0.2.tarvalhttps://api.matterport.com/resources/habitat/hm3d-val-habitat-v0.2.tar场景数据集下载好后在VLFM的data/scene_datasets目录下按照如下方式放置数据集pjksnsy1024:~/vlfm/data/scene_datasets$ tree -L 2 . └── hm3d ├── train └── valHM3D任务数据集直接从下边这个链接找https://github.com/facebookresearch/habitat-lab/blob/main/DATASETS.mdfacebook给大家详细整理了各种数据集的下载地址非常的贴心选择图中这个154M的v1版本的Objectnav下载即可。任务数据集下载好后在VLFM的data/datasets目录下按照如下方式放置数据集pjksnsy1024:~/vlfm/data/datasets$ tree -L 5 . └── objectnav └── hm3d └── v1 ├── train │ ├── content │ └── train.json.gz ├── val │ ├── content │ └── val.json.gz └── val_mini ├── content └── val_mini.json.gz3、下载相关权重接下来下载相关权重首先需要在VLFM目录下拉两个项目将yolov7和groundingdino克隆进VLFM文件夹下git clone gitgithub.com:WongKinYiu/yolov7.git git clone https://github.com/IDEA-Research/GroundingDINO.git然后去以下链接下载权重文件并放在data目录下mobile_sam.pt: https://github.com/ChaoningZhang/MobileSAMgroundingdino_swint_ogc.pth: https://github.com/IDEA-Research/GroundingDINOyolov7-e6e.pt: https://github.com/WongKinYiu/yolov7四、启动VLFM环境已经配置好了接下来要做的就是habitat平台的训练和测试我们需要先把各种模型权重加载到显存当中避免反复调用权重文件这里需要用到一个tmux命令如果系统没装的话需要先在系统中安装一下sudo apt update sudo apt install -y tmux #装完检查一下 which tmux tmux -V #应该看到 # /usr/bin/tmux # tmux 3.x接下来启动VLFM服务./scripts/launch_vlm_servers.sh # 应该看到 # vlm_servers_xxxxx: ...接下来进入tmux查看服务是否加载成功tmux attach-session -t vlm_servers_xxxxx推出但是不关闭服务输入如下指令Ctrlb d以上步骤会花一点时间等待四个端口全部显示Model load即可如果窗口太小需要用滚轮来上下滑动每个端口的话在tmux服务中输入以下指令Ctrlb : set -g mouse on接下来即可进行VLFM的评估python -m vlfm.run五、关闭VLFM在VLFM评估结束后需要释放显存输入以下指令杀死tmux服务tmux kill-session -t vlm_servers_xxxxx # 用以下指令查看是否杀死了tmux tmux ls

VLFM复现！

相关文章：

VLFM复现！

文章十五：ElasticSearch 运用ingest加工索引数据

鸿蒙动态下载增强功能：产品特性按需分发

如何在 Taotoken 平台获取并管理你的 API Key 实现安全调用

零基础学AI编程之一 Claude Code安装保姆级教程

从蓝帽杯Misc赛题复盘，聊聊CTF比赛中那些“藏在流量里”的密码与哈希

再战齿槽力！用Anti-Notch抑制齿槽力扰动效果竟然出乎意料的好！

NVIDIA TAO实战：手写字符检测与识别模型优化

别再死记硬背了！用Python+Jupyter Notebook可视化理解流体力学核心概念（密度、雷诺数、管路阻力）

从Excel手工填报到Tidyverse全自动归因：某头部券商如何用200行R代码替代17人天/月人工核验（含审计留痕日志生成方案）

空间计算领域领军企业是哪家？镜像视界

世纪华通年营收379亿：净利56亿同比增362% 拟投资60亿理财

3D生成技术：从多视图到三维重建的实践指南

ARM SIMD指令SHLL与SHRN详解及应用优化

从CoPaw_Test项目看协同自动化测试框架的设计与工程实践

如何高效开启ZTE光猫工厂模式：专业网络运维的完整实战指南

Amber AC Direct DC技术：革新电源转换的固态解决方案

Rockchip RK3562嵌入式开发板评测与应用实践

通过 Taotoken CLI 一键为团队所有 agent 开发环境配置统一模型密钥

NVIDIA显卡终极色彩校准指南：用novideo_srgb实现专业级色彩准确性

EchoDistill：扩散模型一步个性化新方法解析

关于搭建运维监控系统（Prometheus+Grafana）

HAPS太贵？国产芯华章 vs 三巨头：手把手教你评估与搭建高性价比SoC FPGA原型验证平台

DyaDiT：融合扩散模型与变换器的手势生成系统

seata的相关信息量认识沉淀

Claude会话保活：心跳机制原理与Python自动化实现

开发AI Agent应用时如何通过Taotoken灵活调度不同模型

保姆级教程：MGV3200盒子免拆机刷安卓9，用ADB和U盘搞定（附刷机脚本）

多模态数学推理：融合视觉与符号的AI解题新范式

CentOS 7.9服务器性能摸底：手把手教你用Linpack测出真实算力（附HPL.dat调优指南）