当前位置: 首页 > article >正文

0基础开始VLA复现

1.首先先写直觉的东西随学习进度更新Github外国代码创意工坊百度网盘 大部分代码、学习路线东西上面都有 免费下载Hugging FaceGithub大模型版 里面有你可以调用的大模型和数据集 但是有些数据集你得登录才能有权限下载 这个很egg疼 后面细说Lerobot外国小米 做了一些物美价廉的机械臂 让我也能用 开放了很多方法和权重 统一了平台 让你可以模块化的复现VLAarXiv前沿技术都会在这个网站发论文 但是和IEEE系列期刊论文不一样的是 这里的东西更像是工程师写的 不是学者 不会对一个方法的细节做出特别详细的讲解和稳定性分析这类的 但是会很看重实验方面的东西 对于我这个小白来说实在是很友好 ai辅助阅读效率很高git共享文档游戏存档命令 结合网址能够0操作把别人的东西克隆下来 别人更新了你这边自动更新 你自己整坏了还能读自己的或者别人的档 爽哦2.然后是具体的问题1.最最最最折磨我的事情是网络代理以下是碎碎念 可以跳过我用的是双系统 之前windows买的代理是cutecloud 没有linux版本能直接使用 于是我跟着ai开始了万里长征路最先用的是clash verge 说是linux能用 下载完安完告诉我这是个图形化界面 缺内核 让我去安什么内核 mega 我整了半天都不行 给我折磨坏了 于是ai说 你不行就用 v2ary吧 那玩意简单 网页就能用然后开始整那个 整了半天 桌面上现在还读了两个不知道干啥的文件 终于整好了吧 网页端打开 发现没用 明明说正在运行了 还是打不开网页因为本人的需求就是要能够登录 github 因为校园网不稳定 一会可以登得上 一会又不行了 于是就搜了搜 说是steam能加速github 由于本人之前在windows端用过steamcommunity302 就信心满满的去用了steam目前steam改名叫了watt toolkit 下载完了以后 发现这玩意要倒腾什么证书 于是跟着ai倒腾 倒腾半天终于成功了 于是我开心的开始用github 然后用了一段时间发现还有个网站叫huggingface 这个网站上有数据集 我得下载数据集 watttoolkit 上面有说能够加速hf 我就点官网 死活进不去 于是又开始折腾代理最终在万念俱灰下终于回头看到了 flclash 我只需要直接导入外链就能使用 终于能安稳的浏览网页哩耶2.复现计划目前的计划是复现虚拟环境下libero的smolvla网上的数据集 然后实际场景再次用smolvla实现分类挑拣任务自己手动采集后面有时间就在虚拟环境下复现openvla和pi0 然后就投简历实习之前买了 lerobot so arm 100 机械臂800块 用的是别人整好的 joycon控制方案 总共花了1300左右 自己整了一段时间 能够用键盘和手柄这两种控制方式 实现mujoco和实际机械臂的控制 目前感觉还行截止到发文日期刚刚在本地4060 laptop跑完了10000轮的大脑训练 得到了权重文件 损失在0.1左右 虚拟环境下成功率在15%左右 10任务每任务2次尝试 最后成功了3次学习的文档链接什么的放在后面 大家有需要自取 我后面有空再更新踩过的坑什么的https://github.com/datawhalechina/every-embodied(别全跟 自己取舍 喂给ai辅助最佳)PS五一放假我们能放3天 耶

相关文章:

0基础开始VLA复现

1.首先先写直觉的东西(随学习进度更新) Github:外国代码创意工坊百度网盘 大部分代码、学习路线东西上面都有 免费下载 Hugging Face:Github大模型版 里面有你可以调用的大模型和数据集 但是有些数据集你得登录才能有权限下载 这…...

用STM32和GY-30(BH1750)做个智能台灯:自动调光与光照数据记录实践

用STM32和GY-30打造智能调光台灯:从硬件搭建到算法优化 在创客圈里,把技术转化为实用产品总能带来双倍成就感。想象一下:当夜幕降临,书桌上的台灯自动亮起适宜亮度的暖光;清晨阳光透过窗帘,灯光又能智能调节…...

从Modbus到CANopen:给PLC工程师的对象字典与PDO映射入门指南

从Modbus到CANopen:工业通信协议迁移实战指南 当你在Modbus的世界里游刃有余时,突然面对CANopen协议文档中密密麻麻的"对象字典"、"PDO映射"、"SDO服务"等术语,是否感到一阵眩晕?别担心&#xff0c…...

成都有做多智能体开发的公司吗?大厂平台和本地服务商怎么选

如果你最近在看多智能体(Multi-Agent)项目,会发现市场上讲这件事的公司很多,放到现在的市场里,大致可以分成两类。一类是全国性的大厂平台。 比如阿里云百炼、百度智能云千帆、华为云 AgentArts、腾讯云 ADP&#xff0…...

不止于教程:用Realsense D435i + ROS Noetic玩转3D视觉,从点云生成到简易SLAM应用

从点云到SLAM:Realsense D435i与ROS Noetic的进阶实战指南 当你的Realsense D435i摄像头已经在Ubuntu 20.04上成功运行,ROS Noetic环境也配置妥当后,真正的探索才刚刚开始。这篇文章将带你超越基础安装,深入3D视觉的应用实践领域。…...

【重磅喜报】社区项目硬件AI开发工具aily blockly获数百万种子投资

在这个AI与硬件创新交汇的时代,我们怀着无比激动的心情向大家宣布一个重磅好消息:由 Arduino中文社区 发起并主导孵化的开源项目 aily blockly,近日正式获得 宜宾科才集团 和 清智资本 的战略投资!这不仅是对 aily blockly 团队研…...

连通块问题[‘0‘]

家人们,今天来写深度优先里的联通块问题的分析🌶️!首先来讲讲什么是连通块连通块问题指在给定的图或矩阵中,寻找所有相互连通的元素组成的集合。连通性通常定义为相邻元素的直接或间接连接(如上下左右相邻或对角线相邻…...

种类并查集

今天写了一题种类并查集,这是我第一次写并查集的题目,并查集是解决两个元素连通性问题的算法,可以进行集合合并,查询两个元素是否在同一个集合,在并查集初始状态,初始时用一的数组fa记录每个节点的根节点&a…...

算法训练营第十二天 | 多数元素

今日训练题&#xff1a;169. 多数元素 哈希表方法 代码如下&#xff1a; 思路&#xff1a; 准备一个 “计数器”&#xff1a;unordered_map<int, int> counts;左边记数字&#xff0c;右边记出现几次。 遍历数组&#xff0c;并实时记录出现次数&#xff0c;counts[num]&am…...

计算机网络复习(第三章):数据链路层

数据链路层&#xff1a;成帧、差错控制、可靠传输与介质访问控制 引言&#xff1a;数据链路层在网络中的位置 数据链路层位于物理层之上、网络层之下。物理层负责把比特转换成电信号、光信号或无线电波并在传输介质上传播&#xff0c;而数据链路层要解决的问题更进一步&#xf…...

2026边墙风机行业深度选型对比|英飞风机、格林瀚克、依必安派特三家核心全解析

在工业制造智能化升级、新型基础设施持续落地双重政策加持下&#xff0c;我国边墙风机行业保持7.8%年均稳健增长。行业需求已彻底告别单一基础通风换气&#xff0c;全面升级为高效节能、安全合规、场景精细化适配三维核心标准&#xff0c;市场梯队分化明显&#xff0c;各厂商技…...

chatgptimage2.0手机版app下载安装教程gptimage2.0手机版下载安装教程安卓版app鸿蒙版苹果版IOS电脑版安装包下载地址

&#x1f4e2;提示&#xff1a;资源链接地址放在文章结尾&#x1f447;&#x1f447;&#xff0c;往下翻就行 &#x1f4e2;提示&#xff1a;资源链接地址放在文章结尾&#x1f447;&#x1f447;&#xff0c;往下翻就行 chatgptimage2.0手机版app下载安装教程gptimage2.0手机…...

Django ORM 中的 Many-to-Many 关系处理

在 Django 开发中,处理数据库关系是常见任务之一。尤其是 Many-to-Many(多对多)关系的处理,常常需要一些技巧来高效地获取和组织数据。本文将通过一个实际案例,探讨如何在 Django ORM 中处理多对多关系,并展示如何将复杂的数据结构转化为易于使用的格式。 背景介绍 假设…...

别再折腾MCP2515了!手把手教你用ESP32内置TWAI外设实现CAN通信(附完整代码与500K波特率避坑指南)

ESP32内置TWAI外设实战&#xff1a;抛弃MCP2515的高效CAN通信方案 当我在智能家居控制项目中第一次尝试用ESP32连接汽车ECU时&#xff0c;MCP2515模块的SPI速率瓶颈让我头疼不已。直到发现ESP32内部沉睡的TWAI外设——这个被多数开发者忽视的硬件级CAN控制器&#xff0c;才真正…...

Flutter 翻页动画:前后翻页实现

在现代移动应用开发中,用户体验至关重要。一个好的阅读体验不仅需要内容丰富,还需要流畅的界面交互。今天,我们将探讨如何在 Flutter 中实现一个可以前后翻页的图书阅读页面。 背景 在 Flutter 中实现翻页效果,通常会使用第三方库,如 flip_widget 或 page_flip。这些库提…...

定制开发落地实践:D-coding 销售采购系统赋能上海多终端软件项目建设

摘要&#xff1a; 在订单驱动型企业中&#xff0c;销售与采购往往不是两条独立流程&#xff0c;而是一条从客户需求、询价比价、采购执行、物流跟踪到开票结算的连续业务链。本文围绕销售采购系统的核心场景&#xff0c;结合上海APP开发、上海小程序开发、上海软件定制开发的实…...

机器学习分类算法超参数调优实战指南

1. 机器学习分类算法超参数调优实战指南在机器学习项目中&#xff0c;算法超参数的选择往往决定了模型的最终表现。与模型训练过程中自动学习的参数不同&#xff0c;超参数需要我们在训练前手动设置。这就引出了一个关键问题&#xff1a;面对众多超参数选项&#xff0c;我们该如…...

云原生数据管道实现

云原生数据管道实现 1. 数据管道的概念与价值 数据管道是指将数据从源系统传输到目标系统的一系列处理步骤&#xff0c;包括数据提取、转换和加载&#xff08;ETL&#xff09;过程。在云原生环境中&#xff0c;数据管道变得尤为重要&#xff0c;因为企业需要处理和分析大量的数…...

Java 刷题必备:HashMap、HashSet、ArrayList 超全速记手册

在 Java 算法刷题和日常开发中&#xff0c;HashMap、HashSet、ArrayList 是使用率最高的三个集合工具&#xff0c;堪称「刷题三巨头」。本文整理了它们的基础用法、核心方法、高频场景、易错点&#xff0c;纯干货无废话&#xff0c;背会就能直接上手写代码&#xff01;一、Hash…...

蓝桥杯单片机实战:NE555频率测量与定时器配置详解

1. NE555频率测量基础与硬件连接 在蓝桥杯单片机竞赛中&#xff0c;NE555频率测量是常见的基础任务。NE555作为经典定时器芯片&#xff0c;能产生稳定的方波信号。测量其输出频率的核心思路是将信号接入单片机计数器引脚&#xff0c;通过定时采样计数值换算频率。这里有个关键细…...

基于TypeScript的AI Agent开发SDK:模块化架构与工程实践指南

1. 项目概述&#xff1a;一个为AI Agent开发赋能的TypeScript SDK如果你正在尝试构建一个能够自主思考、调用工具、并与用户进行复杂交互的AI智能体&#xff08;Agent&#xff09;&#xff0c;那么你很可能已经感受到了其中的复杂性。从理解用户意图、规划任务步骤&#xff0c;…...

Qwen3.5-2B应用场景:教育行业作业批改辅助——截图题+多步解题推理

Qwen3.5-2B应用场景&#xff1a;教育行业作业批改辅助——截图题多步解题推理 1. 教育行业的作业批改痛点 1.1 传统批改方式的挑战 人工批改耗时&#xff1a;教师每天需要花费大量时间批改作业&#xff0c;特别是数学、物理等需要逐步推理的科目截图题处理困难&#xff1a;学…...

别再折腾双系统了!用WSL2+CentOS7+xfce4打造你的Windows原生Linux开发桌面

告别双系统&#xff1a;用WSL2CentOS7构建无缝Linux开发环境 每次重启切换操作系统的等待&#xff0c;虚拟机卡顿时的烦躁&#xff0c;开发环境不一致导致的调试噩梦——这些困扰开发者多年的问题&#xff0c;其实早该被扔进技术历史的垃圾桶。当WSL2遇上轻量级桌面环境&#x…...

三大突破:FakeLocation如何通过应用级Hook技术实现Android精准虚拟定位

三大突破&#xff1a;FakeLocation如何通过应用级Hook技术实现Android精准虚拟定位 【免费下载链接】FakeLocation Xposed module to mock locations per app. 项目地址: https://gitcode.com/gh_mirrors/fak/FakeLocation 在移动应用生态中&#xff0c;位置隐私保护已成…...

JavaScript中Symbol-keyFor检索全局符号键名逻辑

Symbol.keyFor()仅对Symbol.for()创建的全局Symbol有效&#xff0c;返回其键名字符串&#xff1b;对Symbol()创建的局部Symbol或内建Symbol均返回undefined。Symbol.keyFor() 只对通过 Symbol.for() 注册到全局符号注册表的 Symbol 有效&#xff0c;它返回该 Symbol 对应的键名…...

JavaScript中函数声明位置对解析器预编译的影响

函数声明会被完整提升&#xff0c;包括函数名和函数体&#xff1b;函数表达式仅变量名提升&#xff0c;赋值不提升&#xff1b;块级函数声明行为不统一&#xff0c;严格模式下受TDZ约束&#xff1b;箭头函数和class声明不享受函数声明式提升。JavaScript中函数声明会被提升&…...

AI试衣算法源码-一键生成模特试衣图-支持多角度+纹理自适应-PHP+MySQL-电商降本增效

温馨提示&#xff1a;文末有资源获取方式电商服装类目卖家都清楚&#xff0c;一套像样的模特试衣图拍摄下来&#xff1a;模特费用&#xff1a;500-2000元/天摄影师灯光&#xff1a;800-3000元/天化妆师场地&#xff1a;500-1500元/天后期修图&#xff1a;20-100元/张一套衣服拍…...

工作绩效数据—>工作绩效信息—>工作绩效报告

在软考10大管理知识域&#xff0c; 经常会看到这3个词。 所有10大管理都有工作绩效数据、工作绩效信息&#xff0c;在整合管理、沟通管理中还包括工作绩效报告 这3个词是有先后顺序的&#xff0c; 第一 数据&#xff0c; 第二 信息&#xff0c; 第三 报告。 从5大过程组的角度看…...

避开海面遥感坑:实测讲解SAR不同入射角(20°-70°)下海面回波信号的差异与选择

避开海面遥感坑&#xff1a;实测讲解SAR不同入射角&#xff08;20-70&#xff09;下海面回波信号的差异与选择 海洋监测的精度往往藏在雷达参数的细节里。去年参与南海风场反演项目时&#xff0c;团队因入射角选择不当导致数据信噪比骤降30%&#xff0c;不得不返工重飞。这个教…...

AI一键换衣换装系统-自研CGSY算法-模特自动适配-开源SaaS-可二开无限开账号

温馨提示&#xff1a;文末有资源获取方式在电商服装类目中&#xff0c;传统模特拍摄成本高、周期长&#xff0c;一套图动辄几千上万。如今&#xff0c;基于自研CGSY算法的AI换衣系统正改变这一局面。核心功能列表多类型服装支持&#xff1a;上传模特图上衣/下衣/连衣裙图&#…...