走出实验室的人形机器人,将复刻ChatGPT之路?
1月7日,在2025年CES电子展现场,黄仁勋不仅展示了他全新的皮衣和采用Blackwell架构的RTX 50系列显卡,更进一步展现了他对于机器人技术领域,特别是人形机器人和通用机器人技术的笃信。黄仁勋认为机器人即将迎来ChatGPT般的突破,有望成为世界上规模最大的技术产业。
我们知道,人形机器人的技术难度和门槛颇高,很多人认为人形机器人从走出实验室到落地之路必然艰辛。但事实上,近两年,随着通用大模型的发展,人形机器人被赋予了强大的泛化能力,吸引了特斯拉、Open AI、英伟达、三星等科技巨头纷纷布局。这些公司的入局不仅加速了人形机器人的技术落地,也推动了其商业化进程。
今天为大家分析的这份报告便对人形机器人的现状、技术市场等进行了分析,深度剖析了构成人形机器人的执行系统、感知系统和控制系统。
2025,人形机器人元年
如今我们谈及人形机器人似乎早习以为常,但是人形机器人真正的发展其实也只是进入21世纪之后的事情。在早期发展阶段,人形机器人的研究主要集中在高校和科研机构。
1963年,NASA造出了一个名为“机动多关节假人”的机器人,能够模拟35种基本人类动作,这也被认为是人形机器人的鼻祖之一。1973年,日本早稻田大学的加藤一郎团队推出了世界上首个全尺寸人形智能机器人WABOT-1,这也启发了诸多的文艺作品和后续研究。
而中国的人形机器人研究最早可能要追溯到1985年,哈尔滨工业大学首次开启二足步行机器人的相关研究,这也标志着国内人形机器人探索的开启。而进入新世纪以来,人形机器人的研究开始高度集成发展。2000年,本田推出了身高一米二、可用双脚流畅直立行走的Asimo。2005年,本田对Asimo进行了升级改造,实现了人形机器人的奔跑,速度达到6km/h。这一时期,人形机器人在运动能力和智能化方面取得了显著进步,但距离商业化应用仍有较大差距。
真正让人形机器人走进普通人视野的,应该是2016年由波士顿动力打造的Atlas,其拥有运动平衡能力震惊世界。同年,540台优必选Alpha机器人亮相央视春晚,这也展示了人形机器人在娱乐领域的应用潜力。而从2021年开始,人形机器人进入了商业化落地的初级阶段。2021年8月,特斯拉在AI Day上首次发布人形机器人Optimus概念,并于2023年末发布Optimus-Gen2,在感知、大脑、运控能力方面有显著提升。此外,国内如小米、华为等,国外的OpenAI、英伟达、三星等巨头也在纷纷入局,全面推动人形机器人的商业化落地。
那么,为什么巨头们会偏爱人形机器人呢?首先,人形意味着能够很好地适应人类设计的工作和生活场景,无需改变现有设施。其次则是人形机器人在交互过程中更容易被人接受,具有更高的情感价值。但是,人形机器人的主要问题集中于成本和技术两个方面的挑战。例如,波士顿动力的Atlas和本田的Asimo成本均达到了百万美元以上,且在软件的适应性、交互能力、运控平衡能力,以及硬件的续航能力、执行器的精度和功率密度等方面仍有待提升。
那么为什么会判定2025年会是人形机器人元年呢?这主要是从技术发展、商业化落地和政策扶持三个角度所作出的判断。首先,伴随过去几年通用大模型的发展,人形机器人被赋予了强大的泛化能力,使之能够适应更多复杂场景,而且非专业人员无需编程即可实现操作,极大地推动了人形机器人的商业化进程。“具身智能”的机器人不再是机械式地完成单一任务,而是能够基于感知到的任务和环境进行自主规划、决策、行动和执行的新个体,语言交互、智能决策、自主学习、多模态感知等能力全面提升。
其次,科技巨头的加速入局为人形机器人的发展注入动力。除了前文介绍的特斯拉外,OpenAI投资了挪威人形机器人公司1X Technologies,并重启机器人团队;英伟达发布了人形机器人大模型Project GR00T,成立通用具身智能体研究部门。巨头开卷,必然会使这个行业成为“风口上的猪”。而且,人形机器人的应用场景也在从工厂逐步扩展到制造业、商业服务,最终有望进入家庭。报告中预估,至2030年全球人形机器人需求有望达200万台,对应市场空间超5700亿元。
最后,政策层面的支持为人形机器人的发展铺平了道路。2023年,工信部发布的《人形机器人创新发展指导意见》提出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,并明确了人形机器人2025年实现量产、2027年深度应用的发展目标。
人形机器人的技术组成
人形机器人的技术难点不仅仅是AI发展水平,还有大量的硬件系统和零部件等。从大的方向来看,人形机器人主要由执行系统、感知系统和控制系统三个部分构成,这部分在报告中占比较高且涉及大量的产业链相关信息,笔者仅对其中关键价值进行阐述,不做过多参数分析。
执行系统
执行系统是人形机器人的运动基础,决定了其运动的灵活性和精度。其关键部件包括电机、丝杠、减速器、灵活手等。
- 无框力矩电机:主要用于人形机器人的线性关节和旋转关节,提供高精度和高效率的运动控制,是实现复杂动作的关键部件。其能够直接集成到转轴元件上,降低系统惯量,提高运动和稳定时间,增加系统带宽,从而提高整体效率。
- 减速器:精密减速器主要包括3种类型,RV减速器可以提供稳定的机械支撑,确保机器人在高负载下的精度和稳定性;谐波减速器适用于需要高精度控制的关节,提供精细的运动控制;行星减速器适用于需要较高承载能力的关节,确保机器人的稳定性和可靠性。
- 丝杠:人形机器人线性执行器的重要组成部分,是将旋转运动变成直线运动的传动附件。根据摩擦特性可分为滑动丝杠、滚动丝杠和静压丝杠三类。其中,行星滚柱式丝杠负载高、寿命长、速度大,更适用于人形机器人场景,只不过其生产工艺难度较大,门槛较高,但相应的未来发展空间也较为广阔。
- 灵巧手:灵巧手是人形机器人的末端执行器,具备高精度、多功能性和良好的人机交互能力。通过微特电机和多种传动方式的结合,灵巧手能够执行复杂的任务,适应不同的工作场景。其关键技术包括空心杯电机、无刷有齿槽电机、线绳传动、齿轮传动、连杆传动、差速器机构、机械自适应和微型丝杠等,这些技术共同确保了灵巧手的高性能和可靠性。灵巧手在工业制造、医疗领域、服务机器人和特种作业等场景中具有广泛的应用前景。
感知系统
感知系统是人形机器人与环境交互的媒介,其核心就是各类传感器,包括力矩传感器、视觉传感器、触觉传感器和编码器等。
- 力矩传感器:力矩传感器用于检测机器人关节上的扭矩,将扭力的物理变化转化为精确的电信号,为机械臂提供实时的力和力矩信息,从而协助机械臂完成精细和智能的操作任务。在人形机器人中,在对柔顺控制要求高的手腕和脚踝有望使用六维力矩传感器,而身体的其他关节将使用单维的关节扭矩传感器。相比之下,多维力矩传感器工艺要求高且成本较高,但属于未来的发展趋势。
- 视觉传感器:视觉感知系统是机器人的“智慧之眼”,赋予机器人观察世界、规划执行的能力,结合当前技术发展的多模态感知能力和AI算法,能够实现环境理解、任务执行、安全和避障等功能,其也是人形机器人实现人机交互的关键。不过,由于不同传感器在不同环境下的检测能力和可靠性受到限制,因此多传感器融合是当前发展的主要趋势,其可以提高目标检测和识别的准确性。
- 触觉传感器:能够使机器人感知与外界环境接触时的温度、湿度、压力和振动等物理量,以及目标物体材质的软硬程度、物体形状和结构大小等,从而实现对物体的精准定位以及执行各种操作任务。触觉传感器按照原理主要分为电容式、压阻式、压电式、磁敏式、光纤式,其中前三者更为常见,未来主要的发展趋势为大阵列、柔性化、多功能化、多维度、自供电等是触觉传感器的重要发展趋势。
- 编码器:一种用于运动控制的传感器,利用光电、电磁、电容或电感等感应原理检测物体的机械位置及其变化,并将此信息转换为电信号,再将电信号转换为可传输和存储的信号形式,最后反馈给各种运动控制装置。伴随着工业自动化的发展,编码器未来的国产化占比有望进一步提升。
控制系统
主要是指运动控制系统,其主要充当了人形机器人的“小脑”职责,对机械运动部件的位置、速度、方向等进行实时控制,使其按照预期的运动轨迹和规定的运动参数进行运动。控制系统一般包括控制器、执行器和传感器,其性能直接影响机器人的运动精度、稳定性和响应速度。
控制系统的控制器能够接收操作指令后进行运动轨迹规划,为电机或其他动力和执行装置提供正确的控制信号;执行器和传感器上文已经谈及则不再赘述。一般来讲,控制系统的难点在于通信、算力和软件三个部分。
- 通信:众多伺服关节需解决高速同步通信难点,走线要求高。
- 算力:计算复杂度随着自由度的增加而显著增加,算法也需要适应不同工作环境,对控制器的算力要求高。
- 软件:控制系统需提供实时运行框架满足不同运行周期的算法APP实时计算的要求。
机器人控制系统按照控制方式可分为集中控制、主从控制和分布式控制。人形机器人一般采用分布式控制,其通常有数十个关节自由度,而采用分布式控制有利于系统功能的并行执行、缩短响应时间,即每个关节配置一个控制器、胸腔配置总控制器,这也将大幅增加控制器需求。
站在2025年的开端总体来看,人形机器人在过去的几年里有了长足的发展,尤其是大模型等技术的落地为人形机器人商业化链路的构建提供了更好的模板。而伴随各大企业和政策扶持的加码,人形机器人元年的大幕有望展开。
相关文章:

走出实验室的人形机器人,将复刻ChatGPT之路?
1月7日,在2025年CES电子展现场,黄仁勋不仅展示了他全新的皮衣和采用Blackwell架构的RTX 50系列显卡,更进一步展现了他对于机器人技术领域,特别是人形机器人和通用机器人技术的笃信。黄仁勋认为机器人即将迎来ChatGPT般的突破&…...

如何使用wireshark 解密TLS-SSL报文
目录 前言 原理 操作 前言 现在网站都是https 或者 很多站点都支持 http2。这些站点为了保证数据的安全都通过TLS/SSL 加密过,用wireshark 并不能很好的去解析报文,我们就需要用wireshark去解密这些报文。我主要讲解下mac 在 chrome 怎么配置的&…...

电脑有两张网卡,如何实现同时访问外网和内网?
要是想让一台电脑用两张网卡,既能访问外网又能访问内网,那可以通过设置网络路由还有网卡的 IP 地址来达成。 检查一下网卡的连接 得保证电脑的两张网卡分别连到外网和内网的网络设备上,像路由器或者交换机啥的。 给网卡配上不一样的 IP 地…...

定义:除了Vue内置指令以外的其他 v-开头的指令(需要程序员自行扩展定义)作用:自己定义的指令, 可以封装一些 dom 操作, 扩展
1.自定义指令(directives) 1.用法 定义:除了Vue内置指令以外的其他 v-开头的指令(需要程序员自行扩展定义)作用:自己定义的指令, 可以封装一些 dom 操作, 扩展额外功能 语法: ① 局部注册 ●inserted:被绑…...

SpringBoot错误码国际化
先看测试效果: 文件结构 1.中文和英文的错误消息配置 package com.ldj.mybatisflex.common;import lombok.Getter;/*** User: ldj* Date: 2025/1/12* Time: 17:50* Description: 异常消息枚举*/ Getter public enum ExceptionEnum {//# code命名规则:模…...

LeetCode 3066.超过阈值的最少操作数 II:模拟 - 原地建堆O(1)空间 / 优先队列O(n)空间
【LetMeFly】3066.超过阈值的最少操作数 II:模拟 - 原地建堆O(1)空间 / 优先队列O(n)空间 力扣题目链接:https://leetcode.cn/problems/minimum-operations-to-exceed-threshold-value-ii/ 给你一个下标从 0 开始的整数数组 nums 和一个整数 k 。 一次…...

深度学习中的模块复用原则(定义一次还是多次)
文章目录 1. 模块复用的核心原则(1)模块是否有**可学习参数**(2)模块是否有**内部状态**(3)模块的功能需求是否一致 2. 必须单独定义的模块(1)nn.Linear(全连接层&#x…...

Mac——Cpolar内网穿透实战
摘要 本文介绍了在Mac系统上实现内网穿透的方法,通过打开远程登录、局域网内测试SSH远程连接,以及利用cpolar工具实现公网SSH远程连接MacOS的步骤。包括安装配置homebrew、安装cpolar服务、获取SSH隧道公网地址及测试公网连接等关键环节。 1. MacOS打开…...

安全测评主要标准
大家读完觉得有帮助记得关注和点赞!!! 安全测评的主要标准包括多个国际和国内的标准,这些标准为信息系统和产品的安全评估提供了基础和指导。 一、安全测评的主要标准 1.1、国际标准 可信计算机系统评估准则(TC…...

qBittorent访问webui时提示unauthorized解决方法
现象描述 QNAP使用Container Station运行容器,使用Docker封装qBittorrent时,访问IP:PORT的方式后无法访问到webui,而是提示unauthorized,如图: 原因分析 此时通常是由于设备IP与qBittorrent的ip地址不在同一个网段导致…...

504 Gateway Timeout:网关超时解决方法
一、什么是 504Gateway Timeout? 1. 错误定义 504 Gateway Timeout 是 HTTP 状态码的一种,表示网关或代理服务器在等待上游服务器响应时超时。通俗来说,这是服务器之间“对话失败”导致的。 2. 常见触发场景 Nginx 超时:反向代…...

Vue 实现当前页面刷新的几种方法
以下是 Vue 中实现当前页面刷新的几种方法: 方法一:使用 $router.go(0) 方法 通过Vue Router进行重新导航,可以实现页面的局部刷新,而不丢失全局状态。具体实现方式有两种: 实现代码: <template&g…...

MCP Server开发的入门教程(python和pip)
使用python技术栈开发的简单mcp server 需要安装 MCP server的需要使用python-sdk,python需要 3.10,安装如下 pip install mcpPS: MCP官方使用的是uv包管理工具,我平时使用pip比较多,所以文中以pip为主。因为mcp的一些依赖包版本并不是最新的,所以最好弄一个干净的环境…...

手撕Transformer -- Day7 -- Decoder
手撕Transformer – Day7 – Decoder Transformer 网络结构图 目录 手撕Transformer -- Day7 -- DecoderTransformer 网络结构图Decoder 代码Part1 库函数Part2 实现一个解码器Decoder,作为一个类Part3 测试 参考 Transformer 网络结构 Decoder 代码 Part1 库函数…...

C#异步和多线程,Thread,Task和async/await关键字--12
目录 一.多线程和异步的区别 1.多线程 2.异步编程 多线程和异步的区别 二.Thread,Task和async/await关键字的区别 1.Thread 2.Task 3.async/await 三.Thread,Task和async/await关键字的详细对比 1.Thread和Task的详细对比 2.Task 与 async/await 的配合使用 3. asy…...

使用分割 Mask 和 K-means 聚类获取天空的颜色
引言 在计算机视觉领域,获取天空的颜色是一个常见任务,广泛应用于天气分析、环境感知和图像增强等场景。本篇博客将介绍如何通过已知的天空区域 Mask 提取天空像素,并使用 K-means 聚类分析天空颜色,最终根据颜色占比查表得到主导…...

145.《redis原生超详细使用》
文章目录 什么是redisredis 安装启动redis数据类型redis key操作key 的增key 的查key 的改key 的删key 是否存在key 查看所有key 「设置」过期时间key 「查看」过期时间key 「移除」过期时间key 「查看」数据类型key 「匹配」符合条件的keykey 「移动」到其他数据库 redis数据类…...

Pytorch基础教程:从零实现手写数字分类
文章目录 1.Pytorch简介2.理解tensor2.1 一维矩阵2.2 二维矩阵2.3 三维矩阵 3.创建tensor3.1 你可以直接从一个Python列表或NumPy数组创建一个tensor:3.2 创建特定形状的tensor3.3 创建三维tensor3.4 使用随机数填充tensor3.5 指定tensor的数据类型 4.tensor基本运算…...

【SH】Xiaomi9刷Windows10系统研发记录 、手机刷Windows系统教程、小米9重装win10系统
文章目录 参考资料云盘资料软硬件环境手机解锁刷机驱动绑定账号和设备解锁手机 Mindows工具箱安装工具箱和修复下载下载安卓和woa资源包第三方Recovery 一键安装Windows准备工作创建分区安装系统 效果展示Windows和Android一键互换Win切换安卓安卓切换Win 删除分区 参考资料 解…...

excel仅复制可见单元格,仅复制筛选后内容
背景 我们经常需要将内容分给不同的人,做完后需要合并 遇到情况如下 那是因为直接选择了整列,当然不可以了。 下面提供几种方法,应该都可以 直接选中要复制区域然后复制,不要选中最上面的列alt;选中可见单元格正常复制ÿ…...

HBASE学习(一)
1.HBASE基础架构, 1.1 参考: HBase集群架构与读写优化:理解核心机制与性能提升-CSDN博客 1.2问题: 1.FLUSH对hbase的影响 2. HLog和memstore的区别 hlog中存储的是操作记录,比如写、删除。而memstor中存储的是写入…...

element select 绑定一个对象{}
背景: select组件的使用,适用广泛的基础单选 v-model 的值为当前被选中的 el-option 的 value 属性值。但是我们这里想绑定一个对象,一个el-option对应的对象。 <el-select v-model"state.form.modelA" …...

Sprint Boot教程之五十八:动态启动/停止 Kafka 监听器
Spring Boot – 动态启动/停止 Kafka 监听器 当 Spring Boot 应用程序启动时,Kafka Listener 的默认行为是开始监听某个主题。但是,有些情况下我们不想在应用程序启动后立即启动它。 要动态启动或停止 Kafka Listener,我们需要三种主要方法…...

C:JSON-C简介
介绍 JSON-C是一个用于处理JSON格式数据的C语言库,提供了一系列操作JSON数据的函数。 一、json参数类型 typedef enum json_type { json_type_null, json_type_boolean, json_type_double, json_type_int, json_type_object, json_type_ar…...

业务幂等性技术架构体系之消息幂等深入剖析
在系统中当使用消息队列时,无论做哪种技术选型,有很多问题是无论如何也不能忽视的,如:消息必达、消息幂等等。本文以典型的RabbitMQ为例,讲解如何保证消息幂等的可实施解决方案,其他MQ选型均可参考。 一、…...

【Go】Go Gin框架初识(一)
1. 什么是Gin框架 Gin框架:是一个由 Golang 语言开发的 web 框架,能够极大提高开发 web 应用的效率! 1.1 什么是web框架 web框架体系图(前后端不分离)如下图所示: 从上图中我们可以发现一个Web框架最重要…...

2024年合肥市科普日小学组市赛第一题题解
9304:数字加密(encrypt)(1) 【问题描述】 在信息科技课堂上,小肥正在思考“数字加密”实验项目。项目需要加密n个正整数,对每一个正整数x加密的规则是,将x的每一位数字都替换为x的最大数字。例如࿰…...

【MySQL实战】mysql_exporter+Prometheus+Grafana
要在Prometheus和Grafana中监控MySQL数据库,如下图: 可以使用mysql_exporter。 以下是一些步骤来设置和配置这个监控环境: 1. 安装和配置Prometheus: - 下载和安装Prometheus。 - 在prometheus.yml中配置MySQL通过添加以下内…...

Wireshark 使用教程:网络分析从入门到精通
一、引言 在网络技术的广阔领域中,网络协议分析是一项至关重要的技能。Wireshark 作为一款开源且功能强大的网络协议分析工具,被广泛应用于网络故障排查、网络安全检测以及网络协议研究等诸多方面。本文将深入且详细地介绍 Wireshark 的使用方法&#x…...

如何在前端给视频进行去除绿幕并替换背景?-----Vue3!!
最近在做这个这项目奇店桶装水小程序V1.3.9安装包骑手端V2.0.1小程序前端 最近,我在进行前端开发时,遇到了一个难题“如何给前端的视频进行去除绿幕并替换背景”。这是一个“数字人项目”所需,我一直在冥思苦想。终于有了一个解决方法…...