当前位置: 首页 > article >正文

【粉丝福利社】三维重建技术与实践:基于NeRF与3DGS

【行业认证·权威头衔】✔ 华为云天团核心成员特约编辑/云享专家/开发者专家/产品云测专家✔ 开发者社区全满贯CSDN博客商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金亚马逊51CTO顶级博主✔ 技术生态共建先锋横跨鸿蒙、云计算、AI等前沿领域的技术布道者【荣誉殿堂】 连续三年蝉联华为云十佳博主2022-2024 双冠加冕CSDN年度博客之星TOP220222023 十余个技术社区年度杰出贡献奖得主【知识宝库】覆盖全栈技术矩阵◾ 编程语言.NET/Java/Python/Go/Node…◾ 移动生态HarmonyOS/iOS/Android/小程序◾ 前沿领域物联网/网络安全/大数据/AI/元宇宙◾ 游戏开发Unity3D引擎深度解析文章目录前言一、为何需要 “三位一体”具身智能的三块拼图1.多模态LLM机器的 “认知中枢”2.3DGS机器的“空间眼”3.Flow-based 生成模型机器的 “运动神经”二、从感知到行动具身智能的闭环结构三、技术趋势从分散方案走向统一范式四、工程现实3DGS 落地仍面临挑战五、写在最后一条仍在展开的技术路径前言过去十年AI 学会了 “读” 和 “写”而未来十年AI 必须学会 “看”、“建” 和 “做”。近两年一个原本属于计算机图形学与三维重建领域的技术 —— 3D Gaussian Splatting3DGSKerbl et al., 2023—— 正在快速 “出圈”。从学术论文到工业系统其演进速度远超预期。更值得关注的是这种演进不再局限于 “渲染更快”而开始指向一个更宏大的问题机器如何在真实世界中构建、维护并使用一个可计算的三维表示。一个正在发生的信号从渲染技术到世界级系统2026年4月World Labs 发布了 Spark 2.0对基于 3DGS 的 Web 端渲染系统进行了系统级升级。与早期工作不同Spark 2.0 的目标不再只是 “高效渲染单个场景”而是在任意设备上流式加载并实时呈现一个可扩展的三维世界。其核心技术包括连续层次细节Level-of-Detail, LoD系统基于高斯层次结构splat tree动态选择渲染子集使计算复杂度与视点相关而非与场景规模相关渐进式流式加载Progressive Streaming按视点优先级逐步加载 3DGS 数据实现“边加载边交互”虚拟内存机制Virtual Memory在固定 GPU 内存预算下调度海量高斯数据使浏览器端也能访问超大规模三维场景。从系统角度看这些设计带来了三个关键变化渲染复杂度与场景规模解耦数据可跨设备流式访问多对象可统一组织于同一空间这意味着3DGS 正在从 “单场景表示方法”演进为“可组合的三维世界表示系统”。值得注意的是Spark 最初即服务于 “世界模型World Model” 方向的探索。在这一背景下3DGS 不再只是图形学技术而开始承担 “世界状态表达” 的角色。一、为何需要 “三位一体”具身智能的三块拼图如果将视角进一步拉高可以看到一个逐渐清晰的技术共识通用具身智能依赖三类能力的统一 —— 认知、空间与行动。这对应着一个具有现实可行性的技术组合具身智能 ≈ 多模态 LLM认知 3DGS空间 Flow-based 生成模型行动对应 “决策 — 表征 — 控制” 的经典分层结构。1.多模态LLM机器的 “认知中枢”当人类发出指令 “把那个红色的杯子拿给我”系统首先需要完成语义理解、跨模态对齐、任务分解。多模态模型如 GPT-4V、Qwen-VL、LLaVA已经在这一层面表现出强大能力Liu et al., 2023。但其输出仍然是符号层信息无法直接回答杯子的位置与姿态、是否被遮挡、抓取所需的物理约束。这些问题需要一个空间层表示来承载。2.3DGS机器的“空间眼”传统三维表示存在明显取舍Mesh/点云几何明确但表达能力有限NeRF 表达连续但推理成本高Mildenhall et al., 2020。3DGS 提供了一种新的平衡实时渲染能力、显式结构高斯集合、可微分优化、可扩展属性语义/动态。从表示学习角度看3DGS 是一种介于显式几何与隐式场之间的半显式可微表示Jun-seong Kim et al., 2025。近期工作进一步探索将语义信息注入 3DGS使其从 “可视化表示” 走向 “可查询空间结构”。换句话说3DGS 正在成为一种 “空间数据库”向着一种 “可查询的空间表示” 演进。3.Flow-based 生成模型机器的 “运动神经”在行动层问题转化为如何生成连续且可控的动作。扩散策略方法如 Diffusion Policy已验证其表达能力Chi et al., 2023但推理成本较高。Flow Matching 提供了一种更高效的路径Lipman et al., 2022将生成过程建模为概率流使用常微分方程 (ODE, Ordinary Differential Equation) 进行连续求解支持更少步甚至单步生成。结合 Transformer 架构如 DiT可在保证表达能力的同时显著降低延迟Peebles Xie, 2023。从方法论上看Flow Matching 正在成为连接扩散模型与连续流模型的关键桥梁。二、从感知到行动具身智能的闭环结构将三者组合可以形成一个完整闭环指令 → LLM任务解析 → 3DGS空间状态 → Flow模型动作生成 → 执行 → 感知反馈 → 更新这一架构具有三个关键特征闭环Closed-loop、实时Real-time、可微Differentiable。三者分工明确LLM 负责决策与规划3DGS 负责世界建模Flow-based 模型负责控制动作生成。三、技术趋势从分散方案走向统一范式从学术界到工业界不同技术路径正在收敛多模态模型统一认知能力三维表示强化空间理解生成模型驱动连续控制。其共同指向是构建一个统一的 “认知 — 空间 — 行动” 系统。而 3DGS 的出现使 “空间层” 首次具备与其他两层匹配的工程可行性。四、工程现实3DGS 落地仍面临挑战尽管前景清晰但工程实践仍存在门槛理论复杂体渲染、球谐函数等、工程链路长SfM/MVS → NeRF → 3DGS、性能优化困难GPU 与数据结构。当前开源生态的普遍问题是“能跑通” 不等于 “能理解、能优化”。五、写在最后一条仍在展开的技术路径三维重建技术正在经历一次重要转变从离线建模工具到在线感知系统再到具身智能基础设施。3DGS 只是这一过程中的关键节点但其背后是一个更深层的趋势世界模型正在从抽象走向可计算、可交互、可实时。对于希望系统掌握这一领域的读者我们在《三维重建技术与实践基于NeRF与3DGS》中尝试从多视图几何、神经表示到工程实现进行完整梳理。这本书更关注技术体系、原理理解、工程贯通。如果你正在思考空间智能或具身系统这或许是一条值得深入的路径。需要完全了解本书可以看下面链接地址《三维重建技术与实践基于NeRF与3DGS》

相关文章:

【粉丝福利社】三维重建技术与实践:基于NeRF与3DGS

💎【行业认证权威头衔】 ✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家 ✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主 ✔ 技术生态共建先锋&am…...

苹果与伊利诺伊大学:四步AI绘图实现媲美五十步生成质量能力提升

这项由苹果公司(Apple)与伊利诺伊大学香槟分校(UIUC)联合开展的研究,于2026年5月以预印本形式发布在arXiv平台,论文编号为arXiv:2605.08078。研究提出了一种名为"正则化轨迹模型"(Nor…...

多Agent协作是趋势,但谁来管这些Agent

如果你最近参加过AI相关的技术沙龙或者行业峰会,大概率会听到一个词:多Agent协作。简单说就是,不是一个AI帮你干完所有事,而是多个AI各司其职、互相配合。比如一个Agent负责理解需求,一个Agent负责写代码,一…...

设计器模版底图,一直渲染错误,是因为第一张图变形后内存中图片数据被改了,其他尺码一直错误

这其实是你们现在更需要的组合:不是只看 decode(),而是再确认“这次 decode 对应的还是当前这张图”。再确认“这次 decode 对应的还是当前这张图” 是怎么做到的,详细列举代码我直接从现在这次改动的代码里,把"确认图片身份…...

3分钟掌握RPG Maker资源解密:纯前端工具轻松破解加密文件

3分钟掌握RPG Maker资源解密:纯前端工具轻松破解加密文件 【免费下载链接】RPG-Maker-MV-Decrypter You can decrypt RPG-Maker-MV Resource Files with this project ~ If you dont wanna download it, you can use the Script on my HP: 项目地址: https://gitc…...

本地部署9B代码智能体:基于vLLM与CoPaw-Flash的实践与深度评估

1. 项目概述:在本地部署与评估一个9B参数的代码智能体最近在折腾一个挺有意思的项目,尝试在单张NVIDIA H100 GPU上,部署并评估一个名为CoPaw-Flash-9B的本地代码智能体。这个模型基于Qwen3.5-9B微调而来,专门针对自主智能体任务进…...

Multi-Agent 落地常见问题:数据质量、模型适配与业务对齐解决方案

Multi-Agent 落地常见问题:数据质量、模型适配与业务对齐解决方案 引言 痛点引入:从「演示天堂」到「生产地狱」的Multi-Agent鸿沟 2023年11月OpenAI DevDay发布的GPT-4o Assistants API、LangChain团队迭代的LangGraph 1.0、Microsoft Research推出的AutoGen Studio 2.0,…...

BilibiliVideoDownload跨平台视频下载工具:从安装到高级配置的完整指南

BilibiliVideoDownload跨平台视频下载工具:从安装到高级配置的完整指南 【免费下载链接】BilibiliVideoDownload Cross-platform download bilibili video desktop software, support windows, macOS, Linux 项目地址: https://gitcode.com/gh_mirrors/bi/Bilibil…...

全栈开发新范式:Vibe-Stack集成技术栈实战解析

1. 项目概述与核心价值 最近在探索全栈开发的新范式时,我注意到了 pastropsucez/vibe-stack 这个项目。乍一看这个名字,你可能会觉得有点“玄学”,但深入探究后,我发现它其实是一个高度集成、开箱即用的现代Web应用开发栈。简单…...

如何让老旧安卓电视焕发新生:mytv-android实现流畅播放体验的完整指南

如何让老旧安卓电视焕发新生:mytv-android实现流畅播放体验的完整指南 【免费下载链接】mytv-android 使用Android原生开发的视频播放软件 项目地址: https://gitcode.com/gh_mirrors/my/mytv-android 你是否还在为家中那台反应迟钝、启动缓慢的旧电视而烦恼…...

BIThesis:让北京理工大学论文排版从烦恼变轻松的智能解决方案

BIThesis:让北京理工大学论文排版从烦恼变轻松的智能解决方案 【免费下载链接】BIThesis 📖 北京理工大学非官方 LaTeX 模板集合,包含本科、研究生毕业设计模板及更多。🎉 (更多文档请访问 wiki 和 release 中的手册&a…...

斯坦福CS229机器学习中文教程:从零到一的实战学习指南

斯坦福CS229机器学习中文教程:从零到一的实战学习指南 【免费下载链接】Stanford-CS-229 A Chinese Translation of Stanford CS229 notes 斯坦福机器学习CS229课程讲义的中文翻译 项目地址: https://gitcode.com/gh_mirrors/st/Stanford-CS-229 你是否曾因英…...

终极IDM试用重置指南:三步实现无限续期的免费解决方案

终极IDM试用重置指南:三步实现无限续期的免费解决方案 【免费下载链接】idm-trial-reset Use IDM forever without cracking 项目地址: https://gitcode.com/gh_mirrors/id/idm-trial-reset IDM Trial Reset是一款专为Internet Download Manager用户设计的实…...

RevokeMsgPatcher终极指南:3分钟实现微信/QQ/TIM永久防撤回

RevokeMsgPatcher终极指南:3分钟实现微信/QQ/TIM永久防撤回 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://gitco…...

ikhono开源框架:AI应用开发的统一抽象与实战指南

1. 项目概述与核心价值最近在AI应用开发圈子里,一个名为ikhono-ai/ikhono的开源项目引起了我的注意。乍一看这个标题,你可能会有点懵,这名字不像我们常见的那些“XX-GPT”、“XX-Agent”那么直白。但恰恰是这种独特的命名,让我产生…...

从收音机到5G:OFDM技术的前世今生,以及它为何成为Wi-Fi和5GNR的基石

从收音机到5G:OFDM技术的前世今生,以及它为何成为Wi-Fi和5GNR的基石 想象一下,你正用手机流畅播放4K视频,同时下载大文件——这背后是一套诞生于上世纪60年代的技术在支撑。OFDM(正交频分复用)的传奇之处在…...

别再让树莓派吃灰了!用腾讯云轻量服务器+frp,5分钟搞定远程SSH和VNC访问

树莓派远程访问实战:5分钟解锁SSH与VNC的轻量级方案 每次打开抽屉看到积灰的树莓派,总有种辜负了这片单板计算机潜力的愧疚感。其实只需一台基础配置的云服务器,就能让闲置设备变身24小时在线的开发工作站。本文将用最简步骤实现:…...

从论文复现到算法创新:我是如何利用VRP标准算例搞定实验对比的

从论文复现到算法创新:VRP标准算例的实战应用指南 在算法研究领域,车辆路径问题(VRP)一直是组合优化中的经典难题。每当我翻开顶级期刊论文,总会被那些漂亮的实验结果所吸引——精确到小数点后三位的优化率、清晰的收敛曲线、严谨的统计检验。…...

iPad协议开发老哥的避坑指南

兄弟们,在微信私域开发这条路上摸爬滚打了好几年,试过各种方案踩过无数坑,今天终于能给大家分享一个真正用着顺手、技术扎实的「宝藏工具」了——wechatapi 的 iPad 协议接口。作为过来人,真心想把这份「避坑指南」和开发经验掏心…...

为什么很多人会误解视频代剪辑

为什么很多人会误解视频代剪辑 你是不是也这样想过:自己拍了几十段素材,找个便宜的剪辑师拼一拼、加个滤镜就行?可发出去后播放量寥寥,朋友说“看不出重点”“节奏拖沓”。其实,问题不在素材本身,而在于你低…...

3个核心功能解密:PT-Plugin-Plus如何实现PT站点种子下载效率提升

3个核心功能解密:PT-Plugin-Plus如何实现PT站点种子下载效率提升 【免费下载链接】PT-Plugin-Plus PT 助手 Plus,为 Microsoft Edge、Google Chrome、Firefox 浏览器插件(Web Extensions),主要用于辅助下载 PT 站的种子…...

PyQt5实战:从Designer拖拽到打包exe,手把手打造你的第一个多页面桌面应用

PyQt5实战:从Designer拖拽到打包exe,手把手打造你的第一个多页面桌面应用 在数字化浪潮席卷各行各业的今天,图形用户界面(GUI)开发已成为程序员必备技能之一。而PyQt5作为Python最强大的GUI框架,凭借其丰富…...

在Windows 10上搞定OpenPCDet:从KITTI数据集训练到自定义数据集的完整避坑指南

在Windows 10上搞定OpenPCDet:从KITTI数据集训练到自定义数据集的完整避坑指南 3D目标检测技术正在重塑自动驾驶、机器人感知等领域的发展格局。作为该领域的重要开源框架,OpenPCDet以其模块化设计和出色的性能表现吸引了大量研究者和开发者。然而&#…...

别再只会用555了!用继电器搭建LED闪烁电路的3个隐藏知识点(附电路图)

继电器驱动LED闪烁电路:超越555的三大物理奥秘与实战设计 在电子爱好者的世界里,LED闪烁电路就像"Hello World"之于程序员,是入门必修的第一课。大多数教程会引导初学者使用555定时器这种"标准化方案",却很少…...

工业微功率DC-DC选型性能对比解析:钡特电源 DH1-24S05LS 与 H2405S-1WR3 封装对照互通

在工业控制、仪器仪表、通信设备等中低功率供电场景,1W 级隔离工业 DC-DC 模块电源凭借小体积、高可靠、易集成的特性,成为硬件工程师选型的核心品类。直流电源模块作为电子系统的供电核心,其性能稳定性、环境耐受性与长期可靠性直接决定设备…...

自我提升智能体的自进化原理和实践

自我提升智能体skill赋予了AI助手从错误中反思、学习并自动繁衍新通用技能的持续进化能力。 1 实际案例 帮我运行测试,看看为什么登录模块失败。 流程如下: 第一步,任务开始前,Hook 触发 activator.sh(通过 UserPromptSubmit 触发)。它不会输出一大堆规则,只是提醒 AI 一…...

NoFences终极指南:免费开源桌面分区工具彻底解决Windows桌面混乱问题

NoFences终极指南:免费开源桌面分区工具彻底解决Windows桌面混乱问题 【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 还在为杂乱的Windows桌面而烦恼吗&#xff1…...

2026各个行业可以考的资格经济学专业证书

2026年经济学专业必考高含金量证书指南:CDA数据分析师领衔在数字经济时代,经济学专业人才需通过权威证书提升竞争力。2026年,数据分析、金融、审计等领域的资格证书将成为职业发展的关键筹码。本文将重点解析CDA数据分析师等热门证书的报考条…...

【claude code agent 实践7】后台任务机制深度解析: 从S02到S08的演进

后台任务机制深度解析 文章目录后台任务机制深度解析🔄 s02 vs s08 核心变化对比🔍 新增核心逻辑详解1. BackgroundManager类(后台任务管理器)2. agent_loop关键变化 - 每次LLM调用前排空队列📊 后台任务完整工作流程图…...

PowerToys Awake:3种模式彻底解决Windows电脑意外休眠的烦恼

PowerToys Awake:3种模式彻底解决Windows电脑意外休眠的烦恼 【免费下载链接】PowerToys Microsoft PowerToys is a collection of utilities that supercharge productivity and customization on Windows 项目地址: https://gitcode.com/GitHub_Trending/po/Pow…...