当前位置: 首页 > article >正文

李飞飞World Labs开源革命性Web端3D渲染器Forge!3D高斯溅射技术首次实现全平台流畅运行

在AI与3D技术深度融合的今天,李飞飞领衔的World Labs团队再次成为行业焦点。今日,他们正式开源了Forge——一款专为Web端设计的3D高斯溅射(3D Gaussian Splatting)渲染器,不仅支持THREE.js生态,更能在手机、XR设备等低功耗硬件上实现实时流畅渲染。这一工具的诞生,标志着3D生成与交互技术迈向了更普适、更开放的新阶段。

 

 

一、技术突破:3D高斯溅射为何成为新风口?

3D高斯溅射(3D Gaussian Splatting, 3DGS)是一种基于显式辐射场建模的图形学技术。其核心原理是通过椭球状高斯分布对三维场景进行离散建模,每个高斯粒子包含位置、协方差矩阵(控制形状与方向)、颜色(支持视角相关变化)和透明度等参数。通过可微分光栅化技术,Forge实现了渲染过程与梯度计算的兼容性,从而支持基于优化算法(如梯度下降)的参数迭代,最终拟合多视角输入图像的几何与外观信息。

 

传统方法的局限:

内存占用高:网格模型难以处理百万级复杂场景;

动态交互弱:无法实时修改或动画化3D对象;

跨平台兼容性差:依赖WebGPU等高性能API,移动端体验受限。

3DGS的三大优势:

高效存储

:百万级粒子即可表示复杂场景,内存占用比网格模型降低1-2个数量级;

实时渲染

:基于瓦片的光栅化算法支持1080P分辨率下≥30FPS的流畅体验;

跨领域融合

:可与光线追踪引擎结合,兼顾真实感与创作自由度。

二、Forge的核心突破:让3DGS触手可及

Forge通过GPU优化架构与可编程流水线设计,彻底解决了3DGS的落地难题:

 

1. 全平台兼容,性能"零妥协"

跨设备支持

:覆盖桌面端、移动端(Android/iOS)、XR设备(如Meta Quest 3)及WebXR环境,支持率达98%以上;

动态负载均衡

:根据设备性能自动调整渲染"预算",例如iPhone可处理300万粒子,而低端设备仍能流畅运行百万级场景。

2. 编程式控制,释放创作潜能

动态编辑

:支持实时修改粒子颜色、位移、透明度,并通过骨骼动画系统(双四元数)实现复杂动画;

多Splat交互

:正确排序渲染多个3DGS对象,解决遮挡问题,支持同时渲染多视角输入;

扩展性

:开发者可通过Dyno着色器图形系统注入自定义代码,生成或修改粒子属性,甚至实现粒子级物理模拟。

3. 开源生态,无缝集成THREE.js

格式兼容

:支持主流3DGS文件格式(PLY、SPZ、SPLAT、KSPLAT),并可与传统网格模型混合渲染;

极简开发

:仅需少量代码即可启动渲染器,提供WebGL2回退方案,彻底摆脱对WebGPU的依赖。

三、应用场景:从虚拟世界到工业设计

Forge的开放性使其在多个领域潜力巨大:

 

元宇宙与XR

:构建高保真虚拟场景,支持多人交互与动态内容生成;

游戏开发

:快速生成复杂地形与道具,结合AI实现程序化关卡设计;

工业仿真

:实时渲染机械结构拆解动画,辅助工程师进行可视化调试;

影视创作

:为导演提供低成本预可视化工具,实时预览3D分镜效果。

四、开发者如何快速上手?

访问GitHub仓库:

git clone https://github.com/forge-gfx/forge

基础示例:

import { Forge } from 'forge';

const forge = new Forge();

forge.loadSplat('scene.splat').then(() => {

  forge.start();

});

进阶功能:

通过ForgeViewpoint实现多视角同步渲染;

利用SplatWorker在后台线程处理大规模粒子数据。

五、行业影响:开源推动3D技术民主化

李飞飞在开源公告中表示:"Forge的目标是让开发者像处理三角形网格一样轻松操控3D高斯世界。"这一工具不仅降低了3D内容开发的门槛,更与World Labs此前发布的"单图生成3D世界"技术形成闭环,加速空间智能(Spatial Intelligence)的落地。

 

未来展望:

 

随着多模态AI与大世界模型的成熟,Forge或将成为构建"可交互数字孪生"的基础设施。正如其官网所言:"你的想象力,就是下一个3D世界的边界。"

 

立即体验

👉 访问Forge官网查看网页版Demo

👉 GitHub仓库:https://github.com/forge-gfx/forge

 

相关文章:

李飞飞World Labs开源革命性Web端3D渲染器Forge!3D高斯溅射技术首次实现全平台流畅运行

在AI与3D技术深度融合的今天,李飞飞领衔的World Labs团队再次成为行业焦点。今日,他们正式开源了Forge——一款专为Web端设计的3D高斯溅射(3D Gaussian Splatting)渲染器,不仅支持THREE.js生态,更能在手机、…...

小鹏汽车5月交付新车33525台 同比增长230%

6月1日,小鹏汽车公布5月交付数据,5月小鹏交付新车33,525台,同比增长230%,与4月交付35,045台相比下降4.3%,已连续7个月交付量突破30,000台。2025年1-5月,小鹏汽车累计交付新车162,578台,同比增长…...

OpenCV——Mat类及常用数据结构

Mat类及常用数据结构 一、Mat类简介1.1、矩阵头1.2、矩阵的数据类型1.3、Mat的子类 二、矩阵数据的存储2.1、单通道2.2、多通道 三、创建矩阵的方法3.1、静态方法创建3.2、构造方法创建3.3、读取图像文件创建3.4、克隆创建 四、获取矩阵信息五、矩阵相关操作5.1、获取/修改像素…...

深入解析FutureTask:原理与实战

我们来深入解析 FutureTask。下面将从它们的用法开始,逐步深入到底层实现、方法和接口设计,并探讨它们对于我们自己设计实现以及其他编程实践的学习意义。 主要就是放入等待队列(CAS操作一个链表头),完成任务的线程唤…...

每天总结一个html标签——Audio音频标签

Audio标签 文章目录 Audio标签一、audio标签的定义与介绍1. 定义介绍2. 语法3. 支持的格式4.文本提示 二、audio标签的HTML属性1. autoplay2. loop3. muted4. preload 三、audio标签的常用DOM属性四、audio标签的常用事件四、默认样式五、自定义样式1. 示例2. 代码 六、播放 m3…...

使用 React Native 开发鸿蒙(HarmonyOS)运动健康类应用的系统化准备工作

⚙️ ​​一、环境与工具准备​​ ​​双环境搭建​​ ​​React Native 环境​​:安装 Node.js(≥18.x)、JDK(≥11)、Yarn。​​鸿蒙开发环境​​: 下载 DevEco Studio 4.0 及 HarmonyOS SDK;配…...

web3-Remix部署智能合约到“荷兰式”拍卖及以太坊gas费机制细讲

web3-Remix部署智能合约到“荷兰式”拍卖及以太坊gas费机制细讲 一、使用Remix演示智能合约部署 智能合约的代码编写一般都是在Remix上,Remix的好处的话就是可以在浏览器中快速开发和部署合约,无需在本地安装任何程序,十分适合新手。 对应…...

网络编程及原理(一)

目录 一 . 独立模式与网络互联 二 . 局域网 —— LAN (1)基于网线直连 (2)基于集线器组建 (3)基于交换机组建 (4)基于交换机和路由器组建 三 . 广域网 —— WAN 四 …...

superior哥AI系列第9期:高效训练与部署:从实验室到生产环境

🚀 superior哥AI系列第9期:高效训练与部署:从实验室到生产环境 嘿!小伙伴们!👋 欢迎来到superior哥AI系列第9期!经过前面8期的学习,你已经掌握了深度学习的核心技术。但是&#xff0…...

【Linux】进程 信号保存 信号处理 OS用户态/内核态

🌻个人主页:路飞雪吖~ 🌠专栏:Linux 目录 一、信号保存 ✨进程如何完成对信号的保存? ✨在内核中的表示 ✨sigset_t ✨信号操作函数 🪄sigprocmask --- 获取或设置当前进程的 block表 🪄s…...

[ Qt ] | 与系统相关的操作(一):鼠标相关事件

目录 信号和事件的关系 (leaveEvent和enterEvent) 实现通过事件获取鼠标进入和鼠标离开 (mousePressEvent) 实现通过事件获得鼠标点击的位置 (mouseReleaseEvent) 前一个的基础上添加鼠标释放事件 (mouseDoubleClickEvent) 鼠标双击事件 鼠标移动事件 鼠标滚轮事件 …...

stm32使用hal库模拟spi模式3

因为网上模拟spi模拟的都是模式0,很少有模式3的。 模式3的时序图,在clk的下降沿切换电平状态,在上升沿采样, SCK空闲为高电平 初始化cs,clk,miso,mosi四个io。miso配置为输入,cs、c…...

安装 Nginx

个人博客地址:安装 Nginx | 一张假钞的真实世界 对于 Linux 平台,Nginx 安装包 可以从 nginx.org 下载。 Ubuntu: 版本Codename支持平台12.04precisex86_64, i38614.04trustyx86_64, i386, aarch64/arm6415.10wilyx86_64, i386 在 Debian/Ubuntu 系统…...

Vue-1-前端框架Vue基础入门之一

文章目录 1 Vue简介1.1 Vue的特性1.2 Vue的版本2 Vue的基础应用2.1 Vue3的下载2.2 Vue3的新语法2.3 vue-devtools调试工具3 Vue的指令3.1 内容渲染指令{{}}3.2 属性绑定指令v-bind3.3 事件绑定指令v-on3.4 双向绑定指令v-model3.5 条件渲染指令v-if3.6 列表渲染指令v-for4 参考…...

OurBMC技术委员会2025年二季度例会顺利召开

5月28日,OurBMC社区技术委员会二季度例会顺利召开。本次会议采用线上线下结合的方式,各委员在会上听取了OurBMC社区二季度工作总结汇报,规划了2025年三季度的重点工作。 会上,技术委员会主席李煜汇报了社区2025年二季度主要工作及…...

postman自动化测试

目录 一、相关知识 1.网络协议 2.接口测试 3.编写测试用例 4.系统架构 二、如何请求 1.get请求 ​编辑2.post请求 3.用环境变量请求 4.Postman测试沙箱 一、相关知识 1.网络协议 规定数据信息发送与解析的方式。 网络传输协议 https相比http,信息在网…...

力扣热题100之二叉树的直径

题目 给你一棵二叉树的根节点,返回该树的 直径 。 二叉树的 直径 是指树中任意两个节点之间最长路径的 长度 。这条路径可能经过也可能不经过根节点 root 。 两节点之间路径的 长度 由它们之间边数表示。 代码 方法:递归 计算二叉树的直径可以理解…...

数字人技术的核心:AI与动作捕捉的双引擎驱动(210)

**摘要:**数字人技术从静态建模迈向动态交互,AI与动作捕捉技术的深度融合推动其智能化发展。尽管面临表情僵硬、动作脱节、交互机械等技术瓶颈,但通过多模态融合技术、轻量化动捕方案等创新,数字人正逐步实现自然交互与情感表达。…...

c++ 命名规则

目录 总结1. 类名(Class Names)2. 变量名(Variable Names)3. 函数名(Function Names)4. 宏定义(Macros)5. 命名空间(Namespaces)6. 枚举(Enums&am…...

GRU 参数梯度推导与梯度消失分析

GRU 参数梯度推导与梯度消失分析 1. GRU 前向计算回顾 GRU 单元的核心计算步骤(忽略偏置项): 更新门: z_t σ(W_z [h_{t-1}, x_t]) 重置门: r_t σ(W_r [h_{t-1}, x_t]) 候选状态: ̃h_t tanh(W_h [r_t ⊙ h_{t-1}, x_t]) 新…...

针对KG的神经符号集成综述 两篇

帖子最后有五篇综述的总结。 综述1 24年TKDD 系统性地概述了神经符号知识图谱推理领域的进展、技术和挑战。首先介绍了知识图谱(KGs)和符号逻辑的基本概念,知识图谱被视为表示、存储和有效管理知识的关键工具,它将现实世界的知识…...

RabbitMQ和MQTT区别与应用

RabbitMQ与MQTT深度解析:协议、代理、差异与应用场景 I. 引言 消息队列与物联网通信的重要性 在现代分布式系统和物联网(IoT)生态中,高效、可靠的通信机制是构建稳健、可扩展应用的核心。消息队列(Message Queues&am…...

Vue跨层级通信

下面,我们来系统的梳理关于 Vue跨层级通信 的基本知识点: 一、跨层级通信核心概念 1.1 什么是跨层级通信 跨层级通信是指在组件树中,祖先组件与后代组件(非直接父子关系)之间的数据传递和交互方式。这种通信模式避免了通过中间组件层层传递 props 的繁琐过程。 1.2 适用…...

docker常见命令行用法

🧨 一、关闭和清理 Docker 服务相关命令 🔻 docker-compose down 作用:关闭并删除所有使用当前 docker-compose.yml 启动的容器、网络、挂载卷(匿名的)、和依赖关系。 通俗解释:就像你关掉了一个 App&am…...

Axure设计案例:滑动拼图解锁

设计以直观易懂的操作方式为核心,只需通过简单的滑动动作,将拼图块精准移动至指定位置,即可完成解锁。这种操作模式既符合用户的日常操作习惯,在视觉呈现上,我们精心设计拼图图案,融入生动有趣的元素&#…...

MySQL权限详解

在MySQL中,权限管理是保障数据安全和合理使用的重要手段。MySQL提供了丰富的权限控制机制,允许管理员对不同用户授予不同级别的操作权限。本文将会对MySQL中的权限管理,以及内核如何实现权限控制进行介绍。 一、权限级别 MySQL 的权限是分层…...

基于BP神经网络的语音特征信号分类

基于BP神经网络的语音特征信号分类的MATLAB实现步骤: 1. 数据预处理 信号采样:读取语音信号并进行采样,确保信号具有统一的采样率。例如: [y, Fs] audioread(audio_file.wav); % 读取音频文件预加重:增强高频信号&am…...

解决fastadmin、uniapp打包上线H5项目路由冲突问题

FastAdmin 基于 ThinkPHP,默认采用 URL 路由模式(如 /index.php/module/controller/action),且前端资源通常部署在公共目录(如 public/)下。Uniapp 的历史模式需要将所有前端路由请求重定向到 index.html&a…...

web3-区块链的交互性以及编程的角度看待智能合约

web3-区块链的交互性以及编程的角度看待智能合约 跨链交互性 交互性 用户在某一区块链生态上拥有的资产和储备 ​ 目标:使用户能够把资产和储备移动到另一个区块链生态上 可组合性 使在某一区块链的DAPP能调用另一个区块链上的DAPP 如果全世界都在用以太坊就…...

数据结构(7)—— 二叉树(1)

目录 前言 一、 树概念及结构 1.1树的概念 1.2树的相关概念 1.3数的表示 1.二叉树表示 2.孩子兄弟表示法 3.动态数组存储 1.4树的实际应用 二、二叉树概念及结构 2.1概念 2.2特殊的二叉树 1.满二叉树 2. 完全二叉树 2.3二叉树的性质 2.4二叉树的存储结构 1.顺序存储 2.链式存储…...