WonderWorld:斯坦福与 MIT 联手打造实时交互生成图像,单图秒变 3D 虚拟世界
❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
🚀 快速阅读
- WonderWorld 是从单张图片生成多样化 3D 场景的创新框架。
- 用户可通过文本和相机移动实时交互,生成连贯的虚拟世界。
- 基于 FLAGS 表示法和引导深度扩散技术,生成速度极快,应用广泛。
正文
WonderWorld 是什么

WonderWorld 是斯坦福大学和麻省理工学院共同推出的创新性 3D 场景生成框架,能从单张图片快速生成多样化且连贯的 3D 虚拟世界。基于核心的 Fast LAyered Gaussian Surfels (FLAGS)表示法和引导深度扩散技术,框架在不到 10 秒的时间内完成场景的生成,极大地提高 3D 场景创建的速度,保证新旧场景之间的几何一致性。用户实时地用文本指令和相机移动交互式地塑造和探索虚拟环境,让 WonderWorld 在游戏开发、虚拟现实和创意设计等领域具有广泛的应用潜力。
WonderWorld 的主要功能
- 快速 3D 场景生成:从单张图片快速生成 3D 场景,用户能实时渲染和探索。
- 交互式控制:用户基于移动相机和输入文本提示指定生成场景的内容和位置。
- 多样化场景创建:支持生成具有不同风格和元素的 3D 场景,如城市、自然、幻想等。
- 实时用户交互:在实时渲染的同时,支持用户与生成的场景进行互动,如移动和旋转视角。
- 连贯场景连接:新生成的场景能与现有场景在几何上保持连贯,形成统一的虚拟世界。
- 用户驱动的内容创作:用户根据自己的想象和需求,创造出个性化的虚拟环境。
WonderWorld 的技术原理

- Fast LAyered Gaussian Surfels (FLAGS):新颖的场景表示方法,用分层设计和基于几何的初始化加速场景的生成和优化。
- 单视图层生成:用文本引导的扩散模型和单视图图像来生成场景图像,用分层方法填补场景中的遮挡区域。
- 基于几何的初始化:基于估算单目相机的法线和深度信息,快速初始化场景中每个层的几何参数,减少优化时间。
- 引导深度扩散:一种训练自由的方法,用部分可见的深度信息引导深度估计,生成与现有场景几何一致的新场景。
- 实时渲染:在用户交互过程中,能实时渲染相机移动和文本提示生成的场景,提供流畅的用户体验。
WonderWorld 官方演示
演示视频请到公众号对应文章查看。
🥦 微信公众号|搜一搜:蚝油菜花 🥦
如何运行 WonderWorld
目前 WonderWorld 的代码尚未公开,但可以通过以下方式进行初步体验:
- 访问WonderWorld 官网。
- 根据官网提供的示例和指南,了解如何通过文本和相机移动进行交互。
- 等待代码开源后,可以进一步学习和使用其背后的技术。
资源
- 项目官网:kovenyu.com/wonderworld
- arXiv 技术论文:arxiv.org/pdf/2406.09394
❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
🥦 微信公众号|搜一搜:蚝油菜花 🥦
相关文章:
WonderWorld:斯坦福与 MIT 联手打造实时交互生成图像,单图秒变 3D 虚拟世界
❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 🥦 微信公众号ÿ…...
2024年【制冷与空调设备安装修理】考试内容及制冷与空调设备安装修理最新解析
题库来源:安全生产模拟考试一点通公众号小程序 制冷与空调设备安装修理考试内容是安全生产模拟考试一点通总题库中生成的一套制冷与空调设备安装修理最新解析,安全生产模拟考试一点通上制冷与空调设备安装修理作业手机同步练习。2024年【制冷与空调设备…...
PHP const 和 define主要区别
在PHP中,const 和 define 都用于定义常量,但它们有一些关键的区别。以下是它们之间的主要不同点: 定义方式: const:在定义常量时,不需要使用函数形式,而是直接赋值。 const MY_CONSTANT som…...
期中前学习复习总结
期中前终于把每一科的本质给搞明白了。这篇文章也将各学科剖分为两部分。 目录 本质 学法 从问题或条件出发思考问题 从条件出发思考问题 从结论/问题出发思考问题 整理知识与反向押题法 反向押题法 本质 作者是一个理科脑,什么都觉得只要我脑子够新东西我…...
K8S如何基于Istio重新实现微服务
K8S如何基于Istio重新实现微服务 认识 Istio前言Istio 的理念Istio 的架构数据平面控制平面服务与 Istio 的关系 Istio 实践环境准备安装 Helm安装Istio 使用 Istio 代理运行应用情感分析应用的架构使用 Istio 代理运行应用Sidecar 注入Ingress 网关网关资源VirtualService 资源…...
MediaPipe 与 OpenCV 的结合——给心爱的人画一个爱心吧~
目录 概要 实现思路 整体代码实现 效果展示 总结 概要 实时手部检测与绘图应用,通过摄像头捕捉视频流,使用 MediaPipe 识别手部关键点,判断食指是否伸展且其他手指是否弯曲,在满足条件时在画布上绘制圆点,并实时显…...
心觉:成大事,不怕慢,就怕站
Hi,我是心觉,带你用潜意识化解各种焦虑、内耗,建立无敌自信;教你财富精准显化的实操方法;关注我,伴你一路成长! 每日一省写作213/1000天 今天咱们聊聊一个不太花哨,但超重要的话题:…...
练习LabVIEW第二十三题
学习目标: 刚学了LabVIEW,在网上找了些题,练习一下LabVIEW,有不对不好不足的地方欢迎指正! 第二十三题: 建立一个枚举控件,其内容为张三、李四、王五共三位先生,要求当枚举控件显…...
集成对接案例分享:金蝶云与聚水潭数据对接
金蝶云星空与聚水潭的采购入库单数据集成案例分享 在企业信息化管理中,数据的高效流转和准确对接是提升业务效率的关键。本文将深入探讨如何通过轻易云数据集成平台,实现金蝶云星空中的采购入库单数据无缝对接到聚水潭系统中的其他入库单。 本次集成方…...
高级主题-灾难恢复与业务连续性
第一节:灾难恢复与业务连续性 灾难恢复与业务连续性概述 灾难恢复(Disaster Recovery, DR)和业务连续性(Business Continuity, BC)是确保企业能够在遭遇灾难或意外中断后迅速恢复正常运营的关键措施。以下是一些基本…...
R语言实现随机森林分析:从入门到精通
随机森林(Random Forest)是一种流行的机器学习算法,它通过集成多个决策树来提高预测的准确性和鲁棒性。在R语言中,我们可以使用randomForest包来实现随机森林分析。本文将详细介绍如何使用R语言进行随机森林分析,包括数…...
【vs2022】windows可用的依赖预编译库
ffmpeg 、x264 、x265 等。obs是基于qt6+vs2022+64bit obs的官网传统构建已经不用了obs的s2022构建OBS Deps Build 2024-09-12FFmpeg4.4 库,x64 可用。...
基础设施即代码(IaC):自动化基础设施管理的未来
随着云计算和大规模分布式系统的迅速发展,手动管理和配置基础设施的传统方式已逐渐跟不上快速迭代的步伐。于是,基础设施即代码(Infrastructure as Code,IaC)作为一种创新实践,成为现代运维管理的基础。IaC不仅提高了基础设施的配置速度,还提升了系统的一致性和可重复性…...
C# 创建型设计模式----原型模式
1、值类型与引用类型、深拷贝与浅拷贝。 在了解原型模式前得先对这四个知识点有些了解。我先简单介绍一下这四个知识点。 1.1 值类型与引用类型(C#仅有这两种数据类型) 值类型: 常见的值类型:int、long、short、byte、float、double、bool、char、Struct…...
Python数据分析NumPy和pandas(十五、pandas 数据加载、存储和文件格式)
大多数时候,我们要处理分析的数据是存储在不同格式的文件中的,有txt、csv、excel、json、xml以及二进制等磁盘文件格式,还有时候是从数据库以及从Web API中交互获取要处理的数据。现在开始学习如何用pandas从以上内容中输入和输出数据。 读取…...
正则表达式以及密码匹配案例手机号码脱敏案例
目录 正则表达式 什么是正则表达式 语法 定义变量 test方法 exec方法 replace方法 match方法 修饰符 元字符 边界符 单词边界 字符串边界 边界符:^ 边界符:$ 量词 * ? {n} {n,} {n,m} 字符类 []匹配字符集合 .匹配除换行符之外的…...
五、数组切片make
数组&切片&make 1. 数组2. 多维数组3. 切片3.1 直接声明新的切片函数构造切片3.3 思考题3.4 切片和数组的异同 4. 切片的复制5. map5.1 遍历map5.2 删除5.3 线程安全的map 6. nil7. new和make 1. 数组 数组是一个由固定长度的特定类型元素组成的序列,一个数…...
SSA-CNN-LSTM-MATT多头注意力机制多特征分类预测
SSA-CNN-LSTM-MATT多头注意力机制多特征分类预测 目录 SSA-CNN-LSTM-MATT多头注意力机制多特征分类预测分类效果基本介绍程序设计参考资料 分类效果 基本介绍 1.Matlab实现SSA-CNN-LSTM-MATT麻雀算法优化卷积神经网络-长短期记忆神经网络融合多头注意力机制多特征分类预测&…...
51单片机完全学习——LCD1602液晶显示屏
一、数据手册解读 通过看数据手册我们需要知道,这个屏幕每个引脚的定义以及如何进行发送和接收。通过下面这张图我们就可以知道,这些引脚和我们的编程是有关的,需要注意的是,这里我们在接线的时候,一定要把DB0-DB7接到…...
【知识科普】今天聊聊前端打包工具webpack
文章目录 webpack概述1. 入口(Entry)2. 输出(Output)3. Loader4. 插件(Plugins)5. 模式(Mode)6. 浏览器兼容性(Browser Compatibility)7. 环境(En…...
第19节 Node.js Express 框架
Express 是一个为Node.js设计的web开发框架,它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用,和丰富的HTTP工具。 使用Express可以快速地搭建一个完整功能的网站。 Expre…...
黑马Mybatis
Mybatis 表现层:页面展示 业务层:逻辑处理 持久层:持久数据化保存 在这里插入图片描述 Mybatis快速入门 概念解析 TRS(Total Return Swap)收益互换是一种金融衍生工具,指交易双方约定在未来一定期限内,基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...
前端开发面试题总结-JavaScript篇(一)
文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包(Closure)?闭包有什么应用场景和潜在问题?2.解释 JavaScript 的作用域链(Scope Chain) 二、原型与继承3.原型链是什么?如何实现继承&a…...
微信小程序云开发平台MySQL的连接方式
注:微信小程序云开发平台指的是腾讯云开发 先给结论:微信小程序云开发平台的MySQL,无法通过获取数据库连接信息的方式进行连接,连接只能通过云开发的SDK连接,具体要参考官方文档: 为什么? 因为…...
【Go语言基础【12】】指针:声明、取地址、解引用
文章目录 零、概述:指针 vs. 引用(类比其他语言)一、指针基础概念二、指针声明与初始化三、指针操作符1. &:取地址(拿到内存地址)2. *:解引用(拿到值) 四、空指针&am…...
音视频——I2S 协议详解
I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议,专门用于在数字音频设备之间传输数字音频数据。它由飞利浦(Philips)公司开发,以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...
GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...
SQL慢可能是触发了ring buffer
简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...
