3D生成技术再创新高:VAST发布Tripo 2.0,提升AI 3D生成新高度
随着《黑神话·悟空》的爆火,3D游戏背后的AI 3D生成技术也逐渐受到更多的关注。虽然3D大模型的热度相较于语言模型和视频生成技术稍逊一筹,但全球的3D大模型玩家们却从未放慢脚步。无论是a16z支持的Yellow,还是李飞飞创立的World Labs,3D大模型的迭代速度一直在稳步前进。近日,国内3D大模型的领军者VAST发布了最新版本的大模型——Tripo 2.0。这个基于千万级高质量原生数据库训练的超强模型支持文字、单图、多图输入,并在几何精细度和图像还原度上表现出色。
Tripo 2.0的生成速度极为惊人。首先,它可以在几秒钟内生成几何预览,接着迅速生成纹理和PBR材质,将模型的细节展现得一览无遗。无论是复杂的卡通人物、怪物,还是精细纹理的物品,Tripo 2.0都能够轻松应对。在短短几秒内生成的3D模型,其细节和质量甚至比肩传统人工建模师需要数小时才能完成的成果。
Tripo 2.0的技术突破
VAST团队通过一系列技术创新大幅提升了3D模型生成的效率和质量。Tripo 2.0采用了DiT和U-Net的混合架构,既能够捕捉3D结构的全局上下文,又能够保留局部特征的精细度,使得生成的效果更加细腻。此外,Tripo 2.0利用了最先进的流模型与蒸馏算法,在不牺牲生成质量的前提下,显著提升了效率。无论是生成形状的准确性、材质的精度,还是整体细节的表现,Tripo 2.0都达到了一个全新的高度。
Tripo 2.0的一大亮点在于其高可控性。用户可以通过多模态输入生成3D模型,并能够通过负向prompt控制模型内容的生成。除此之外,用户还可以调整输出模型的姿态和比例,甚至可以选择模型的姿势,如“A-pose”或“T-pose”,这大大提升了模型生成的灵活性和适用性。
Tripo 2.0文生3D模型实测
先来一波文生3D效果的实测。首先生成的是“动漫少女的半身形象”,在复杂结构的生成上,细节十分丰富:

接下来,我们为其添加皮肤。在不超过20秒的时间内,模型获得了精细的纹理和层次感,人工建模可能需要成百上千倍的时间才能达到这个水平。

换个题目,我们尝试生成卡通形象的全身形象——卡通小矮人。结果相当可爱(配上宋丹丹式的笑声)

还生成了一个带有复杂细节的小怪物。即便放大模型并360度旋转查看,依然没有发现bug和瑕疵。对于人工建模师而言,怪物背后的尖刺细节本是个噩梦,但对Tripo来说毫无压力。

进一步加大难度,Tripo依旧能完美驾驭复杂的3D模型生成任务,其透视结构理解能力十分出色。

最后我们生成了一个购物车,这样的复杂任务对Tripo来说也毫无难度。

Tripo 2.0图生3D模型实测
再来看一波图生3D的效果。

图生3D模型的生成算法特别考验对图片空间信息的理解和还原度。我们横向对比了一些市场上的其他玩家,发现Tripo 2.0在几何形状的还原度和完整度上表现尤为突出。

测试完植物后,我们尝试了无生命物体的图生模型。比如一个复活节彩蛋的图片,Tripo 2.0生成的3D模型浮雕感最强,纹理细节也是最精致的。

通过多次测试,发现Tripo 2.0不仅在生成质量上脱颖而出,其高度可控性也是一大特点。
比如生成的PBR材质具有⾼保真度,保留了原图表⾯属性和视觉效果:

再比如,不管侧面、背面,每个面都能捕捉复杂的原图特征:

Tripo 2.0不仅生成质量让人眼前一亮,更高的可控性也是一大特点。
输入不仅支持多模态,当选择文生3D模型模式时,还支持输入负向prompt(就是不让生成模型中带有什么元素)。

对输出模型姿态的控制性也很绝。
既能自定义所生成3D模型头、腿、手臂等比例。
还能“A-pose”“T-pose”两个姿势随便选,秒秒钟设定大长腿:

生成好的3D模型还可以一键绑定骨骼、风格化。
3D模型人拥有自己的乐高!

更多玩法大家可以慢慢探索,欢迎大家评论区共创~
VAST的技术积累
VAST自2022年成立以来,已在3D生成技术领域取得了多项突破。Tripo 1.0发布后短短半年内,全球用户生成的3D模型就已超过500万个,远超全球前三大3D模型数据库的总和。如今Tripo 2.0问世,进一步巩固了VAST在3D生成AI领域的领先地位。
VAST的技术团队在学术界同样表现亮眼,多次在Siggraph、CVPR、ICLR等顶级会议上发表研究成果,进一步展示了其在全球3D生成AI领域的影响力。

3D生成技术的未来展望
VAST的目标是打造大众级别的3D内容创作工具,建立3D的UGC内容平台,让3D空间成为用户体验、内容表达、和生产力提升的关键要素。VAST的创始团队拥有深厚的商汤背景,创始人兼CEO宋亚宸和CTO梁鼎都在AI领域有着丰富的经验。

自成立以来,VAST动作频频。年初,VAST亮相了首个3D大模型Tripo 1.0,而仅仅几个月后,他们又与Stability AI合作推出了TripoSR,进一步提升了生成速度和质量。现在,Tripo 2.0已经上线并可在线使用,凭借3D Scaling Law带来的效能提升,Tripo更新周期仅9个月。

△3D建模经典之「牛油果扶手椅」,Tripo 1.0生成
今年3月初,VAST又联合Stable Diffusion背后的Stability AI,共同推出了开源的3D基础模型TripoSR。
因其能够达成“0.5秒完成单图生成3D模型”的成就,在3D生成领域的开源届广受欢迎,至今GitHub上揽星4.3k。

现在,Tripo 2.0又问世了,已经在线可玩。
得益于3D Scaling Law带来的效果提升,Tripo的这三次更新时间跨度仅仅有9个月。
而且有速度也有质量,效果在业内外颇受认可。
拿一则新消息来佐证一下:不久前,世界最大在线游戏开发平台Roblox官宣入局AI 3D生成,但截至目前,Tripo都是Roblox玩家最风靡的3D建模的趁手工具。

VAST未来将持续推动3D生成式AI的技术边界,不断探索3D Scaling Law的研究模型,并进一步提升3D生成模型的质量和扩展能力。我们期待3D生成领域迎来自己的“ChatGPT时刻”。
随着3D生成技术的快速发展,AI在这条赛道上展现了巨大潜力。未来,随着更多技术突破,3D生成或将成为AI领域的下一个焦点。
ChatGPT-4o需要请关注并私信我哦!!!
相关文章:
3D生成技术再创新高:VAST发布Tripo 2.0,提升AI 3D生成新高度
随着《黑神话悟空》的爆火,3D游戏背后的AI 3D生成技术也逐渐受到更多的关注。虽然3D大模型的热度相较于语言模型和视频生成技术稍逊一筹,但全球的3D大模型玩家们却从未放慢脚步。无论是a16z支持的Yellow,还是李飞飞创立的World Labsÿ…...
ONNX Runtime学习之InferenceSession模块
ONNXRuntime库学习之InferenceSession(模块) 一、简介 onnxruntime.InferenceSession 是 ONNX Runtime 中用于加载和运行 ONNX 模型的核心模块。它提供了一种灵活的方式来在多种硬件设备(如 CPU、GPU)上执行 ONNX 模型推理。通过 InferenceSession&…...
【TS】TypeScript内置条件类型-ReturnType
ReturnType 在TypeScript中,ReturnType 是一个内置的条件类型(Conditional Type),它用于获取一个函数返回值的类型。这个工具类型非常有用,特别是当你需要引用某个函数的返回类型,但又不想直接写出那个具体…...
【c语言数据结构】超详细!模拟实现双向链表(初始化、销毁、头删、尾删、头插、尾插、指定位置插入与删除、查找数据、判断链表是否为空)
特点: 结构:指向前一结点指针数据指向后一结点指针由于循环,尾结点的下一结点next指向头结点(哨兵结点)空的双向链表只有自循环的哨兵结点(头结点) 模拟实现双向链表 LIST.h #define _CRT_…...
第十四届蓝桥杯嵌入式国赛
一. 前言 本篇博客主要讲述十四届蓝桥杯嵌入式的国赛题目,包括STM32CubeMx的相关配置以及相关功能实现代码以及我在做题过程中所遇到的一些问题和总结收获。如果有兴趣的伙伴还可以去做做其它届的真题,可去 蓝桥云课 上搜索历届真题即可。 二. 题目概述 …...
(k8s)kubernetes集群基于Containerd部署
资源列表 基础环境 一、基础环境准备 1.1、关闭Swap分区 1.2、添加hosts解析 1.3、桥接的IPv4流量传递给iptables的链 二、准备Containerd容器运行时 2.1、安装Containerd 2.2、配置Containerd 2.3、启动Containerd 三、部署Kubernetes集群 3.1、安装Kubeadm工具 3.2、…...
python内置模块pathlib.Path类操作目录和文件
python自带的pathlib模块提供了很多路径相关的功能,而pathlib.Path 是pathlib 模块中的一个核心类,它代表了文件系统中的一个路径,实现功能比如创建、删除、移动文件,读取和写入文件内容,遍历目录等。 Path 类跟os.pa…...
react开发环境搭建
文章目录 准备工作创建 React 项目使用 create-react-app 创建 React 项目使用 Vite 创建 React 项目启动项目效果安装出现的情况 react项目文件讲解1. 项目根目录2. 其他可能的目录和文件3. 配置文件 准备工作 Node.js 安装方法: 方式一:使用 NVM 安装…...
python 逻辑语句简记
什么语言都少不了逻辑处理语句的使用,python的逻辑处理语句有自身的使用特点,稍稍总结记录一下 一、断言 assert 条件 条件触发,程序执行中断 二、条件语句 if 条件: 执行内容 三、循环语句 while 条件: 循环体…...
8.进销存系统(基于springboot的进销存系统)
目录 1.系统的受众说明 2.开发技术与环境配置 2.1 SpringBoot框架 2.2 Java语言简介 2.3 MySQL环境配置 2.4 idea介绍 2.5 mysql数据库介绍 2.6 B/S架构 3.系统分析与设计 3.1 可行性分析 3.1.1 技术可行性 3.1.2 操作可行性 3.1.3经济可行性 3.4.1 数据库…...
深入理解主键回显:提升数据操作效率与准确性
在软件开发的世界中,主键回显是一个常常被提及但又容易被忽视其重要性的概念。今天,我们就来深入探讨一下主键回显的奥秘。 一、什么是主键回显? 在数据库设计中,主键是用于唯一标识表中每一行记录的字段。而主键回显࿰…...
springboot+阿里云物联网教程
需求背景 最近有一个项目,需要用到阿里云物联网,不是MQ。发现使用原来EMQX的代码去连接阿里云MQTT直接报错,试了很多种方案都不行。最终还是把错误分析和教程都整理一下。 需要注意的是,阿里云物联网平台和MQ不一样。方向别走偏了。 概念描述 EMQX和阿里云MQTT有什么区别…...
QT Creator cmake 自定义项目结构, 编译输出目录指定
1. 目的 将不同的源文件放到不同的目录下进行管理, 如下: build: 编译输出目录 include: 头文件目录 rsources: 资源文件目录 src: cpp文件目录 2. 创建完cmake工程后修改CMakeLists.txt 配置 注 : 这里头文件目录是include, 所以在includ…...
lunar无第三方依赖的公历、农历、法定节假日...日历工具库
文章目录 介绍maven示例示例(前后端)网址文档 介绍 lunar是一款无第三方依赖的公历(阳历)、农历(阴历、老黄历)、道历、佛历工具,支持星座、儒略日、干支、生肖、节气、节日、彭祖百忌、吉神(喜神/福神/财神/阳贵神/阴贵神)方位、胎神方位、…...
(全网最细)ELF文件详解
ELF文件是什么 ELF文件是一种对象文件格式。ELF文件的全程是(Executeable and Linking Format,可执行可链接格式)。ELF文件格式主要有三种: 可重定向文件。可重定向文件就是可以用于和其他对象文件链接来创建一个可执行或者可分…...
Leetcode面试经典150题-39.组合总和
给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 ,并以列表形式返回。你可以按 任意顺序 返回这些组合。 candidates 中的 同一个 数字可以 无限制重复被选取 。如…...
海外云市场分析
海外云市场数据洞察 2024 H1 季度数据 H1季度,全球云基础设施服务指数同比增长21%,达到798亿美元 (相比去年增加134亿美元),三大云服务提供商— AWS,微软Azure 和GCP 营收总增长率为24%,占总市场66%。 其中三大云厂商同比营收增长排序(2024 H1):微软 31%,G…...
显示和隐藏图片【JavaScript】
使用 JavaScript 来实现显示和隐藏图片。下面是一个简单的示例,展示如何通过按钮点击来切换图片的可见性。 实现效果: 代码: <!DOCTYPE html> <html lang"zh"><head><meta charset"UTF-8"><meta name&…...
Java调用数据库 笔记06 (修改篇)
1.创建Java的普通class类 2.加载驱动 Class.forName("com.mysql.jdbc.Driver"); 3.驱动管理类调用方法进行连接,得到连接对象 DriverManager.getConnection(url, user, password); 其中设置参数: static final String url "jdbc:my…...
virtualbox中的网络模式,网络设置,固定IP
virtualbox关于网络设置的文档:https://www.virtualbox.org/manual/topics/networkingdetails.html#networkingdetails DHCP Dynamic Host Configuration Protocol:动态主机配置协议,是专门用来给网络中的节点分发IP地址,确保每…...
【kafka】Golang实现分布式Masscan任务调度系统
要求: 输出两个程序,一个命令行程序(命令行参数用flag)和一个服务端程序。 命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽,然后将消息推送到kafka里面。 服务端程序: 从kafka消费者接收…...
MongoDB学习和应用(高效的非关系型数据库)
一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...
Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...
Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...
条件运算符
C中的三目运算符(也称条件运算符,英文:ternary operator)是一种简洁的条件选择语句,语法如下: 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true,则整个表达式的结果为“表达式1”…...
django filter 统计数量 按属性去重
在Django中,如果你想要根据某个属性对查询集进行去重并统计数量,你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求: 方法1:使用annotate()和Count 假设你有一个模型Item,并且你想…...
Frozen-Flask :将 Flask 应用“冻结”为静态文件
Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是:将一个 Flask Web 应用生成成纯静态 HTML 文件,从而可以部署到静态网站托管服务上,如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...
【配置 YOLOX 用于按目录分类的图片数据集】
现在的图标点选越来越多,如何一步解决,采用 YOLOX 目标检测模式则可以轻松解决 要在 YOLOX 中使用按目录分类的图片数据集(每个目录代表一个类别,目录下是该类别的所有图片),你需要进行以下配置步骤&#x…...
分布式增量爬虫实现方案
之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面,避免重复抓取,以节省资源和时间。 在分布式环境下,增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。 另一种思路:将增量判…...
iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈
在日常iOS开发过程中,性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期,开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发,但背后往往隐藏着系统资源调度不当…...
