当前位置: 首页 > article >正文

MIT AI工具一分钟预览高度逼真3D打印成品外观,所见即所得

从电影道具到医疗设备3D打印正在快速改变我们制造功能原型的方式。然而大多数打印软件生成的预览只关注结构路径忽略了颜色、光泽、纹理等外观要素导致用户常常需要反复试印。根据3D科学谷的市场观察MIT和普林斯顿大学等机构的研究团队推出了一款名为VisiPrint的人工智能预览工具只需上传一张切片截图和一张材料照片就能在一分钟内生成高度逼真的成品渲染图。用户研究表明VisiPrint的任务完成率达到100%远超传统切片软件63%和通用建模软件13%有望大幅减少3D打印中的浪费与试错成本。设计师、创客经常使用3D打印技术快速制作功能原型从电影道具到医疗设备无所不包。准确的打印预览至关重要这样用户才能确信最终造出的物体会如预期般工作。然而大多数3D打印软件生成的预览侧重于功能而非外观。打印出来的物体可能在颜色、质感或明暗效果上与用户的预期大相径庭导致反复重印浪费大量时间、精力和材料。一项研究估计多达三分之一的打印材料最终直接变成了垃圾其中很大一部分来自被丢弃的原型。为了帮助用户提前预判成品的视觉效果来自麻省理工学院MIT计算机科学与人工智能实验室CSAIL以及普林斯顿大学的研究人员开发了一款易用的预览工具将外观放在首位。该工具被命名为VisiPrint相关论文已被ACM人机交互计算系统会议CHI接收。图VisiPrint工作流程。用户使用自己偏好的软件例如Cura对3D模型进行切片然后上传切片视图的截图以及目标打印线材或打印样本的照片。VisiPrint会生成一个忠实于外观的预览图同时反映切片路径和材料特性。工作流程两张图一分钟用户只需上传一张来自3D打印软件即“切片软件”的物体截图以及一张打印材料的照片可以是在线图片或自己拍摄的样本。系统便会根据这些输入自动生成物体打印后可能呈现的效果渲染图。研究团队聚焦于熔融沉积成型FDM——最常见的3D打印类型。在FDM中打印材料线材被熔化后通过喷嘴挤出逐层堆叠成型。生成准确的美学预览颇具挑战因为熔化和挤出过程会改变材料的外观每层沉积的高度以及喷嘴移动的路径也会产生影响。VisiPrint使用两个协同工作的人工智能模型来克服这些难题。其中一个是计算机视觉模型负责从材料样本中提取对物体外观至关重要的特征颜色、光泽、半透明性等。另外一个是生成式AI模型基于Stable Diffusion XL。负责根据这些特征同时融入喷嘴的“切片”路径信息计算出物体的几何形状和结构最终合成预览图。图使用自备材料样本蓝色和透明球体以及在线找到的样本包括具有挑战性的半透明和彩虹色线材预览的小船。创新条件控制方法3D科学谷了解到这项研究方法的关键在于一种特殊的条件控制方法conditioning method。研究人员通过仔细调整模型内部的工作机制引导它遵循切片路径并遵守3D打印过程的各项约束。图VisiPrint系统架构。系统以材料样本和3D几何模型为输入。材料通过图像提示适配器IP Adapter进行编码而几何模型则经过切片和渲染。切片信息、几何结构以及潜在的照明线索通过多路ControlNet流程引导图像生成。生成的输出通过扩散修复模型SDXL进行精炼并经过颜色校正最终完成从而生成3D打印物体的照片级真实感预览。具体来说他们的条件控制方法利用了两类信息一类是保留物体的形状和明暗变化的深度图一类是反映内部轮廓和结构边界尤其是层纹lamination细节的边缘图Canny边缘检测。“如果这两者的平衡掌握不好就可能产生错误的几何形状或不正确的切片路径。我们必须非常小心地将它们以恰当的方式结合起来”论文第一作者、MIT电气工程与计算机科学系EECS研究生Maxine Perroni-Scharf表示。在用户界面中研究人员提供了一个直观的“切片影响强度”滑块让用户可以自由调节层纹细节与整体光影之间的权重。专为FDM优化兼容任意切片软件VisiPrint的设计与打印机或切片软件类型无关。它既可以作为独立工具使用用户上传任意切片软件的截图也以Ultimaker Cura插件的形式集成到主流工作流中。一旦模型切片完成插件会自动捕获3D视口截图用户可直接在Cura内部生成预览。研究团队还建立了一个包含12种物体8个Thingiverse模型 4个基本几何体的数据集分别用四种典型线材实心粉、实心蓝、透明白、金属银打印涵盖半透明、高光、哑光等多种质感。所有真值照片均在受控光照环境下拍摄以保证对比的公平性。用户研究100%完成率为了验证VisiPrint的实际效果研究团队招募了15名具有一定3D打印经验的用户进行了一项对照实验。每个参与者需要完成两项任务用银色PLA打印一艘Benchy小船以及用透明PLA打印一个哨子。参与者分别使用三种工具完成相同的预览任务VisiPrint、Cura主流开源切片软件和Blender通用3D建模软件使用PBR材质渲染。每项任务限时5分钟。结果如下工具任务完成率平均完成时间VisiPrint100%(30/30)66.4秒Cura63% (19/30)158.5秒Blender13% (4/30)250.2秒VisiPrint不仅完成率最高速度也比Cura快2.4倍比Blender快近4倍。在NASA任务负荷指数TLX评估中VisiPrint在脑力需求、时间紧迫感、任务成功感、努力程度、不安全感等所有维度上均显著优于Cura和Blenderp0.05。用户对其生成的“照片级真实感”评分平均为6.20/7对预览与实际打印匹配的信心也显著更高。感知研究与真实照片几乎无异在另一项感知研究中参与者手持真实的打印物体银色小船和透明哨子并排比较六种预览图像Blender均匀纹理、Blender PBR材质、Cura默认颜色、VisiPrint、真实物体照片、以及Cura的“银色/透明”专用预览。图感知研究小船。上图针对整体相似度、纹理相似度、切片相似度三个指标非中性Likert评分的分布情况。下图参与者的平均排名。VisiPrint与真实照片在统计学上无显著差异且排名最高Cura银色预览处于中游Blender和Cura黄色预览排名最低。结果表明在整体外观相似度方面VisiPrint和真实照片处于同一梯队显著高于Cura和Blender的各类预览在纹理相似度方面VisiPrint与真实照片无统计学差异Cura和Blender相对落后在切片层纹相似度方面VisiPrint与真实照片依然并列最高Cura在某些情况下因专注于切片可视化而表现接近但整体外观和纹理远不如VisiPrint。值得注意的是有少数参与者将VisiPrint的预览排名排在了真实照片之前。研究人员认为这可能是由于照片拍摄时的光照条件与实物在手中的观感存在差异反而说明VisiPrint能够呈现一种“理想化”的真实感。用户反馈与未来展望在问卷调查中15人中有12人表示更愿意使用VisiPrint而非仅用Cura或Blender进行打印预览。14人表示未来会再次使用VisiPrint。同时用户也提出了一些改进建议例如他们希望支持3D模型的旋转和多角度预览以及更紧密的集成如直接上传3D模型而非截图。部分用户还提到了解算法的基本原理有助于建立对预览结果的信任。针对这一点研究团队在界面中加入了明确的“预览局限性”提示面板告知用户VisiPrint仅用于外观评估光泽、色调倾向、层纹方向等不预测可打印性、机械强度或安全关键部件的成功率。所有输出图像均带有“模拟预览”水印以校准用户预期。技术评估超越现有方法研究人员还将VisiPrint与多种基线方法进行了定量比较包括ZeST零样本材质转移、IP-Adapter、MatSwap以及单图像SVBRDF估计。评价指标包括PSNR峰值信噪比、LPIPS感知相似度和CLIP相似度计算对象均为真实打印物体的照片。图各方法预览效果定性对比左图来自Thingiverse的3D打印物体的真实照片以及对应的切片几何模型和材料样本。右图VisiPrint与各基线方法的预览效果对比。VisiPrint在材料保真度、切片细节和几何形状三方面达到了最佳结合。VisiPrint在所有指标上均取得了最佳成绩尤其是在像素级保真度和语义对齐方面显著优于其他方法。消融研究进一步证实了各组件的贡献颜色校正color harmonization带来的提升最大单独使用深度图会导致中空区域出现伪影而加入Canny边缘控制后层纹细节得以保留整体CLIP相似度从0.894提升至0.912。局限性与未来工作研究团队在论文中指出尽管VisiPrint在预览真实感上取得了显著进步仍存在一些局限主要包括以下几点依赖单目深度估计和Canny边缘在细节复杂或中空区域可能引入伪影预览质量受材料样本照片的光照影响较大且不支持任意重光照继承MatCap类方法的固有限制目前主要针对FDM打印和标准PLA线材优化对金属色、半透明、多色等复杂材质的效果尚未充分验证不模拟支撑结构痕迹或打印失败的可能性。未来研究团队希望解决极精细细节预览时的伪影问题增加多角度预览功能并探索将VisiPrint扩展到SLA光固化等其他3D打印技术。3D打印领域的所见即所得“所见即所得WYSIWYG是桌面出版在20世纪80年代得以普及的关键因为它让用户第一次尝试就能得到想要的结果。现在是时候让3D打印也实现‘所见即所得’了。VisiPrint朝着这个方向迈出了重要一步”并未参与此项研究的哈索·普拉特纳研究所计算机科学教授Patrick Baudisch评价道。论文作者表示所有代码、数据集和预训练模型将在论文发表后开源。该研究部分由MIT晨兴设计学院奖学金和MIT MathWorks奖学金资助。

相关文章:

MIT AI工具一分钟预览高度逼真3D打印成品外观,所见即所得

从电影道具到医疗设备,3D打印正在快速改变我们制造功能原型的方式。然而,大多数打印软件生成的预览只关注结构路径,忽略了颜色、光泽、纹理等外观要素,导致用户常常需要反复试印。根据3D科学谷的市场观察,MIT和普林斯顿…...

【PyCon 2025闭门分享精要】:Python 3.14 JIT底层调度器深度调优——用3行代码撬动47% CPU利用率提升

第一章:Python 3.14 JIT编译器性能调优配置总览Python 3.14 引入了实验性内置 JIT(Just-In-Time)编译器,基于 Pyston 的优化后端重构,支持函数级动态编译与类型特化。该 JIT 默认处于禁用状态,需通过环境变…...

**为生命按下“刷新键”:当细胞科技成为健康管理的新日常**

清晨六点半,张教授在太湖边完成了他的五公里慢跑。这位年近六十的物理学博导,面色红润,步伐稳健,让许多年轻同事都自叹不如。朋友们常打趣问他保养秘诀,他总是笑笑说:“不过是尊重科学,提前管理…...

spring-ai 第六模型介绍-聊天模型

spring-ai 第六模型介绍-聊天模型 官网 源码示例 spring-ai 第六模型介绍-聊天模型 官网 利用了预训练的语言模型,例如 GPT(生成型预训练变换器),以在自然语言中生成类似人类的响应 spring-ai网址【https://docs.spring.io/spri…...

pytorch基础入门day01

对pytorch的张量创建:#张量:与numpy相似(tensor) # 分为维度,形状,数据类型# 张量的创建 import torch# 创建一个2*3的全0张量 atorch.zeros(2,3) print(a)# one torch btorch.ones(2,3)# random torch ctorch.randn(2,3)# 从numpy中创建张量 import numpy as np n…...

Claude Code 权限 / 安全审查调用流程图

Claude Code 权限 / 安全审查调用流程图 这份文档的目标不是“介绍功能”,而是帮助你 复刻 Claude Code 的权限判定链路 到你们自己的手机 Agent 里。 重点回答 4 个问题: 一个 action 从模型产生到真正执行,中间经过了哪些关卡? 哪些地方是 确定性规则,哪些地方会 请求…...

智慧农业草莓成熟度识别 基于cnn的YOLOv11深度学习 智慧农业草莓成熟度目标检测系统 草莓识别系统(数据集使用 YOLOv11 进行草莓成熟度计数与检测 注意:此模块是在以下资源的+模型+界面)

使用 YOLOv11 进行草莓成熟度计数与检测 注意:此模块是在以下资源的帮助下完成的:Detection_image.png1. 代码库中每个 Notebook 的说明Dataset split NB: 此 Notebook 用于将原始的 3000 张图片按 0.8、0.1 和 0.1 的比例分为训练集、验证集和测试集。N…...

OpenClaw日志分析:千问3.5-35B-A3B-FP8任务执行效率优化

OpenClaw日志分析:千问3.5-35B-A3B-FP8任务执行效率优化 1. 为什么需要关注OpenClaw的任务执行效率 上周我在本地部署了OpenClaw,并接入千问3.5-35B-A3B-FP8模型进行自动化任务测试。最初几天运行还算顺利,但随着任务复杂度增加&#xff0c…...

半监督3D医学图像分割(四):URPC在鼻咽癌GTV分割中的高效应用

1. 为什么URPC在鼻咽癌GTV分割中表现突出 鼻咽癌肿瘤靶区(GTV)分割是放疗规划中的关键步骤,传统方法依赖医生手动勾画,耗时且易受主观影响。URPC(Uncertainty Rectified Pyramid Consistency)作为半监督3D医…...

单细胞测序实战:从原始数据到高质量细胞图谱的R/Seurat预处理全流程

1. 单细胞测序入门:为什么预处理如此重要? 第一次接触单细胞测序数据时,我盯着电脑屏幕上密密麻麻的基因表达矩阵发愣——这堆数字怎么就能变成漂亮的UMAP聚类图?后来才明白,数据预处理就是搭建这座桥梁的关键工序。简…...

保姆级教程:用PyTorch 1.13+全卷积网络搞定MSTAR SAR图像分类(附完整代码)

从零构建PyTorch全卷积网络实现MSTAR SAR图像分类实战指南 当第一次接触MSTAR数据集时,很多开发者会被其特殊的灰度SAR图像特性所困扰。与常规RGB图像不同,SAR图像具有独特的散射特性和成像机制,这给传统计算机视觉方法带来了挑战。本文将带你…...

ComfyUI实战:Qwen-Image三大ControlNet方案深度评测与选型指南

1. Qwen-Image ControlNet方案全景概览 第一次在ComfyUI里看到Qwen-Image的ControlNet选项时,我对着三套方案发了半小时呆——就像站在自助餐厅里面对琳琅满目的菜品,每样都想尝却不知从哪下手。经过两周的密集测试,终于摸清了这些方案的脾性…...

避坑指南:MediaPipe安装常见报错解决方案(附虚拟环境配置技巧)

MediaPipe实战避坑手册:从环境配置到高效开发的完整指南 在计算机视觉和机器学习领域,MediaPipe作为Google开源的多媒体处理框架,因其强大的实时感知能力和跨平台特性而备受开发者青睐。然而,许多开发者在初次接触MediaPipe时&…...

存算分离,性能跃升:实现查询效率再提升60%

概述 盖雅在腾讯云 TCHouse-D 2.0 基础上无缝升级至 3.0 版本,依托其全新存算分离架构、软硬结合的资源隔离能力与优化的查询引擎,实现了数仓性能与运维效率的双重飞跃。通过原生支持的弹性资源调度,精准匹配月结等高并发峰值需求&#xff0…...

django基于深度学习的淘宝用户购物可视化与行为预测系统设计_3jf982vi_c024

前言在数字经济 与电商行业高速发展的背景下,传统商品销售行业面临数据处理滞后、决策缺乏科学依据等挑战。企业依赖人工统计与经验判断的方式,难以应对海量交易数据带来的复杂性,导致资源配置效率低下、市场竞争力下降。本系统基于Python、D…...

Bugku CTF: Exploiting LFI Vulnerabilities in Multi-Language Web Apps

1. 理解LFI漏洞的本质 本地文件包含(Local File Inclusion,简称LFI)是Web安全中常见的漏洞类型,它允许攻击者通过精心构造的输入参数读取服务器上的敏感文件。这种漏洞通常出现在动态包含文件的功能中,比如PHP的includ…...

MSYS2安装教程

https://blog.csdn.net/yeeeee_yee/article/details/145635436...

django基于深度学习的音乐推荐系统_7182nd2n_zl035

前言随着数字音乐时代的到来,人们可以轻松访问数百万首歌曲。然而,如何在海量音乐中找到自己喜欢的音乐成为了一个挑战。基于Django框架和深度学习的音乐推荐系统正是为了解决这一问题而诞生。该系统通过深度学习技术分析用户的历史行为和偏好&#xff0…...

SolidWorks 2019 + Fusion 360:手把手教你搞定复杂机械臂模型的URDF导出(附开源模型)

SolidWorks与Fusion 360协同工作流:机械臂模型URDF导出实战指南 当你在GitHub上发现一个设计精良的六轴机械臂模型,却因为格式兼容性问题无法直接使用时,这种挫败感每个机器人开发者都深有体会。上周我就遇到了这样的情况——一个基于Gluon架…...

OpenClaw配置备份:Qwen3-14b_int4_awq环境迁移与恢复指南

OpenClaw配置备份:Qwen3-14b_int4_awq环境迁移与恢复指南 1. 为什么需要备份OpenClaw配置 上周我经历了一次痛苦的教训——因为系统重装,丢失了精心调校的OpenClaw配置。那些花了几周时间调试的模型参数、飞书机器人集成设置、自定义技能模块全部归零。…...

芯片制造中的3-sigma到底有多重要?从良率到可靠性全解析

芯片制造中的3-sigma到底有多重要?从良率到可靠性全解析 在半导体行业,每一片晶圆都承载着数以亿计的晶体管,而每个晶体管的性能波动都可能影响最终产品的良率和可靠性。想象一下,当你在使用智能手机时,是否曾思考过为…...

PLC立体车库智能仿真系统:博途V15 3×2车库模型,西门子PLC控制,触摸屏操作,自动出入...

PLC立体车库智能仿真 博途V15 32立体车库 西门子1200PLC 触摸屏仿真 不需要实物 自带人机界面 小车上下行有电梯效果 每一个程序段都有注释 FC块标准化编写 自带变频器输出也可以仿真 现在拥有自动出入仓库的功能 IO表已列出最近在搞的32立体车库仿真项目挺有意思,用…...

HY-Motion 1.0保姆级教程:从零配置GPU环境生成文生3D动作

HY-Motion 1.0保姆级教程:从零配置GPU环境生成文生3D动作 想用一句话就让3D角色动起来吗?比如,输入“一个人从椅子上站起来,然后伸展双臂”,电脑就能自动生成一段流畅、自然的3D骨骼动画。这听起来像是未来科技&#…...

原生 JS 实现图片预览上传组件:多图上传 + 拖拽上传 + 裁剪预览 + 进度显示(附完整源码)

前言图片上传是前端开发中高频且核心的功能场景,如头像上传、素材管理、表单提交等。本文基于原生 HTMLCSSJavaScript 实现一套企业级图片预览上传组件,包含多图选择、拖拽上传、实时预览、图片裁剪、上传进度显示、文件大小 / 格式校验等功能&#xff0…...

反向海淘商家必看!精细拍照服务,帮你降本留客不踩坑

做反向海淘生意的商家都懂,最头疼的莫过于用户投诉与跨境退货——海外用户担心货不对版不敢下单,下单后因实物与图片不符发起退货,高额跨境运费、人力成本,不仅压缩利润,还会拉低店铺口碑,甚至流失核心客群…...

GLM-4V-9B惊艳效果展示:电路板图元器件识别+故障点定位+维修指引生成

GLM-4V-9B惊艳效果展示:电路板图元器件识别故障点定位维修指引生成 安全声明:本文仅展示AI技术能力,所有电路板图像均为演示用途,不涉及任何实际设备或敏感信息 1. 项目概述与核心能力 GLM-4V-9B多模态大模型在工业视觉检测领域展…...

12款免费网页数据采集神器,零基础也能轻松爬取全网信息!

一、零基础入门级工具1. 火车采集器 - 国产老牌采集神器火车采集器是国内资历深厚的采集工具,操作门槛极低,无需任何编程基础,新手也能快速上手,堪称零基础用户的“入门首选”。使用步骤:下载并安装火车采集器客户端&a…...

OpenClaw备份策略:千问3.5-27B智能压缩历史聊天记录

OpenClaw备份策略:千问3.5-27B智能压缩历史聊天记录 1. 为什么需要智能备份策略 作为一个长期使用OpenClaw进行日常工作的开发者,我发现随着使用时间的增长,聊天记录文件开始占据大量存储空间。最初我的解决方案是简单粗暴的定期删除&#…...

A20B-8200-0927控制器模块

A20B-8200-0927控制器模块是一款面向工业自动化与数控系统应用的关键控制单元,具备良好的数据处理能力与系统协调性能,能够在复杂工况下实现稳定可靠的设备控制,广泛应用于自动化产线及数控设备中。采用高性能处理架构,提升整体运…...

STM32F103C8T6 + MPU6050 + TB6612:手把手教你从零搭建两轮平衡小车(附完整源码与PCB)

STM32F103C8T6 MPU6050 TB6612:从零构建两轮平衡小车的工程实践 平衡小车一直是嵌入式开发者入门的经典项目,它不仅融合了传感器技术、控制算法和机电一体化设计,还能让你在实践中深入理解PID控制等核心概念。今天我们就来拆解一个基于STM3…...