当前位置: 首页 > article >正文

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligenceHunyuan3D模型是腾讯混元系列在2025年推出的一款3D资产创作模型用于生成带有高分辨率纹理贴图的高保真度3D模型本项目旨在提供Hunyuan3D的NPU适配版本方便用户能够在昇腾生态上直接使用Hunyuan3D。此外本样例基于Hunyuan3D模型在NPU进行了性能优化目前texgen在2万平面mesh网格输入下推理时间降至26秒。详细内容可至性能优化章节进行查看。执行样例环境准备本样例采用CANN 8.2.RC1。请从CANN软件包下载地址下载Ascend-cann-toolkit_${version}_linux-${arch}.run与Ascend-cann-kernels-${chip_type}_${version}_linux-${arch}.run软件包并参考CANN安装文档进行安装。conda create -n hunyuan3d python3.10.18 conda activate hunyuan3d本样例的torch以及torch_npu版本为2.6请从Ascend Extension for PyTorch插件下载torch与torch_npu安装包同时指定decorator版本pip install torch2.6.0 pip install torchvision0.21.0 pip install torch-npu2.6.0.post3 pip install decorator5.2.1 pip install ninja网络模型代码准备本仓库依赖Hunyuan3D的开源仓库代码。进入Hunyuan3D的官方仓库下载Hunyuan3D模型网络结构代码git clone https://github.com/Tencent-Hunyuan/Hunyuan3D-2.git下载本仓库代码git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.git将Hunyuan3D仓库的网络模型文件以非覆盖模式复制到本项目目录下。其中下方命令里的/path/to/Hunyuan3D-2/改为Hunyuan3D-2文件路径。cd cann-recipes-embodied-intelligence/3d_vision/Hunyuan3D cp -rn /path/to/Hunyuan3D-2/* ./安装Python依赖pip install -r requirements.txt编译第三方代码cd hy3dgen/texgen/differentiable_renderer python3 setup.py install模型结构修改部分如下所示Hunyuan3D --- hy3dgen --- texgen --- custom_rasterizer custom_rasterizer in current depository #替换当前文件 --- differentiable_renderer --- mesh_render.py differentiable_renderer/mesh_render.py #替换文件 --- rasterizer.py #添加新文件 --- minimal_demo_npu.py #添加新文件权重模型NPU环境支持Hunyuan3D模型列表用户可根据需要下载蒸馏版本Hunyuan3D-2mv 系列ModelDescriptionDateSizeHuggingfaceHunyuan3D-DiT-v2-mvMultiview Image to Shape Model2025-03-181.1BDownloadHunyuan3D-2 系列ModelDescriptionDateSizeHuggingfaceHunyuan3D-DiT-v2-0Image to Shape Model2025-01-211.1BDownloadHunyuan3D-Paint-v2-0Texture Generation Model2025-01-211.3BDownloadHunyuan3D-Delight-v2-0Image Delight Model2025-01-211.3BDownload权重安装地址为base_dirmodel_path默认base_dir为~/.cache/hy3dgen/如需修改base_dir需将./hy3dgen/shapegen/utils.py中第97行和./hy3dgen/texgen/pipelines.py中第61行进行修改class Hunyuan3DPaintPipeline: classmethod def from_pretrained(cls, model_path, subfolderhunyuan3d-paint-v2-0-turbo): original_model_path model_path if not os.path.exists(model_path): # try local path base_dir os.environ.get(HY3DGEN_MODELS, ~/.cache/hy3dgen/) model_path os.path.expanduser(os.path.join(base_dir, model_path))最后模型权重路径为base_dirmodel_path --- hunyuan3d-dit-v2-0 #单视角图像DIT模型 --- hunyuan3d-dit-v2-mv #多视角图像DIT模型 --- hunyuan3d-delight-v2-0 --- hunyuan3d-paint-v2-0执行推理执行推理由于本项目位于3d_vision/Hunyuan3D目录下并依靠仓库根目录下module/提供的公共优化模块因此在开始推理前需要设置环境变量执行如下指令source set_env.sh即可将当前样例目录及仓库根目录加入环境变量中之后执行python minimal_demo_npu.pyminimal_demo_npu.py采用默认设置执行单图像推理输入图片默认读取当前目录下的assets/demo.png生成结果默认输出到当前目录下的outputs/。运行不同配置可参考以下脚本执行python minimal_demo_npu.py --model_path tencent/Hunyuan3D-2 --multiview --face_reduce --full_graph --multi_thread (--use_render_npu) --save_rendermodel_path选择模型路径multiview设置是否采用多视角推理face_reduce设置是否减少三角面片full_graph设置是否采用图模式multi_thread设置是否采用多线程并行执行光栅化use_render_npu设置是否采用npu方式执行光栅化不能与multi_thread共同使用save_render设置是否复用光栅化结果。推理步骤介绍Hunyuan3D源码参考diffusers接口API用于物体生成包括Hunyuan3D-DiT和Hunyuan3D-Paint两个部分。运行Hunyuan3D-DiT方式如下from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline from torch_npu.contrib import transfer_to_npu pipeline Hunyuan3DDiTFlowMatchingPipeline.from_pretrained(tencent/Hunyuan3D-2) mesh pipeline(imageassets/demo.png)[0]运行Hunyuan3D-Paint方式如下from hy3dgen.texgen import Hunyuan3DPaintPipeline from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline from torch_npu.contrib import transfer_to_npu pipeline Hunyuan3DDiTFlowMatchingPipeline.from_pretrained(tencent/Hunyuan3D-2) mesh pipeline(imageassets/demo.png)[0] pipeline Hunyuan3DPaintPipeline.from_pretrained(tencent/Hunyuan3D-2) mesh pipeline(mesh, imageassets/demo.png)Hunyuan3D-DiT执行过程中我们在NPU环境下提供多视角模型推理具体方式如下from hy3dgen.texgen import Hunyuan3DPaintPipeline from hy3dgen.shapegen import Hunyuan3DDiTFlowMatchingPipeline from torch_npu.contrib import transfer_to_npu images { front: assets/example_mv_images/1/front.png, left: assets/example_mv_images/1/left.png, back: assets/example_mv_images/1/back.png } pipeline Hunyuan3DDiTFlowMatchingPipeline.from_pretrained( tencent/Hunyuan3D-2mv, subfolderhunyuan3d-dit-v2-mv, variantfp16 ) mesh pipeline( imageimages, num_inference_steps50, octree_resolution380, num_chunks20000, generatortorch.manual_seed(12345), output_typetrimesh )[0] pipeline Hunyuan3DPaintPipeline.from_pretrained(tencent/Hunyuan3D-2) mesh pipeline(mesh, imagelist(image.values()))Citationmisc{lai2025hunyuan3d25highfidelity3d, title{Hunyuan3D 2.5: Towards High-Fidelity 3D Assets Generation with Ultimate Details}, author{Tencent Hunyuan3D Team}, year{2025}, eprint{2506.16504}, archivePrefix{arXiv}, primaryClass{cs.CV}, url{https://arxiv.org/abs/2506.16504}, } misc{hunyuan3d22025tencent, title{Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation}, author{Tencent Hunyuan3D Team}, year{2025}, eprint{2501.12202}, archivePrefix{arXiv}, primaryClass{cs.CV} } misc{yang2024hunyuan3d, title{Hunyuan3D 1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation}, author{Tencent Hunyuan3D Team}, year{2024}, eprint{2411.02293}, archivePrefix{arXiv}, primaryClass{cs.CV} }【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence …...

Go语言实现轻量级TCP/UDP代理:核心原理、源码解析与实战部署

1. 项目概述:一个轻量级代理转发工具的核心设计最近在折腾一些本地服务联调和跨网络访问的场景时,经常遇到一个痛点:某个服务只监听在本地回环地址(127.0.0.1),或者因为网络策略限制,无法从外部…...

AI时代网络安全教学:伦理困境、框架设计与实践路径

1. 项目概述:当AI成为课堂的“助教”与“考题”最近几年,AI技术,特别是大语言模型,像潮水一样涌入了各行各业。网络安全这个领域,作为技术的前沿阵地,感受尤为深刻。以前我们教学生,讲的是如何分…...

CANN量化索引器元数据文档

QuantLightningIndexerMetadata 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 产品支持情况 产品是否支持 Atlas A3 …...

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为看不懂的日文RPG、韩文视觉小说或英文独立游戏而烦恼吗&#xff1f…...

CANN/catlass A8W4 MX量化矩阵乘法示例

A8W4MxMatmul Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 注意:社区包暂不支持 950 能力,后续支持的版本敬请…...

iPhone价格撑不住了,苹果内存即将见底;追觅CEO要求全员开通社交账号;DeepSeek多模态模型技术报告公布 | 极客头条

「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:zhanghycsdn.net)整理 | 苏宓出品 | CSDN(ID&…...

第二十天打卡逆波兰表达式求值

除法向零截断:这意味着 6 / -132 结果是 0,且 C 中整数除法默认就是向零截断,符合题目要求。操作数顺序:对于减法和除法,先弹出的数是右操作数,后弹出的数是左操作数。例如遇到 -,若栈顶是 b&am…...

大语言模型推理能力与自指认知的架构解析

1. 大语言模型推理能力的底层架构解析大语言模型的逻辑推理能力建立在Transformer架构的多层自注意力机制之上。这种架构设计使得模型能够通过注意力权重动态构建不同概念之间的关联网络。在推理任务中,特定模式的注意力分布会形成类似人类"思维链"的信息…...

CANN框架适配模板

框架适配模板 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 替换 {model_name}(小写下划线)和…...

我做了一个 Agent Skill,一句话生成一镜到底城市宣传片

上周,我制作了一个 skill ,用这个 skill 可以一键直出符合生成 seedance2.0 视频生成模型的城市宣传片分镜提示词,这个 skill 可以让你在 15 秒的视频当中,做出一镜到底效果的城市宣传片。我为什么制作这么一个 skill 呢&#xff…...

AI代码溯源工具clawd-blame:为AI生成代码建立对话上下文映射

1. 项目概述:一个为AI编程时代量身定制的“代码溯源”工具如果你和我一样,深度依赖 Cursor 这类 AI 驱动的 IDE 进行日常开发,那你一定遇到过这个令人头疼的场景:面对一段由 Claude 生成的、逻辑复杂但注释寥寥的代码,…...

轻量级Docker管理面板clawpanel:部署、安全与实战应用指南

1. 项目概述与核心价值最近在折腾一个自托管项目时,发现了一个挺有意思的玩意儿——qingchencloud/clawpanel。这名字乍一看有点抽象,“爪面板”?但如果你和我一样,经常在Docker生态里摸爬滚打,看到这个项目托管在Dock…...

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesktop …...

从开发者控制台体验Taotoken计费与用量观测的透明度

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 从开发者控制台体验Taotoken计费与用量观测的透明度 对于依赖大模型API进行开发的团队和个人而言,成本控制与资源管理是…...

CANN ops-math矩阵对角线提取算子

MatrixDiagPartV3 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理…...

Arm GICv5中断控制器架构解析与应用实践

1. GICv5架构概述GICv5是Arm公司推出的第五代通用中断控制器架构,作为现代计算系统中的关键基础设施组件,它承担着高效管理和分发硬件中断请求的重要职责。在Armv9架构体系中,GICv5通过创新的中断分类机制和灵活的CPU接口设计,为多…...

为 OpenClaw 配置 Taotoken 作为模型供应商的详细步骤

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为 OpenClaw 配置 Taotoken 作为模型供应商的详细步骤 OpenClaw 是一个流行的开源智能体框架,它允许开发者轻松构建和运…...

现代前端工程化实践:从零构建高效开发环境与自动化工作流

1. 项目概述:一个面向现代前端的“工艺”工具箱最近在GitHub上闲逛时,发现了一个名为frontcraft的项目,作者是Dragoon0x。这个项目名很有意思,front自然指的是前端,而craft这个词,直译是“工艺”、“手艺”…...

CANN/asc-devkit AddReluCast算子API

AddReluCast 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.co…...

AI编程助手如何从“代笔”变“导师”?学习者模式实战指南

1. 项目概述:告别“喂饭式”编程,开启主动学习模式如果你用过 Cursor 或 GitHub Copilot,大概率有过这样的体验:面对一个复杂功能,你刚敲下注释,AI 就“唰”地一下把几十行完整的、甚至有些“黑盒”的代码怼…...

CANN/sip Sinc插值算子

rsInterpolationBySinc 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I…...

AwaRes高分辨率视觉语言模型区域检索技术解析

1. 项目概述AwaRes是一个专注于高分辨率视觉语言模型区域检索的创新框架。在计算机视觉与自然语言处理的交叉领域,如何精准定位图像中与文本描述相匹配的高分辨率区域一直是个技术难点。传统方法要么牺牲分辨率换取处理速度,要么计算成本过高难以实际应用…...

基于MCP协议实现AI助手与n8n自动化平台的无缝集成

1. 项目概述:当AI助手遇上自动化引擎如果你和我一样,每天要在n8n里折腾十几个自动化工作流,同时又在Cursor里和AI助手讨论代码逻辑,那你肯定想过一个问题:能不能让AI直接帮我操作n8n?不用切屏,不…...

CANN/opbase预留执行器接口

预留接口 【免费下载链接】opbase 本项目是CANN算子库的基础框架库,为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 本章接口为预留接口,后续有可能变更或废弃,不建议开发者使用,开发…...

多模态大模型如何重塑科学教育:从虚拟实验到个性化辅导

1. 项目概述:当科学教育遇上“多模态”大脑如果你是一位科学老师,或者对教育科技感兴趣,可能已经注意到一个现象:传统的“书本黑板”或“PPT讲解”模式,正在面临前所未有的挑战。学生对着抽象的公式和二维的图表发呆&a…...

杀疯了!7 款国内外 IDEA AI 插件大乱斗,谁是 AI Coding 世界第一?

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

Shell脚本AI助手:终端集成Ollama与OpenAI的智能运维实践

1. 项目概述:一个纯粹的Shell脚本智能终端助手 在终端里直接和AI对话,让它帮你写命令、分析日志、解答技术问题,甚至管理本地的大语言模型——听起来是不是很酷?这就是 shell-pilot 带给我的核心体验。作为一个常年泡在终端里的…...

为OpenClaw智能体工作流配置Taotoken多模型后端

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 为OpenClaw智能体工作流配置Taotoken多模型后端 对于使用OpenClaw框架构建AI工作流的开发者而言,灵活选择并接入不同的…...

开发者必备:开源资源聚合平台 site-for-developers 深度解析与应用指南

1. 项目概述:一个开发者的“数字工具箱”为何如此重要 在信息爆炸的时代,对于开发者而言,最大的挑战往往不是“如何写代码”,而是“去哪里找信息”。你是否也经历过这样的场景:为了解决一个框架的版本兼容性问题&…...