当前位置: 首页 > article >正文

基于COZE平台GLM5.1开发简易3D导演台布局,10分钟速成傻瓜式教学(小白也能搭建)

基于COZE平台GLM5.1开发简易3D导演台布局10分钟速成傻瓜式教学小白也能搭建前言这次想分享一个很有意思的实战项目复刻一个网页版 3D 导演台。先说结论我以前并没有开发过 3D 导演台甚至很多底层技术也不熟。但在 AI 的帮助下这类产品的复刻门槛真的被拉低了很多。现在很多东西的开发流程已经可以简化成截图 → GPT 分析 → 输出 PRD → AI 编码工具执行 → 中途报错继续修 → 最终跑通也就是说你不一定非得先精通所有技术细节只要你有一个大概思路知道目标结果是什么很多事情就能先做起来。全文用到的工具这次主要用到 3 个核心工具GPT分析产品、拆解技术路线、输出 PRD 文档Gemini 3.1 Flash基于导演台底图 角色参考图做图生图COZE 编程根据 PRD 快速实现网页功能模块后面我还把生成的图片继续拿去做视频整个链路跑通之后体验还是很爽的。我为什么想做这个东西最近在体验一些 AI 创作产品的时候我发现其中有一个模块特别有意思3D 导演台 / 3D 摆位台。第一眼看上去会觉得这东西也太难了吧 但仔细想想它的核心逻辑其实很清晰在一个简化的 3D 场景里摆好小人把对应的道具放好确定镜头、位置和前后关系再把这个“骨架图”或“构图底图”丢给图像模型继续生成这样做的好处很明显场景更稳定角色位置更可控前后层级更清晰不会扩散得特别散本质上就是先用 3D 导演台搭一个稳定的空间骨架再基于角色图和底图去做图生图。也就是下面这种思路有一个骨架图 有对应的角色图一、先让 GPT 分析这个“小人”到底是什么技术实现的一开始我并不知道这个小人是怎么做出来的所以最直接的方法就是截图丢给 GPT让它先分析。我的提示词如下这个小人是什么技术实现的PS记得把对应的对标产品图片给到GPTGPT 分析完后我大概就明白了这个东西本质上并不一定是什么很重的高精度角色模型它更可能只是由一些基础几何体组合而成比如球体圆柱体胶囊体关节结构简单层级组合也就是说它更像是一个参考人偶 / 占位骨架而不是完整的角色系统。然后根据对应的结果进行分析一下用的什么技术这一步很关键。因为如果一开始就把它想成复杂骨骼动画系统那项目复杂度会被想得特别夸张很容易直接放弃。但 AI 帮我拆完之后我才发现这个东西的 MVP 版本其实没有想象中那么难。二、确认技术路线有没有 React 组件框架因为我后面想做的是网页版而且我自己更偏向前端思路所以我继续追问 GPT对应的有react组件框架是吧GPT 给我的建议技术栈如下推荐技术栈 基础层 React Three.js react-three-fiber把 Three.js 变成 React 组件写法 react-three/drei常用现成组件库 leva 或 zustand参数面板 / 状态管理看到这里我就基本确定方向了React Three.js react-three-fiberR3F也就是用 React 组件的思路去写 3D 场景。然后他给到了我对应的框架网站https://fiber.framer.wiki/tutorials-testR3F 是什么我去看了一下这个框架的说明核心介绍大概是这样Introduction 介绍 React-three-fiber是threejs的React渲染器 用声明式的语法配合可复用、自包含的组件来创建可以根据状态响应的可轻松交互的三维场景并且可以轻松融入React的生态系统。npminstallthree types/three react-three/fiber 有任何限制么 比纯Threejs慢么 会跟得上最新的Threejs的功能么 任何在Threejs中可以用的在react-three-fiber中都可以用没有任何例外。 不会。它没有其他额外开销。组件的渲染是在React之外的。基于React的调度能力它在某些方面的性能还优于直接使用Threejs。 是的。它通过JSX语法来实现Threejs的各种组件mesh /会被动态的转换成new THREE.Mesh().如果一个Threejs版本添加、删除或者改变了一些能力你的项目的代码自然就会用上相关的能力并不会需要进行额外的升级操作。这段话对我最大的帮助就是我不用硬啃纯 Three.js也能用 React 组件的方式搭出一个 3D 导演台。看看官方 Demo确认这条路能不能走通确认技术路线之后我又去看了 R3F 官方示例https://r3f.docs.pmnd.rs/getting-started/examples看完 demo 后我只有一个感觉这条路是能走的。确实不错。三、让 GPT 直接输出 PRD 文档方向确认之后就别再自己瞎想了直接让 GPT 帮我把产品方案整理成PRD 文档。我的提示词如下根据https://fiber.framer.wiki/tutorials-test和https://r3f.docs.pmnd.rs/getting-started/introduction给我对应的设计3D自定义导演台摆放道具PRD文档GPT 直接帮我整理出了一份比较完整的 PRD包括产品定位页面结构功能模块技术建议场景对象设计机位系统导出逻辑数据结构建议效果如下这一步我很推荐大家一定要做。因为 PRD 一旦出来了后面的 AI 编码工具就更容易理解你到底要做什么而不是只能凭一句模糊的话去乱猜。顺手把 PRD 导出成 Markdown输出对应的 PRD 文档后我又让 GPT 直接给我可以下载的 md 文件。提示词如下变成可下载的md文件文档上传到 CSDN 了积分为 0https://download.csdn.net/download/weixin_44151887/92809203四、开始让 AI 真正写代码PRD 有了下面就进入真正的开发阶段。这里我选的是COZE 编程。之前我其实也体验过不少 AI 编码平台如果你是新手想快速练手我觉得可以这样选小白练手COZE进阶开发CLAUDE CODE / TRAE / CURSOR打开 COZE 编程选择模型没注册过COZE可以用我的邀请码注册多送5000积分https://www.coze.cn/overview?invite_code43aba32a0684470eb10b9805d80e5aa7我打开的是 COZE 编程网站https://code.coze.cn/home?from_sourcehttps%3A%2F%2Fwww.coze.cn%2Fskills模型我选的是GLM5.1我的体验是GLM5.1 效果确实更好但是也更费积分。你们体验可以用GLM5把 PRD 和需求一起喂进去这里我的做法非常简单粗暴把刚才生成好的director_stage_prd_v2.md扔进去再补一句大白话说明需求。提示词如下director_stage_prd_v2.md ,搭建一个网页版3D导演台可以自定义摆件移动不同的小人赋予不同的颜色最后可以截图保存可以移动不同视角方位这一步我的体会是PRD 大白话描述对 AI 编码特别友好。因为 PRD 负责约束结构大白话负责补充真实目标。五、中途报错怎么办继续让 AI 修整个开发过程当然不可能一次成功中途还是会遇到各种报错。但现在最爽的点就在这里报错也不用慌继续把错误喂给 AI 修。场景 1直接报错我当时中途就碰到了错误处理方式也很简单在左下角智能体输入框继续描述问题把报错信息发进去或者直接把报错对应的代码行贴进去如下图场景 2白屏后面还出现了白屏问题。这种情况我也是直接描述现象页面白屏哪一步操作后出现控制台有什么报错预期效果是什么让智能体继续修就行。如下图这一段其实特别像现在 AI 开发的真实节奏不是一次生成就完美而是不断生成、不断修、不断逼近目标。六、最终效果项目真的跑起来了修修补补之后最终项目还是成功跑出来了。最终开发完成我做出来的功能目前这个版本已经能实现一些比较核心的能力左侧点击添加小人和物件右侧修改大小和颜色中间场景支持拖拽操作可以切换视角支持截图导出效果如下左侧可以点击小人和对应的物件右侧可以改大小颜色右侧拖拽下面按钮截图保存说实话做到这里的时候我还是挺开心的。因为它已经开始有那个味道了。有没有那味道了哈哈哈哈哈这是我做的这是对标的虽然肯定还有差距但至少已经能看出核心方向是对的。七、导出图片再丢给 Gemini 做图生图导演台做完以后真正有意思的地方才来了。我把导演台导出的底图拿出来继续丢给 Gemini 做图生图。这是导出的图片导出后的图片Gemini 图生图提示词我传入了导演台底图对应角色三视图 / 角色参考图提示词如下基于图片1背景换成室内家里面黄色小人图2蓝色小人图3这里我最大的感受是有了导演台的底图之后Gemini 出图明显更稳了。尤其是多人关系、前后层级、位置关系确实比纯提示词乱蒙要可控很多。八、最后一步把图片继续做成视频图有了下一步当然就是继续做视频。我这里用的视频模型是seedance2-fast理由也很简单免费生成当然是白嫖我才不会去充钱贵得要死豆包可以免费生成5个每天用 Gemini 写对应的视频提示词。最终成品视频如下咕咕嘎嘎和凑企鹅的温馨时刻九、最终复刻效果怎么样如果让我自己给这次复刻打个分我觉得大概可以说完成度 80% 左右。虽然离真正成熟产品还有差距但对我来说这次最重要的不是“完全一模一样”而是验证了一件事以前看起来很难的交互产品现在真的可以靠 AI 把它快速做出来。而且不是 PPT 式的“想法”是真的能跑、能摆、能导出、能接图生图、还能继续做视频。所以我最后的感受只有一句AI 真屌啊我以为很难结果居然真的实现了。十、项目地址COZE 项目已公开链接如下https://code.coze.cn/p/7629188149981380643/previewCOZE使用GLM5.1的积分消耗量是真的夸张不过效果也是很满意的十一、这次实践给我的几个启发1. 不一定要先会先拆也很重要以前总觉得不会 3D、不会导演台、不会 Three.js就根本不可能做这种东西。但这次实践下来我发现你不一定先全会先把产品拆明白也很重要。只要你能说清楚它是什么它怎么交互你要实现哪些核心功能AI 就能帮你补很大一块。2. 截图分析是现在非常高效的逆向方式这次我几乎就是靠截图 提问 PRD 执行把整个项目一点点推出来的。所以以后看到一个不错的产品不一定先被吓到可以先问 AI这个东西是什么技术实现的最小 MVP 怎么做React 有没有对应框架数据结构应该怎么设计先做哪些功能最值很多时候路就这样慢慢出来了。3. PRD 真的很关键我以前总觉得 PRD 是大团队、大公司才搞的东西。但现在配合 AI 编码我反而越来越觉得PRD 是给 AI 最好的“任务说明书”之一。没有 PRDAI 很容易乱写。有了 PRD它就知道边界、模块、页面、目标和交付形式。十二、总结这次我做的事情其实可以概括成一句话我用 GPT 拆解一个 3D 导演台用 COZE 把它做出来再用 Gemini 和视频模型把整个创作链路串起来。完整链路如下截图对标产品 → GPT 分析技术实现 → GPT 输出 PRD 文档 → COZE 根据 PRD 写代码 → 报错继续让 AI 修 → 导出导演台底图 → Gemini 图生图 → 视频模型生成动态视频整个过程让我最大的感受就是AI 不只是回答问题它已经可以参与“从想法到产品原型”的整个过程了。十三、最后放一下结果复刻效果 80%6666 AI 是真猛我一开始以为很难结果居然真的做出来了。如果你也在折腾AI 绘图AI 漫剧分镜工具角色一致性场景控制Web 3D 小工具那这种“3D 导演台 图生图”的思路我觉得还是挺值得试试的。后续可以扩展计划下面的计划要扩展的话推荐Cursor/Claude code/Trae进行开发多机位导演台阵列摆位角色姿势系统导演台转提示词导演台转视频工作流欢迎交流后续会更新更多有趣的实战内容喜欢的话可以关注我哦有建议或者想法也欢迎在评论区讨论。这篇文章里肯定还有很多不足的地方也请大家多多包涵。

相关文章:

基于COZE平台GLM5.1开发简易3D导演台布局,10分钟速成傻瓜式教学(小白也能搭建)

基于COZE平台GLM5.1开发简易3D导演台布局,10分钟速成傻瓜式教学(小白也能搭建) 前言 这次想分享一个很有意思的实战项目:复刻一个网页版 3D 导演台。 先说结论: 我以前并没有开发过 3D 导演台,甚至很多底…...

生成式AI用户反馈闭环设计:从单向上报到因果推演——基于127个真实场景的反馈归因模型(附可运行Python SDK)

第一章:生成式AI用户反馈闭环设计 2026奇点智能技术大会(https://ml-summit.org) 用户反馈闭环是生成式AI系统持续演进的核心机制,它将真实使用场景中的行为信号、显式评价与隐式偏好转化为可训练的监督信号,驱动模型迭代优化。一个健壮的闭…...

三菱FX5U控制三轴伺服定位:(BOM表、CAD电气图纸、PLC程序、人机界面)

三菱fx5U控制三轴伺服定位。 (BOM表,CAD电气图纸,plc程序,人机界面) 在工业自动化现场折腾过的小伙伴都知道,三轴伺服定位系统就像车间里的平衡术——轴与轴之间的配合但凡有点差错,整台设备就…...

MinerU 系列教程 第三课:多场景使用指南 -- CLI 参数详解与批量处理

MinerU 系列教程 第三篇 本篇教程作为 模块一:基础入门与架构概览 的第三课,全面剖析 mineru CLI 的完整参数体系。上一课我们完成了安装并成功运行了第一次解析,本课将深入每个参数的含义与使用场景,掌握批量处理、分页解析、语言…...

别再抄作业了!2026奇点大会首次公开AI学习助手的“动态知识图谱构建协议”——支持实时跨域推理的底层逻辑

第一章:2026奇点智能技术大会:AI学习助手 2026奇点智能技术大会(https://ml-summit.org) 核心定位与能力演进 AI学习助手是本届大会首次发布的开源智能体框架,聚焦教育场景中的个性化知识建模与实时认知反馈。它不再仅依赖预训练语言模型的…...

碳交易机制下需求响应的综合能源系统优化运行策略探索:实现双碳目标的路径与策略分析

碳交易机制下考虑需求响应的综合能源系统优化运行 综合能源系统是实现“双碳”目标的有效途径,为进一步挖掘其需求侧可调节潜力对碳减排的作用,提出了一种碳交易机制下考虑需求响应的综合能源系统优化运行模型。 首先,根据负荷响应特性将需求…...

基于SpringBoot+Vue小区报修系统的设计与实现(源码+论文+部署)

一. 系统介绍 本文以Spring Boot和Vue为技术基础,建立小区报修管理系统,实现系统管理、用户管理、维修类型管理、维修工具管理、报修管理、维修记录、评价反馈管理等功能模块。 代码实现下载地址:https://download.csdn.net/download/lv_so…...

面试官:LRU算法听过吗?如何改进?

上周群里看到有位小伙伴面试时,被问到这两个问题:咋一看,以为是在问操作系统的问题,其实这两个题目都是在问如何改进 LRU 算法。因为传统的 LRU 算法存在这两个问题:「预读失效」导致缓存命中率下降(对应第…...

浏览器首页永远乱七八糟?用 Fenrus 搭一个干净、高颜值、能自定义的导航页

前言 每天打开浏览器,默认主页要不是浏览器原生的壳,要不就是套了层广告的导航站,书签栏塞了几十条,找个常用网站要扫半天。有段时间试过好几个导航页工具,要么界面花里胡哨太碍眼,要么加载慢得要命点个链…...

猫抓插件:三步搞定网页视频音频下载的终极解决方案

猫抓插件:三步搞定网页视频音频下载的终极解决方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否经常遇到这样的情况&#xff…...

新加坡榜鹅:从蛮荒之地到AI创新热土,自动驾驶与智慧小镇共筑科技新篇

【导语:新加坡东北部的榜鹅,曾是一片蛮荒之地,如今成为科技创新聚集地。4月初,文远知行与Grab在此启动自动驾驶出行服务公开运营,同时榜鹅数码园区也在积极建设,新加坡发展人工智能决心可见一斑。】榜鹅&am…...

3步解锁:Nucleus Co-Op带你体验单机游戏多人同屏的魔法

3步解锁:Nucleus Co-Op带你体验单机游戏多人同屏的魔法 【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop 你是否曾经独自坐在电脑前&…...

不锈钢彩涂板哪家专业

老张最近愁坏了。他在沿海城市的新厂房刚封顶,正准备上屋面和外墙板,材料商推荐了一圈,什么“纳米防腐板”、“不锈钢彩涂板”、“高端镀铝锌板”,名字听着都高级,价格从每平米几十到几百的都有。他跑了几家厂子&#…...

AI写邮件不再翻车,SITS2026工具实测对比:12家主流平台中唯一支持合规审计追踪的生成系统

第一章:AI写邮件不再翻车,SITS2026工具实测对比:12家主流平台中唯一支持合规审计追踪的生成系统 2026奇点智能技术大会(https://ml-summit.org) 在金融、医疗与政务等强监管场景中,AI生成邮件不仅需语义准确,更须满足…...

ESXI里面虚拟机服务器始终保持免用户认证状态

最近安装了几个虚拟机,给第三方远程安装环境。打开虚拟机安装完,向日葵的时候,关闭控制台,虚拟机就自动注销用户关闭了,需要重新登录控制台。同事...

优先矩阵管理化技术中的优先矩阵计划优先矩阵实施优先矩阵验证

优先矩阵管理化技术:从计划到验证的高效实践 在现代项目管理中,优先矩阵管理化技术因其结构化、可视化的特点,成为优化资源分配和提升决策效率的重要工具。该技术以优先矩阵计划、优先矩阵实施和优先矩阵验证为核心,通过系统化的…...

口碑管理化技术中的社交媒体监控舆情分析与口碑营销

口碑管理化技术中的社交媒体监控舆情分析与口碑营销 在数字化时代,社交媒体已成为公众表达意见、分享体验的主要平台。品牌的口碑不再局限于传统渠道,而是通过社交媒体的传播迅速扩散。口碑管理化技术通过社交媒体监控、舆情分析和口碑营销,…...

UC Davis发现:AI评分系统理解个人偏好偏差超20个百分点研究突破

这项由加利福尼亚大学戴维斯分校(University of California, Davis)研究团队完成的工作,以预印本形式于2026年4月8日发布在arXiv平台,编号为arXiv:2604.07343v1,收录于计算机科学计算与语言(cs.CL&#xff…...

5步搞定Windows掌机控制器兼容性:HandheldCompanion终极解决方案

5步搞定Windows掌机控制器兼容性:HandheldCompanion终极解决方案 【免费下载链接】HandheldCompanion ControllerService 项目地址: https://gitcode.com/gh_mirrors/ha/HandheldCompanion 还在为Windows掌机控制器兼容性烦恼吗?HandheldCompanio…...

GoldenTree Asset Management聘请日本业务发展负责人

全球资产管理公司GoldenTree Asset Management(以下简称“GoldenTree”)今日宣布,聘请Ken Takao担任日本业务开发主管及合伙人。该新设职位将常驻GoldenTree东京办公室。Takao先生还将担任日本代表,并向GoldenTree首席执行官Kathy…...

Zotero-GPT配置终极指南:3步快速上手AI文献管理插件安装

Zotero-GPT配置终极指南:3步快速上手AI文献管理插件安装 【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 还在为文献整理耗时费力而烦恼吗?Zotero-GPT配置将彻底改变你的研究方式&#xf…...

WELearn网课助手:3分钟搞定网课学习的终极解决方案

WELearn网课助手:3分钟搞定网课学习的终极解决方案 【免费下载链接】WELearnHelper 显示WE Learn随行课堂题目答案;支持班级测试;自动答题;刷时长;基于生成式AI(ChatGPT)的答案生成 项目地址: https://gitcode.com/g…...

关于部分中兴机顶盒盒子线刷刷机工具提示:Need PWD 说明

关于部分中兴机顶盒盒子线刷刷机工具提示:Need PWD 说明刷机工具报错提示:NeedPWD常见的型号有:B860AV3.2-M/B860AV3.1-M2/B860AV3.1-U/B860AV3.2-U/B863AV3.2M/B863AV3.1-M2&#x…...

AutoDock-Vina生存秘籍:从入门到精通的分子对接实战攻略

AutoDock-Vina生存秘籍:从入门到精通的分子对接实战攻略 【免费下载链接】AutoDock-Vina AutoDock Vina 项目地址: https://gitcode.com/gh_mirrors/au/AutoDock-Vina 你是否曾经面对复杂的分子对接任务感到无从下手?是否在安装配置AutoDock-Vina…...

用Python+Simulink手把手教你搭建一阶RC电池模型(附完整代码与避坑指南)

从零构建一阶RC电池模型:Python与Simulink双平台实战指南 电池建模是新能源系统开发中的核心技能之一。想象一下,当你需要预测电动汽车的续航里程、优化储能系统的充放电策略,或是设计电池管理系统(BMS)时,…...

螺旋矩阵数组类题型

第 4 天 模拟算法 59. 螺旋矩阵 II 总结数组类题型解题框架 题目建议: 本题关键还是在转圈的逻辑,在二分搜索中提到的区间定义,在这里又用上了。 题目链接:https://leetcode.cn/problems/spiral-matrix-ii/ 视频讲解:…...

【Matlab】MATLAB教程:图像腐蚀imerode函数详解及去噪应用

MATLAB教程:图像腐蚀imerode函数详解及去噪应用 本文基于MATLAB R2020b版本编写(兼容R2018及以上所有版本),聚焦数学形态学核心操作——图像腐蚀,详细讲解imerode函数的语法规则、参数含义,结合多个实操案例演示腐蚀处理流程,并重点突破“腐蚀去除图像噪声点”的核心应…...

AI玩具融资超200亿,千亿级市场加速形成,商业模式待解

【AI潮玩品牌获融资,商业化能力受青睐】近日,AI潮玩品牌MOMOTOY拿到翼朴基金的数千万元投资,融资将用于AI技术迭代、高端产品矩阵落地、全球渠道拓展及核心商圈旗舰店铺设。交易完成后,成立仅4个月的MOMOTOY估值达2.5亿元。另一边…...

2026届最火的六大AI科研工具实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于学术写作范畴之内,AI工具已然成了提高效率的关键辅助方式。当下占据主导地位的…...

Go语言的sync.Map.LoadAndDelete原子操作与条目删除的并发安全

Go语言中的并发安全一直是开发者关注的焦点,sync.Map作为标准库提供的线程安全映射结构,其LoadAndDelete方法在并发场景下尤为重要。本文将深入探讨LoadAndDelete的原子操作特性及其在条目删除中的并发安全性,帮助开发者更好地理解和使用这一…...