当前位置: 首页 > article >正文

coze 实战:萌宠摆摊视频工作流,一键自动生成趣味短片

大家吼我是专注于AI的睡醒了叭我不是高手但是想和大家分享自己学到的好玩好用的工作流~大家有没有在某抖平台刷到过这样的萌宠摆摊视频真的很可爱了也有很不错的点赞量如果持续发涨粉肯定是没有问题的今天和大家分享如何通过工作流来生成类似的视频。工作流中会创建剪映草稿工作流完成后直接在剪映打开如果有不满意的地方在剪映中做一些调整就可以了~实打实的分享自己是跑了一遍全流程的有什么坑都会和大家说。先一起看看效果再上手01 效果展示小兔子炒面02 工作流截图节点看着多别怕有些都是一样的逻辑03 搭建教程3.0 流程思考【一定要先梳理一下流程不要想一步搭一步很容易漏流程】- 定义小动物需要制作的食物- 依据小动物与食物生成提示词与字幕- 生成静态场景首图- 参考首图生成视频- 设置背景音乐、字幕语音生成- 生成剪映草稿的前置处理--字幕、背景音乐、字幕音频时间线对齐- 创建剪映草稿添加字幕、背景音乐、字幕音频、视频- 结束3.1 搭建工作流登录网站https://www.coze.cn/按照图中的1、2、3、4的步骤创建。名称不能是中文嗷3.2 开始节点animal想要的动物形象goods食物比如炒饭、炒面、炒菜3.3 大模型节点-摆摊提示词与字幕生成器调用大模型节点生成摆摊场景的生图提示词并配合适的文案作为视频字幕调用开始节点的animal与goods变量系统提示词比较长放了部分截图有需要的同学留言俺发给你全部的用户提示词与输出变量。输出场景提示词与文案字幕即可3.4 提示词优化这个节点是一个优化模型不是必须的除了对文字内容优化也会将中文翻译为英文运行结果如下3.5 图像生成-人物场景图片生成调用图像生成节点注意要手动设定宽高输入中引用优化后的提示词3.6 视频生成与处理3.6.1 视频生成调用视频生成节点模型尽量选择最新的分辨率自行选择越高清晰度越好时长一般选择10s首帧图片选择3-图像生成的场景提示词选择优化后的数据后续剪映需要的是url格式而生成的视频是video类型需要格式转变使用到的工具有剪映小助手的get_url与str_to_list3.6.2 获取视频链接调用get_urlvideo转变为string3.6.3 视频格式转换调用str_to_list转变为string数组3.7 字幕音频生成与处理3.7.1 语音合成检索语音合成器命名为字幕音频合成器text需要配音的文字speed_ratio语速voice_id声音类型点击窗口进行选择后续调用的是data中的link链接为string类型3.7.2 字幕音频格式转换同样调用剪映小助手里面的str_to_list插件obj引用的变量值为字幕音频生成输出的data里面的link变量3.8 设置背景音乐检索搜索背景音乐插件变量值为检索的关键字我这里是摆摊更适合夜市类的音乐输出中后面会用到的是bgm_urls3.9 对齐处理作用是将字幕、音频、背景音乐和视频进度一致需要用到的剪映小助手的插件有3.9.1 字幕音频对齐检索并调用字幕音频对齐插件用于将输入的字幕和音频进行时间线一致就是说字幕与语音一致audio_url引用7-字幕音频生成器的data-linktext1-大模型的wenan3.9.2 获取时间线调用audio_timelines插件从字幕音频中获取时间线links格式转变后的字幕音频对齐链接3.9.3 字幕音频对齐时间线调用audio_infos将字幕语音与时间线对齐3.9.3 背景音乐对齐时间线调用audio_infos将背景音乐与时间线对齐3.9.3 字幕对齐时间线调用caption_infos将字幕与时间线对齐后面的参数其实都可以等生成后在剪映里面再处理比如设置一下字幕的进入方式3.9.4 视频对齐时间线调用video_infos将视频与时间线对齐3.10 剪映草稿生成在这一部分常用的插件有剪映小助手里面这些3.10.1 创建草稿调用create_draftheight和width可以不填自动会匹配3.10.2 添加音乐调用add_audio插件引用13-背景音乐与时间线节点的infos3.10.3 添加字幕音频调用add_audio插件引用12-字幕音频与时间线节点的infos3.10.4 添加视频调用add_video插件引用16-视频与时间线节点的infos3.10.5 添加字幕调用add_caption插件引用14-字幕与时间线节点的infos除了带*都可以在剪映中再设置问题不大3.11 结束节点引用创建草稿节点的draft_id就可以喽~至此工作流就搭建完成喽~ 刚开始略微有一点困难跑通流程后再搭建其他相关的工作流就会很顺手了04 工作流测试测试案例测试结果将output输入剪映小助手即可下载算是用了第三方工具哦下载完成打开剪映就能开看或者自己将文件夹导入到里面直接点击进入就能看到所有的轨道了有什么不满意的地方调整一下就好~05 后续碎碎念5.1 常错点引用错误因为节点和变量稍微多了一些些一定要看仔细。我刚开始搭建就搞了搞几次字幕和音频没有添加草稿成功浪费了很多资源5.2 逻辑学习当然也可以用提示词在对话流中直接生成视频但这种视频你只能一次生成完美视频可调性还是比较差的。工作流生成草稿后期空间比较大并且只要改变动物形象设定与场景设定提示词完全由大模型给你写就方便很多前期需要掌握的就是草稿生成的逻辑首帧图片-视频-时间线-所有轨道与时间线对齐-创建草稿-添加轨道今天的学习就结束啦辛苦了各位一起加油创作不易 可以给我点个赞嘛 ლ(′◉3◉ლ)

相关文章:

coze 实战:萌宠摆摊视频工作流,一键自动生成趣味短片

大家吼,我是专注于AI的睡醒了叭! 我不是高手,但是想和大家分享自己学到的好玩好用的工作流~ 大家有没有在某抖平台刷到过这样的萌宠摆摊视频,真的很可爱了!也有很不错的点赞量,如果持续发,涨粉…...

Warcraft Helper完整指南:让经典魔兽争霸3在现代Windows系统焕发新生

Warcraft Helper完整指南:让经典魔兽争霸3在现代Windows系统焕发新生 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3在Wi…...

TVA智能体范式的工业视觉革命(10)

重磅预告:本专栏将独家连载系列丛书《智能体视觉技术与应用》部分精华内容,该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“…...

TVA智能体范式的工业视觉革命(9)

重磅预告:本专栏将独家连载系列丛书《智能体视觉技术与应用》部分精华内容,该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“…...

为什么你的NotebookLM要点召回率低于61.8%?——基于172份真实用户数据集的BERT-Chunk对齐缺陷报告

更多请点击: https://intelliparadigm.com 第一章:NotebookLM要点提取方法概览 核心原理与数据输入方式 NotebookLM 通过语义理解而非关键词匹配来提取要点,其底层依赖于 Google 的 Gemini 模型对上传文档(PDF、TXT、Google Doc…...

TVA智能体范式的工业视觉革命(8)

重磅预告:本专栏将独家连载系列丛书《智能体视觉技术与应用》部分精华内容,该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“…...

TVA智能体范式的工业视觉革命(7)

重磅预告:本专栏将独家连载系列丛书《智能体视觉技术与应用》部分精华内容,该书是世界首套系统阐述“因式智能体”视觉理论与实践的专著,特邀美国 TypeOne 公司首席科学家、斯坦福大学博士 Bohan 担任技术顾问。Bohan先生师从美国三院院士、“…...

SAP Smartforms避坑指南:从‘没有输出请求打开’到字体设置,手把手解决5个高频问题

SAP Smartforms实战避坑手册:5个高频问题深度解析与解决方案 在SAP项目实施过程中,Smartforms作为企业级报表输出的核心工具,几乎每个ABAP开发者都会与之打交道。表面上看,它提供了直观的图形化界面,似乎比传统的SAPsc…...

Uniapp中处理加密PDF流:从字节数组到本地渲染的完整实践

1. 加密PDF流处理的核心挑战 在Uniapp中处理加密PDF流时,开发者常会遇到几个典型问题。首先是字节流格式混乱,后端可能返回分段加密的二进制数据,前端需要识别数据头标识(如%PDF-1.7)来判断完整性。我曾遇到一个案例&a…...

为开发者工具注入情感分析能力:开源库ai-devtools-sentiment实战指南

1. 项目概述:一个为开发者工具注入情感分析能力的开源库最近在折腾一些开发者工具,比如代码审查机器人、文档生成器或者IDE插件,我总感觉它们冷冰冰的。它们能告诉你代码有语法错误,能提示你某个API已废弃,但它们无法感…...

深入QGIS矢量数据底层:手写WKT字符串添加几何图形,一次搞懂空间数据存储原理

深入QGIS矢量数据底层:手写WKT字符串添加几何图形,一次搞懂空间数据存储原理 当你第一次在QGIS中看到一个点、一条线或一个多边形时,是否好奇过这些图形在计算机中究竟是如何被存储和表达的?本文将带你从最基础的WKT字符串开始&am…...

从游戏显卡到专业GIS:如何为你的SuperMap三维场景挑选并调校一张合适的显卡

从游戏显卡到专业GIS:如何为你的SuperMap三维场景挑选并调校一张合适的显卡 在数字孪生和智慧城市建设的浪潮中,三维GIS平台正成为空间数据分析的核心工具。SuperMap作为国产GIS软件的领军者,其三维模块对硬件性能的需求常常让技术决策者陷入…...

SFT与RL:AI训练的黄金搭档,何时介入才能事半功倍?

本文探讨了SFT(监督微调)和RL(强化学习)在AI训练中的协同作用。SFT负责建立模型的基础能力,确保其遵循格式和指令;RL在此基础上优化输出质量,使其更符合人类使用习惯。文章详细分析了何时进行RL…...

对比自行维护多个 API 密钥,使用 Taotoken 在管理上轻松许多

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比自行维护多个 API 密钥,使用 Taotoken 在管理上轻松许多 作为一名个人开发者,我曾长期在多个大模型服务…...

量子纠错与Floquet码:动态编码与ZX演算实践

1. 量子纠错与Floquet码基础量子纠错码是构建容错量子计算机的核心技术。与传统纠错码不同,量子态具有不可克隆特性,使得量子纠错必须采用特殊方法。稳定子码(Stabilizer Codes)是目前最成熟的量子纠错方案,通过测量多…...

Floquet量子码的动态纠错与时空同步技术解析

1. Floquet量子码的时空同步原理在量子纠错领域,Floquet码代表了一种通过周期性测量实现动态稳定的新型编码方案。与传统静态量子纠错码不同,Floquet码的核心创新在于将时间维度纳入编码结构,形成时空一体的纠错机制。这种动态特性使其在容错…...

Cursor Pro终极破解教程:三步免费解锁AI编程助手完整指南

Cursor Pro终极破解教程:三步免费解锁AI编程助手完整指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your …...

软考高级之系统架构师之系统安全性和保密性设计(二)

认证 PKI/CA 参考PKI/CA体系介绍。 Kerberos Kerberos是一种网络认证协议,其设计目标是通过密钥系统为客户机/服务器应用程序提供强大的认证服务。该认证过程的实现不依赖于主机操作系统的认证,无需基于主机地址的信任,不要求网络上所有主…...

峡谷焕新:用R3nzSkin解锁英雄联盟个性化游戏体验

峡谷焕新:用R3nzSkin解锁英雄联盟个性化游戏体验 【免费下载链接】R3nzSkin-For-China-Server Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3/R3nzSkin-For-China-Server 在英雄联盟的召唤师峡谷中,每一…...

利用Taotoken模型广场为AIGC应用选择性价比最高的模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 利用Taotoken模型广场为AIGC应用选择性价比最高的模型 为AIGC应用选择合适的大语言模型,是平衡生成效果与开发成本的关…...

AnyLogic新手避坑指南:搞懂‘空间逻辑’和‘层’,你的第一个行人仿真模型就成功了一半

AnyLogic行人仿真空间逻辑完全解析:从概念混淆到精准建模 第一次打开AnyLogic的行人仿真模块时,那个充满蓝色网格的3D空间和密密麻麻的参数面板,很容易让人产生一种错觉——这不过是个"高级版流程图工具"。直到亲眼目睹自己精心设计…...

事件相机技术原理与应用全解析

1. 事件相机技术概述事件相机(Event Camera)是一种革命性的视觉传感器,它彻底改变了传统相机的图像采集方式。与普通相机不同,事件相机不会以固定帧率捕获完整的图像帧,而是异步检测每个像素的亮度变化。当某个像素位置…...

从Prompt到生产力:收藏这5个Agent工程要素,让大模型成为你的得力助手!

本文深入探讨了Agent在大模型应用中的工程要素,指出许多团队仅将Agent视为高级Prompt,导致工具调用脱节、状态丢失等问题。文章详细解析了函数/工具调用、工作流编排、RAG、记忆与状态管理、权限与安全边界这五个关键方面,强调了从Demo到产品…...

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强:开源免费的WPS AI 软件 察元AI文档助手

LOCAL_SENSITIVE_PATTERNS:不经过大模型的本地正则补强 摘要 本文围绕标题所述主题,结合本仓库当前源码行进行说明。仅供技术理解与内部培训,不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。 正文 0. 结论先行 结论先行:保密检查由内置助手…...

开发者效率工具集claw:从Unix哲学到现代开发工作流集成

1. 项目概述:一个为开发者打造的“瑞士军刀”式工具集最近在GitHub上闲逛,发现了一个名为opsyhq/claw的项目,它的名字和图标(一个爪子)一下子就抓住了我的眼球。点进去一看,简介很简单:“A coll…...

与拼写检查 JSON 路径的差异:为何保密检查走 Markdown 摘要链:开源免费的WPS AI 软件 察元AI文档助手

与拼写检查 JSON 路径的差异:为何保密检查走 Markdown 摘要链 摘要 本文围绕标题所述主题,结合本仓库当前源码行进行说明。仅供技术理解与内部培训,不构成定密、法务或密码测评结论。文中代码块均摘自本地仓库对应路径与行号。 正文 0. 结论先行 结论先行:保密检查由内…...

35岁程序员亲历:AI时代如何避免踩坑?收藏这份避坑指南,小白也能看懂大模型!

作者作为一名有十多年经验的程序员,分享了自己在AI快速发展背景下,利用GPT Pro和Deep Research进行产品调研的经历。文章指出,仅依靠AI工具并不足以成功,更重要的是要找到真实的市场痛点和需求。作者通过实际案例分析了纯工具类、…...

Graph-CoT:图神经网络结合思维链,实现复杂图结构推理

1. 项目概述:当图神经网络遇上思维链推理最近在复现和优化一些图相关的推理任务时,我反复遇到了一个瓶颈:传统的图神经网络模型在处理需要多步逻辑推理的问题时,比如社交网络中的影响力传播预测、知识图谱上的复杂问答&#xff0c…...

避坑指南:Tina Linux下MIPI DSI与LVDS屏调试的那些‘坑’(以V853/D1s为例)

Tina Linux下MIPI DSI与LVDS屏调试实战避坑指南(V853/D1s开发板为例) 1. 高速差分接口调试的"死亡陷阱" 当V853开发板首次连接那块7英寸MIPI屏时,我遭遇了职业生涯最诡异的显示故障——屏幕上半部正常显示,下半部却呈现…...

别再为OpenMV串口传图卡顿发愁了!手把手教你选对硬件(STM32 SWD vs TTL)并优化代码

OpenMV串口传图性能优化实战:从硬件选型到代码调优 当你在实验室调试OpenMV串口传图项目时,是否经历过这样的场景:图像传输像老式拨号上网一样缓慢,帧率低得让人怀疑人生,调试界面卡成PPT?这背后往往隐藏着…...