使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现
使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现(提供工作流)
摘要:本文基于一段关于使用 Coze 平台构建抖音爆火书单视频的详细讲解,总结出一套完整的 AI 视频自动化制作流程。内容涵盖从思路拆解、节点配置、数据处理到最终草稿输出的完整工作流设计,适合希望利用低代码平台快速打造高质量短视频内容的创作者和开发者参考。
一、项目背景与目标
1.1 背景介绍
抖音上流行的“书单类”视频通常具有以下特征:
- 每本书封面动态展示(缩放、旋转)
- 配合文案字幕与语音播报
- 动态时间线控制节奏
- 添加背景图片与特效(如边框、金光闪烁)
这些视频制作过程繁琐,但又高度标准化,非常适合通过 AI 自动化工具进行批量生产。
1.2 技术目标
使用 Coze 工作流平台 实现以下自动化任务:
- 输入一个书单名称 → 自动生成视频脚本、封面图、配音及剪辑草稿
- 支持多书封面并行加载与动画处理
- 支持自动生成文案与语音合成
- 输出可直接编辑的剪映草稿链接
二、整体流程拆解
整个视频制作流程可分为以下几个核心模块:
模块 | 功能描述 |
---|---|
1. 数据输入 | 用户输入书单名称(如《基督山伯爵》) |
2. 封面获取 | 大模型生成8本书封面+本期主书封面 |
3. 文案生成 | 大模型根据书名生成推荐语句 |
4. 时间线分割 | 使用大模型对文案时间线进行结构化拆分 |
5. 图片处理 | 对封面图进行格式转换、尺寸适配 |
6. 关键帧设置 | 控制封面动画效果(缩放、旋转、透明度) |
7. 草稿合成 | 所有元素整合为剪映草稿文件 |
三、关键技术实现详解
3.1 数据输入与变量管理
Input:book_name: "基督山伯爵"
定义统一变量名 book_name
,作为后续所有节点的数据源。
3.2 封面获取与处理
3.2.1 生成八本书封面
使用大模型节点(LLM Node)调用提示词模板:
请随机生成8本与《{book_name}》风格相近的书籍,并列出它们的书名和封面图片链接。
输出格式要求为 JSON 数组:
[{"title": "人间失格", "cover_url": "https://example.com/cover1.jpg"},...
]
3.2.2 获取本期主书封面
同理调用 LLM 节点生成本期主书信息:
请给出《{book_name}》的封面图片链接。
3.3 文案生成与语音合成
3.3.1 生成每句文案
使用 LLM 节点生成文案列表:
请为《{book_name}》写一句推荐语,并以数组形式返回。
示例输出:
["人类的智慧包含在等待和希望中。", "等待是痛苦的,但希望是甜蜜的。"]
3.3.2 语音合成批处理
使用 TTS 插件(如阿里云、百度语音等),将文案列表逐条合成音频:
for sentence in sentences:audio = tts(sentence)save_audio(audio, f"audio_{index}.mp3")
3.4 时间线分割与结构化
3.4.1 大模型提取时间线
使用 LLM 提取每句文案对应的时间段落:
请将以下文案按播放顺序分配时间区间:
"{sentences}"
输出格式示例:
[{"start": 0, "end": 2},{"start": 2, "end": 4}
]
3.4.2 构建嵌套时间结构
将时间线组织为层级结构(timeline 1~4):
{"timeline_1": [0, 2],"timeline_2": [2, 4],"timeline_3": [4, 6],"timeline_4": [6, 10]
}
3.5 图像处理与关键帧添加
3.5.1 图像格式化处理(image enforce)
将封面图片 URL 转换为剪映支持的格式:
def image_enforce(url):return {"url": url,"width": 1920,"height": 1080,"duration": 2}
3.5.2 添加关键帧动画
使用关键帧插件设置封面动画(缩放、旋转、透明度):
add_keyframe(target=image,type="scale",start=0,end=2,from_value=0.5,to_value=1
)add_keyframe(target=image,type="rotation",start=0,end=2,from_value=0,to_value=30
)
3.6 剪映草稿合成
3.6.1 创建基础草稿
draft = create_draft(width=1920, height=1080)
3.6.2 添加背景图片
background_image = image_enforce("https://example.com/background.jpg")
add_image(draft, background_image, timeline=[0, 10])
3.6.3 添加封面与边框动画
for cover in covers:add_image(draft, cover, timeline=timeline_1)add_keyframe(...)add_image(draft, border_image, timeline=timeline_2)
add_keyframe(...)
四、完整工作流结构图
[输入书名] ↓
[LLM生成8本书封面 + 主书封面]↓
[LLM生成文案列表]↓
[语音合成批处理]↓
[LLM提取时间线结构]↓
[图像格式化处理(image enforce)]↓
[关键帧动画设置]↓
[创建剪映草稿]↓
[添加背景、封面、边框、特效]↓
[输出可编辑草稿链接]
五、优化建议与注意事项
5.1 性能优化
- 批处理限制并发数:某些插件不支持高并发,建议设为
parallel=1
- 缓存中间结果:避免重复调用 LLM 或 TTS,提高效率
- 预加载资源库:提前准备好常用图片、音效等素材
5.2 容错机制
- 重试策略:TTS 和 LLM 调用失败时自动重试
- 异常捕获:节点失败后继续执行后续流程
- 日志追踪:记录每个节点的输入输出便于调试
5.3 可扩展性设计
- 模块化封装:将封面处理、关键帧逻辑封装为独立组件
- 插件扩展:支持接入外部 API(如豆瓣图书接口、Unsplash 图片库)
- 模板系统:支持多种视频风格模板切换(如极简风、复古风)
总体的图如下所示
分模块图如下:
六、结语
通过 Coze 工作流平台,我们可以高效地构建一个完整的书单视频自动化生成系统。该方案兼顾了易用性与灵活性,适用于内容创作者、教育机构或企业用于批量产出高质量短视频内容。
工作流资源库:
https://mp.weixin.qq.com/s/96e3GHOP2YUgc3Y11UE4wA
相关文章:

使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现
使用 Coze 工作流一键生成抖音书单视频:全流程拆解与技术实现(提供工作流) 摘要:本文基于一段关于使用 Coze 平台构建抖音爆火书单视频的详细讲解,总结出一套完整的 AI 视频自动化制作流程。内容涵盖从思路拆解、节点配…...

【发布实录】云原生+AI,助力企业全球化业务创新
5 月 22 日,在最新一期阿里云「飞天发布时刻」,阿里云云原生应用平台产品负责人李国强重磅揭晓面向 AI 场景的云原生产品体系升级,通过弹性智能的一体化架构、开箱即用的云原生 AI 能力,为中国企业出海提供新一代技术引擎。 发布会…...
vue中的派发事件与广播事件,及广播事件应用于哪些场景和一个表单验证例子
在 Vue 2.X 中,$dispatch 和 $broadcast 方法已经被废弃。官方认为基于组件树结构的事件流方式难以理解,并且在组件结构扩展时容易变得脆弱。因此,Vue 2.X 推荐使用其他方式来实现组件间的通信,例如通过 $emit 和 $on 方法&#x…...
DeepSeek 赋能智能养老:情感陪伴机器人的温暖革新
目录 一、引言二、智能养老情感陪伴机器人的市场现状与需求2.1 市场现状2.2 老年人情感陪伴需求分析 三、DeepSeek 技术详解3.1 DeepSeek 的技术特点3.2 与其他类似技术的对比优势 四、DeepSeek 在智能养老情感陪伴机器人中的具体应用4.1 自然语言处理与对话交互4.2 情感识别与…...

LabVIEW主轴故障诊断案例
LabVIEW 开发主轴机械状态识别与故障诊断系统,适配工业场景主轴振动监测需求。通过整合品牌硬件与软件算法,实现从信号采集到故障定位的全流程自动化,为设备维护提供数据支撑,提升数控机床运行可靠性。 面向精密制造企业数控机…...
gRPC 的四种通信模式完整示例
gRPC 的四种基本通信模式,包括完整的 .proto 文件定义和 Go 语言实现代码: 1. 简单 RPC (Unary RPC) - 请求/响应模式 客户端发送单个请求,服务端返回单个响应 calculator.proto protobuf syntax "proto3";package calculato…...
C#中Struct与IntPtr转换:实用扩展方法
C#中Struct与IntPtr转换:实用扩展方法 在 C# 编程的世界里,我们常常会遇到需要与非托管代码交互,或者进行一些底层内存操作的场景。这时,IntPtr类型就显得尤为重要,它可以表示一个指针或句柄,用来指向非托…...
Web安全:XSS、CSRF等常见漏洞及防御措施
Web安全:XSS、CSRF等常见漏洞及防御措施 一、XSS(跨站脚本攻击) 定义与原理 XSS攻击指攻击者将恶意脚本(如JavaScript、HTML标签)注入到Web页面中,当用户访问该页面时,脚本在浏览器端执行&…...
Java基础之数组(附带Comparator)
文章目录 基础概念可变参数组数组与ListComparator类1,基本概念2,使用Comparator的静态方法(Java 8)3,常用Comparator方法4,例子 排序与查找数组复制其他 基础概念 int[] anArray new int[10];只有创建对象时才会使用new关键字,所以数组是个…...

计算机组成与体系结构:补码数制二(Complementary Number Systems)
目录 4位二进制的减法 补码系统 🧠减基补码 名字解释: 减基补码有什么用? 计算方法 ❓为什么这样就能计算减基补码 💡 原理揭示:按位减法,模拟总减法! 那对于二进制呢?&…...

C#使用MindFusion.Diagramming框架绘制流程图(2):流程图示例
上一节我们初步介绍MindFusion.Diagramming框架 C#使用MindFusion.Diagramming框架绘制流程图(1):基础类型-CSDN博客 这里演示示例程序: 新建Windows窗体应用程序FlowDiagramDemo,将默认的Form1重命名为FormFlowDiagram. 右键FlowDiagramDemo管理NuGet程序包 输入MindFusio…...

【物联网-ModBus-RTU
物联网-ModBus-RTU ■ 优秀博主链接■ ModBus-RTU介绍■(1)帧结构■(2)查询功能码 0x03■(3)修改单个寄存器功能码 0x06■(4)Modbus RTU 串口收发数据分析 ■ 优秀博主链接 Modbus …...

Java应用10(客户端与服务器通信)
Java客户端与服务器通信 Java提供了多种方式来实现客户端与服务器之间的通信,下面我将介绍几种常见的方法: 1. 基于Socket的基本通信 服务器端代码 import java.io.*; import java.net.*;public class SimpleServer {public static void main(String…...
STM32学习之I2C(理论篇)
📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…...
【C/C++】algorithm清单以及适用场景
文章目录 algorithm清单以及适用场景1 算法介绍1.1 分类1.2 非修改序列算法1.3 修改序列算法1.4 排序与堆算法1.5 集合操作算法(要求有序)1.5 查找算法1.6 二分查找算法(有序区间)1.7 去重与分区算法1.8 数值算法 <numeric>…...

Python_day47
作业:对比不同卷积层热图可视化的结果 一、不同卷积层的特征特性 卷积层类型特征类型特征抽象程度对输入的依赖程度低层卷积层(如第 1 - 3 层)边缘、纹理、颜色、简单形状等基础特征低高,直接与输入像素关联中层卷积层(…...

如何在mac上安装podman
安装 Podman 在 macOS 上 在 macOS 上安装 Podman 需要使用 Podman 的桌面客户端工具 Podman Desktop 或通过 Homebrew 安装命令行工具。 使用 Homebrew 安装 Podman: (base) ninjamacninjamacdeMacBook-Air shell % brew install podman > Auto-updating Hom…...

小黑一层层削苹果皮式大模型应用探索:langchain中智能体思考和执行工具的demo
引言 小黑黑通过探索langchain源码,设计了一个关于agent使用工具的一个简化版小demo(代码可以跑通),主要流程: 1.问题输入给大模型。 2.大模型进行思考,输出需要执行的action和相关思考信息。 3.通过代理&…...
CppCon 2015 学习:Intro to the C++ Object Model
这段代码展示了使用 make 工具来编译 C 程序的简单过程。 代码和步骤解析: C 代码(intro.cpp):#include <iostream> int main() { std::cout<<"hello world\n"; } 这是一个简单的 C 程序,它包…...
Go 语言中的 make 函数详解
Go 语言中的 make 函数详解 make 是 Go 语言中的一个内置函数,用于初始化切片(slice)、映射(map)和通道(channel)这些引用类型。这些类型必须在使用前通过 make 初始化&#x…...

阿里云ACP云计算备考笔记 (4)——企业应用服务
目录 第一章 企业应用概览 第二章 云解析 1、云解析基本概念 2、域名管理流程 3、云解析记录类型 4、域名管理 ① 开启注册局安全锁 ② 域名赎回 第二章 内容分发网络CDN 1、CDN概念 2、使用CDN前后对比 3、使用CDN的优势 4、阿里云CDN的优势 5、配置网页性能优化…...
用 NGINX 构建高效 SMTP 代理`ngx_mail_smtp_module`
一、模块定位与作用 协议代理 NGINX 监听指定端口(如 25、587、465 等),接收客户端的 SMTP 会话请求。代理层在会话中透明转发客户端的 EHLO、MAIL FROM、RCPT TO、DATA 等命令到后端 MTA。 认证控制 通过 smtp_auth 指令指定允许的 SASL 认…...
【前端】常用组件的CSS
1. button的样式修改 每个环节有五个不同的状态:link,hover,active,focus和visited. Link是正常的外观,hover当你鼠标悬停时,active是单击它时的状态,focus跟随活动状态,visited是你在最近点击的链接未聚焦时结束的状态。 纯CSS 以下为例子,按下后从浅紫到深紫。注…...
【华为云学习与认证】以华为云物联网为基座的全栈开发(从物联网iot平台模块到应用展示、数据分析、机器学习、嵌入式开发等)的系统性学习与认证路线
总目标 学习以华为云物联网为基座的全栈开发(从物联网iot平台模块到应用展示、数据分析、机器学习、嵌入式开发等)的系统性学习与认证路线。计划包含阶段学习、技术文档、实操实际操作、开发路径与考证规划,提供职业生涯基础性规划。 注意&…...
OpenCV 键盘响应来切换图像
一、知识点 1、int waitKey(int delay 0); (1)、等待按键。 等待指定的毫秒数,返回按键的ASCII码。 (2)、返回值: int型,表示按键ASCII码。 若没有按键,指定时间过去,返回-1。 (3)、参数delay: 等待时间,单位毫…...

ARM SMMUv3简介(一)
1.概述 SMMU(System Memory Management Unit,系统内存管理单元)是ARM架构中用于管理设备访问系统内存的硬件模块。SMMU和MMU的功能类似,都是将虚拟地址转换成物理地址,不同的是MMU转换的虚拟地址来自CPU,S…...
C#提取CAN ASC文件时间戳:实现与性能优化
C#提取CAN ASC文件时间戳:实现与性能优化 在汽车电子和工业控制领域,CAN总线是最常用的通信协议之一。而ASC(ASCII)文件作为CAN总线数据的标准日志格式,广泛应用于数据记录和分析场景。本文将深入探讨如何高效地从CAN…...

hadoop集群datanode启动显示init failed,不能解析hostname
三个datanode集群,有一个总是起不起来。去查看log显示 Initialization failed for Block pool BP-1920852191-192.168.115.154-1749093939738 (Datanode Uuid 89d9df36-1c01-4f22-9905-517fee205a8e) service to node154/192.168.115.154:8020 Datanode denied com…...
Android 视图系统入门指南
1. View:界面的最小单位 本质:屏幕上的一个矩形区域,能显示内容或接收触摸。比喻:就像乐高积木,是组成界面的最小单位。常见子类: TextView(文字积木)、Button(按钮积木…...

浏览器工作原理05 [#] 渲染流程(上):HTML、CSS和JavaScript是如何变成页面的
引用 浏览器工作原理与实践 一、提出问题 在上一篇文章中我们介绍了导航相关的流程,那导航被提交后又会怎么样呢?就进入了渲染阶段。这个阶段很重要,了解其相关流程能让你“看透”页面是如何工作的,有了这些知识,你可…...