MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频
扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。
这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了,体验会更加丝滑。
这次我是想将一个儿童故事绘本的工作流发布成MCP,在扣子空间里使用,最终效果就是通过一句话就能生成一个有背景音乐,有人声朗读的儿童故事绘本视频。
在尝试过程中,发现扣子空间的能力和Manus相比还有进步空间,毕竟现在还是beta版本,进展并不如想象中顺利。
最终生成的是一个rap版本的故事绘本视频(至于为什么会做成rap版本,我这里先卖个关子,后面会有解释),这是其中一段:
武松打虎rap视频-b546a90b27
下面详细介绍我的制作过程,其中有不少技巧(坑),也算是摸索了一下当前扣子空间的能力边界。
测试视频生成能力
在正式进行之前,我先做了一个验证测试,确认扣子空间是否有生成视频的能力。
我上传了一张火车票的图片,让扣子空间生成一段音乐,和图片一起合成一段视频。
可以看到扣子空间自己安装了ffmpeg,这个是用来生成视频的软件
Tips: 在我多次尝试过程中,发现并不是每次扣子空间都可以成功安装ffmpeg,如果没有安装成功,可以这样输入指令:
用这个命令安装ffmpeg:apt-get update && apt-get install -y ffmpeg
这样基本上就都能安装成功了。
接下来遇到另外一个坑,生成的视频大小为0,无法播放,经过反复试错,发现可能是因为视频时长过长。
于是修改指令指定生成一段15s长的音乐:
生成15s的舒缓音乐,和附件的图片一起生成一段mp4格式的视频,视频长宽都是720
果然,这样就可以生成有效的视频了,如下:
video3
Tips: 现在扣子空间到底能支持多长的视频生成,我还没有测试过边界,我现在生成过的最长视频是30s
好了,经过以上测试,算是验证了扣子空间生成视频的能力。
可以进行下一步了:将儿童故事绘本工作流引入扣子空间使用。
这个过程分为两步:
-
将扣子工作流发布成扣子空间的MCP扩展
-
在扣子空间中使用这个MCP扩展进行视频创作
下面详细说明如何操作。
发布扣子工作流MCP扩展
说明一下,目前扣子平台只支持将扣子应用发布成MCP(据称后面马上会支持直接将工作流发布成MCP),所以这里我们要多走一步,先创建一个扣子应用。
创建扣子应用
然后将工作流加入应用,界面部分不用管,添加了工作流就可以直接发布成MCP了。
儿童故事绘本的工作流如下,因为这篇文章重点不是介绍扣子工作流,就不展开介绍了,有需要的朋友可以给我留言。
发布成MCP服务
点击右上角的发布进入发布界面以后可以看到,在最右侧有一个MCP服务的选项,点击它就会跳到底部MCP服务那里
这里需要先配置一下,点开配置,勾选全部即可
发布完成
发布完成后,就可以在扣子空间使用了。
扣子空间生成故事视频
按以下步骤操作:
添加扩展
在扣子空间的自定义扩展里可以看到我们刚在扣子平台里发布的这个MCP服务:儿童故事绘本,点击添加。
然后再添加另外两个扣子空间自带的MCP扩展:语音合成(用于生成朗读音频)和音乐生成(用于生成背景音乐),一共3个扩展,如下:
输入指令
这个是我尝试了很多次,才找到的可以成功生成视频的提示词。
相比 Manus 扣子空间的大模型能力还不够强大,遇到问题不太会自己处理,有时候反而需要我给它指令来帮助它解决问题。
比如这里的坑主要是在图片处理上,需要告诉扣子空间将图片下载到本地,否则后面合成视频的时候,无法正确提取到图片。
我之前也测了不少Manus的案例,如果是Manus,这种问题它应该会自己搞定。
终于,视频成功生成了
但是还有个问题,生成的背景音乐,无论我怎么修改提示词(试了差不多十遍),它始终会有人声,无法生成纯音乐,这个就很无语了,效果是这样滴:
武松打虎绘本视频-1bd6b01b1f
所以我最后只能选择不要朗读音频或者不要背景音乐。
然鹅,我突然灵机一动,如果把故事内容作为音乐的歌词呢?这不就完美解决了朗读和音乐结合的问题嘛,而且还颇有新意,于是开头的那个rap视频就是这么来的~~
当然还是期待将来会有支持生成纯音乐的扩展。
写在最后
这算是一次有趣的尝试,对扣子空间当前的能力做了一次探索。虽然说不算完美,但是整个流程是跑通的,这个非常重要。
扣子空间有自己的平台优势,因为它有扣子平台巨量的用户和工作流,这两者打通以后,会产生巨大的化学反应。
扣子空间现在还在beta版本,不能苛求它多完美,但是未来绝对可期。
比如,将来如果把图生视频的MCP接入进来,那么在现在这个demo基础上,我就可以通过一句话做出有动画效果的故事视频了,想想都非常期待~~
更多精彩内容推荐:
-> AI智能体学习&实战
-> 私域AI机器人
-> 自媒体AIP打造
-> AI应用
相关文章:

MCP实战:在扣子空间用扣子工作流MCP,一句话生成儿童故事rap视频
扣子最近迎来重要更新,支持将扣子工作流一键发布成MCP,在扣子空间里使用。 这个功能非常有用,因为我有很多业务工作流是在扣子平台上做的,两者打通之后,就可以在扣子空间里直接通过对话方式调用扣子工作流了࿰…...
分布式微服务系统架构第134集:笔记1运维服务器经验,高并发,大数据量系统
加群联系作者vx:xiaoda0423 仓库地址:https://webvueblog.github.io/JavaPlusDoc/ https://1024bat.cn/ https://github.com/webVueBlog/fastapi_plus https://webvueblog.github.io/JavaPlusDoc/ ✅ 一、查看端口是否被占用的常用命令 1️⃣ lsof 命令&…...
【SSL证书系列】客户端如何验证https网站服务器发的证书是否由受信任的根证书签发机构签发
客户端验证HTTPS网站证书是否由受信任的根证书颁发机构(CA)签发,是一个多步骤的过程,涉及证书链验证、信任锚(Trust Anchor)检查、域名匹配和吊销状态验证等。以下是详细的验证流程: 1. 证书链的…...

SpringBoot基础项目搭建
资料链接:https://download.csdn.net/download/ly1h1/90855288?spm1001.2014.3001.5501 1.准备工作 1.1 安装IntelliJ IDEA 2023.3.4 (Ultimate Edition) 1.2 采用apache-maven-3.6.3 1.2.1 maven配置文件设置 1.2.2 IDEA配置maven 1.3 JDK采用17版本 2.手动创建…...
Rust 学习笔记:关于 HashMap 的练习题
Rust 学习笔记:关于 HashMap 的练习题 Rust 学习笔记:关于 HashMap 的练习题以下代码能否通过编译?若能,输出是?以下代码能否通过编译?若能,输出是? Rust 学习笔记:关于 …...
C语言-8.数组
8.1数组 8.1.1初试数组 如何写一个程序计算用户输入的数字的平均数? #include<stdio.h> int main() {int digit;//输入要求平均数的数字double sum=0;//记录输入数字的和int count=0;//记录输入数字的个数printf("请输入一组数字,用来求平均数,以-1结束\n&quo…...
Kotlin Android单元测试MockK指南
目录 MockK 简介环境配置基础用法高级用法Android 特有场景最佳实践 1. MockK 简介 MockK 是一个专为 Kotlin 设计的 Mocking 框架,支持协程、扩展函数、对象声明(object)等 Kotlin 特性。相比 Mockito,它提供更自然的 Kotlin A…...
C# lock
在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时,其他线程无法访问同一实例的该代码块。这是一种简单的同步机制,用来防止多个线程同时访问共享资源或执行需要独占访问的代码段(临界区),从而…...
《算法导论(第4版)》阅读笔记:p83-p85
《算法导论(第4版)》学习第 18 天,p83-p85 总结,总计 3 页。 一、技术总结 1. Strassen algorithm(施特拉森算法) 2.矩阵 (1)矩阵表示法 If we wish to refer to matrices without specifically writing out all their entries, we will use upperc…...
Go 后端中双 token 的实现模板
下面是一个典型的 Go 后端双 Token 认证机制 实现模板,使用 Gin 框架 JWT Redis,结构清晰、可拓展,适合实战开发。 项目结构建议 /utils├── jwt.go // Access & Refresh token 的生成和解析├── claims.go // 从请求…...

【拥抱AI】Deer-Flow字节跳动开源的多智能体深度研究框架
最近发现一款可以对标甚至可能超越GPT-Researcher的AI深度研究应用,Deer-Flow(Deep Exploration and Efficient Research Flow)作为字节跳动近期开源的重量级项目,正以其模块化、灵活性和人机协同能力引发广泛关注。该项目基于 La…...
第六天——贪心算法——字符串分隔
1. 题目 给定一个字符串 s,我们需要将其划分为尽可能多的部分,使得同一字母最多出现在一个部分中。 例如:字符串 "ababcc" 可以划分为 ["abab", "cc"],但要避免 ["aba", "bcc&quo…...
Python 条件语句详解
条件语句是编程中用于控制程序流程的基本结构,Python 提供了几种条件语句来实现不同的逻辑判断。 1. if 语句 最基本的条件语句形式: if 条件:# 条件为真时执行的代码块示例: age 18 if age > 18:print("你已经成年了")2. …...

前端获取用户的公网 IP 地址
可以使用免费的免费的公共服务网站 一:https://www.ipify.org/ 获取 JSON 格式的 IP 地址 // 旧地址不好使 // https://api.ipify.org/?formatjson // 新地址 https://api64.ipify.org/?formatjson 二:https://ipinfo.io/ https://ipinfo.io/ 三&a…...
在Maven中替换文件内容的插件和方法
在Maven中替换文件内容的插件和方法 Maven提供了几种方式来替换文件内容,以下是常用的插件和方法: 1. maven-replacer-plugin (推荐) 这是专门用于文件内容替换的插件,功能强大且灵活。 基本配置 <plugin><groupId>com.goog…...
符合Python风格的对象(再谈向量类)
再谈向量类 为了说明用于生成对象表示形式的众多方法,我们将使用一个 Vector2d 类,它与第 1 章中的类似。这一节和接下来的几节会不断实 现这个类。我们期望 Vector2d 实例具有的基本行为如示例 9-1 所示。 示例 9-1 Vector2d 实例有多种表示形式 &g…...

云电竞服务器 工作原理
云电竞服务器工作原理详解 一、核心架构原理 虚拟化资源池 通过 KVM/VMware 等虚拟化技术将物理服务器(含NVIDIA GPU集群)抽象为可动态分配的算力资源池,每个用户独享独立虚拟机实例,实现硬件资源的按需分配与隔离运行。 …...

【数据结构】线性表--队列
【数据结构】线性表--队列 一.什么是队列二.队列的实现1.队列结构定义:2.队列初始化函数:3.队列销毁函数:4.入队列函数(尾插):5.出队列函数(头删):6.取队头元素ÿ…...

[Vue3]语法变动
Vue3的语法相对比Vue2有不少改变,这篇讲一下基础语法在Vue3里的形式。 创建Vue对象 在脚手架项目中,index.html等资源不再编写代码,只作为一个容器。所有的页面代码都在.vue相关文件中进行编写,由main.js引入各个.vue文件渲染出页…...

Ubuntu服务器开启SNMP服务 监控系统配置指南 -优雅草星云智控简易化操作
Ubuntu服务器开启SNMP服务 & 监控系统配置指南 -优雅草星云智控简易化操作 一、Ubuntu服务器开启SNMP服务 步骤1:安装SNMP服务 sudo apt update sudo apt install snmp snmpd snmp-mibs-downloader -y 步骤2:配置SNMP(编辑配置文件&am…...

linux本地部署ollama+deepseek过程
1.Tags ollama/ollama GitHub 选择一个版本下载,我下的是0.5.12 2.tar解压该文件 3.尝试启动ollama ollama serve 4.查看ollama的版本 ollama -v 5.创建一个系统用户 ollama,不允许登录 shell,拥有一个主目录,并且用…...

从零开始实现大语言模型(十五):并行计算与分布式机器学习
1. 前言 并行计算与分布式机器学习是一种使用多机多卡加速大规模深度神经网络训练过程,以减少训练时间的方法。在工业界的训练大语言模型实践中,通常会使用并行计算与分布式机器学习方法来减少训练大语言模型所需的钟表时间。 本文介绍PyTorch中的一种…...

OpenCV进阶操作:指纹验证、识别
文章目录 前言一、指纹验证1、什么是指纹验证2、流程步骤 二、使用步骤(案例)三、指纹识别(案例)1、这是我们要识别的指纹库2、这是待识别的指纹图3、代码4、结果 总结 前言 指纹识别作为生物识别领域的核心技术之一,…...

网络安全-等级保护(等保) 2-5 GB/T 25070—2019《信息安全技术 网络安全等级保护安全设计技术要求》-2019-05-10发布【现行】
################################################################################ GB/T 22239-2019 《信息安全技术 网络安全等级保护基础要求》包含安全物理环境、安全通信网络、安全区域边界、安全计算环境、安全管理中心、安全管理制度、安全管理机构、安全管理人员、安…...

3D生成新突破:阶跃星辰Step1X-3D开源,可控性大幅提升
Step1X-3D 是由 StepFun 联合 LightIllusions 推出的新一代 高精度、高可控性 3D资产生成框架。基于严格的 数据清洗与标准化流程,我们从 500万 3D资产 中筛选出 200万高质量数据,构建了 标准化的几何与纹理属性数据集,为3D生成提供更可靠的训…...

MySQL数据类型之VARCHAR和CHAR使用详解
在设计数据库字段时,字符串类型算是最常见的数据类型之一了,这篇文章带大家深入探讨一下MySQL数据库中VARCHAR和CHAR数据类型的基本特性,以及它们之间的区别。 VARCHAR类型 VARCHAR(Variable Character,可变长度字符…...
数字人 LAM 部署笔记
目录 windos踩坑 GitHub - aigc3d/LAM: [SIGGRAPH 2025] LAM: Large Avatar Model for One-shot Animatable Gaussian Head windos踩坑 nvidia-smi环境 cuda 11.8conda install -c "nvidia/label/cuda-11.8.0" cuda-toolkit conda create --name cuda11.8 -y pyth…...

《Docker 入门与进阶:架构剖析、隔离原理及安装实操》
1 docker 简介 1.1 Docker 的优点 Docker 是一款开放平台,用于应用程序的开发、交付与运行,能将应用和基础架构分离,实现软件快速交付 ,还能以统一方式管理应用和基础架构,缩短代码从编写到上线的时间。其核心优势如…...

基于Akamai云计算平台的OTT媒体点播转码解决方案
点播视频(VOD)流媒体服务依赖于视频流的转码来高效分发内容。在转码工作流程中,视频被转换为适合观看设备、网络条件和性能限制的格式。视频转码是计算密集型过程,因此最大化可用硬件上可转码的视频流数量是首要考虑因素。不同基础…...

【MySQL】02.数据库基础
1. 数据库的引入 之前存储数据用文件就可以了,为什么还要弄个数据库? 文件存储存在安全性问题,文件不利于数据查询和管理,文件不利于存储海量数据,文件在程序中控制不方便。而为了解决上述问题,专家们设计出更加利于…...