爆火的儿童绘本如何用AI制作?一文解锁从制作到变现的全流程!
大家好我是安琪! AI绘图发展势头如此猛烈,无论是Stable Diffusion,Midjourney,还是国内百度的文心一格,字节的豆包等,AI绘图技术越来越成熟,风格也越来越多样化。那么问题来了,对于普通人来说,我们肯定会非常关心一个问题:
普通人要如何靠AI绘图,实现变现赚钱呢?
今天我将为大家详细讲解一种AI绘图变现方式——儿童绘本
本文虽然只对儿童绘本的制作以及变现的整个过程做详细的拆解,但是反过来说,AI只是工具,儿童绘本也只是变现方式之一,希望大家可以举一反三,思考更多的AI变现方式!
话不多说,我们先看效果,下面这是一个灰姑娘的儿童绘本故事
一、爆点发现
儿童绘本这一类的视频,在某书不算多,但粉丝量和流量都很可观,因为某书的主要用户群体是20-40岁左右的女性,这类群体中有很大部分是孕妈和宝妈,那对于他们来说,儿童绘本就非常符合他们的一个育儿需求。
因此,儿童绘本非常适合在某书入场!
我们在某书也能发现一些这一类做儿童绘本的账号(为了避免引流嫌疑,所有账号相关信息都做了处理)
某书账号
某书账号
某书账号
可以看到,这类账号,一旦做起来,其粉丝量和点赞量,都是非常可观的。一旦获取了流量之后,那么不管是带货还是做教学,还是卖课,都是比较容易实现的变现方式
从儿童绘本方向延伸,其实可以做的方向还有很多,比如小故事、童话故事、高考词汇、托福雅思单词、自然拼读等
二、实现方式
那么我们就从技术层面,先为大家拆解儿童绘本的制作流程
接下来,我们就通过头部账号的内容,来观察拆解实现方式
儿童故事
做儿童绘本的基础,是一个引人入胜的故事。当然了,既然是儿童绘本,就故事更多针对儿童向。故事的来源一般情况下可以有两种来源:从公域寻找,和使用GPT(或其他大模型)创造故事
1.公域寻找
公域寻找的目的主要是为了规避版权问题,既然是想通过儿童绘本来做变现赚钱,那么版权问题是一定要注意的,如果不是自己写故事,那么故事来源一定要规避版权问题。
gutenberg
pdfdrive
当然了,这类站点其实也很多,只要能找到适合做儿童绘本的故事,且无版权争议都行
2.GPT创造故事
AI发展到今天,除了绘图以外,大语言类的模型也是发展迅猛,最亮眼的莫过于ChatGPT了,想使用GPT创造一个儿童故事,简直太易如反掌了。根据GPT的特点,它可以学习投喂的数据,根据故事的风格,创造出一个全新的故事。
GPT创造故事
AI绘图
有了故事之后,就来到我们的重点了,一个合适的画风,精美的画面,是你的绘本故事能否吸引人的关键。
1. 选择画风
画风选择上,我们可以参考某书上比较受欢迎的绘本账号使用的画风,前期在起号阶段参考其他人的画风即可。常见画风有以下几种:
1.油画风
油画风
2.皮克斯风
皮克斯风
3.漫画风
漫画风
4.西式绘本风
西式绘本风
以上是目前某书里做儿童绘本的头部账号的常用画风,从数据上来看,油画风是最受欢迎的风格
还有很多诸如此类的画风对应的提示词:
Oil painting(油画),Comics(漫画),cartoons(卡通),realism(写实),fantasy(奇幻),science fiction(科幻),ancient(古代),pixels(像素)
2. 选择工具
确定好风格之后,我们需要选择合适的绘图工具,对于儿童绘本来说,其实绘图工具不是非常受限制。
不同于真人AI写真,或AI换脸,或老照片修复等其他AI变现方式,儿童绘本对画面的质量不会特别高,一方面绘本风格不要求写实,画面中的小瑕疵,或其他夸张的表现,甚至更加适合于做绘本。
绘图部分就不详细展开,大家可自由选择绘图工具,常见有以下几种:
开源:
- Stable Diffusion
收费:
-
Dall.E
-
Midjourney
可白嫖:
-
Leonardo.ai
-
dreammina
-
文心一格
3. 绘图
接下来,我们就可以开始绘图了,对于AI绘图来说,最重要的是要告诉AI你的提示词,也就是俗称的咒语。AI需要清楚的知道你想要什么画面,所以需要你告诉他画面的元素。
比如我们使用以下提示词来描述画面:
在一个沐浴在金光下的豪华舞厅里,一位年轻女子穿着飘逸迷人的礼服和水晶高跟鞋,与一位穿着华丽服装的英俊男子共舞。空气中充满了管弦乐队的旋律和许多人羡慕的目光,这是一种迷人的气氛。这个场景捕捉到了一个神奇的夜晚和无情的时间之间的对比,突出了那个夜晚短暂的魅力和持久的影响之间的对比。
电影照片,细节,8k,趋势,惊人的艺术,丰富多彩的,3D渲染,超细节,超高清画质,最出众的画质
对于英文更友好的AI绘图工具,我们再翻译成英文提示词
In an opulent ballroom bathed in golden light, a young woman in an ethereal glamorous gown and crystal heels danced with a handsome man in gorgeous outfits. The air was filled with the melodies of the orchestra and the envious stares of many, and it was a charming atmosphere. The scene captures the contrast between a magical night and unforgiving time, highlighting the contrast between the fleeting charm and the lasting impact of that night,
movie photo, detailed, 8k, trending, amazing art, colorful,3D rendering, super detailed, ultra-high definition picture quality, the most outstanding picture quality
根据以上提示词,我在ComfyUI的工具中,使用对应的模型,绘制出来以下画面
AI绘图
通过这样的方式举一反三,根据故事的内容,我们来绘制出不同的画面,一般一个故事内,不会超过10张图片
文末可获取我的常用儿童绘本ComfyUI工作流
关于角色一致性问题: 一定有小伙伴会有这样的疑问,不同图片中角色的脸都不一样怎么办?这岂不是会让人出戏?
这个问题,其实大家大可不必担心。一方面,真的作为观众来说,小范围的差异化我们都是能接受的,只要不是类似于上一秒还是王子,下一秒变公主这样的大反差,观众一般都会买账的。
再说回问题本身,如果真的对角色一致性有担忧,不管是Midjourney还是Stable Diffusion,都有对应的固定人脸的解决方案,这里就不展开了,感兴趣可关注我,后期专门讲解如何固定人脸。
朗读音频
现在我们有了画面了,还差最后一步:音频。我们需要有一个适合来读儿童绘本的音频部分。
对于音频部分来说,也有很多的方案
1. 剪映
字节的剪映工具内部,就自带了很多声音音色,可以朗读我们的故事,其中就有一个音色是专门用于儿童绘本的
剪映音色
优点:超级方便,省事
缺点:音色有限,且适合儿童绘本的音色仅此一个,其他的语速语调都不适合
2. ElevenLabs
国外也有很多类似文字转语音的站点,比如elevenlabs,elevenlabs每天会有免费的使用额度,对于做儿童绘本来说是足够的,并且它可选择音色很多,也支持多种语言包括中文和英语,对于做双语绘本是非常便利的
ElevenLabs
对于文字转语音部分,可选择的方式其实还有很多,无论是国外的Google,还是国内的科大讯飞,都有很多成熟方案,大家可自行发现
3. 本地声音克隆
如果其他工具提供的音色都不喜欢怎么办?如果那些音色都不适合儿童绘本怎么办?那我们就可以找到合适的声音,或者自己录制一个音色,用声音克隆的方式,对声音进行复刻!
目前github上比较受欢迎的一个声音克隆工具是gpt-sovits,由于是开源工具,所以可以基于本地进行部署
文末可获取gpt-sovits整合包
gpt-sovits
它可以根据一段或多段音频,进行训练、学习、推理。简单来说,就是我们可以找到一段自己喜欢的音色,通过这个克隆工具,来为我们讲儿童绘本故事
对于gpt-sovits工具,后面将专门出文详细讲解如何使用,这里就先略过,感兴趣的小伙伴可以先关注我,我将持续输出优质内容!
特别注意:此开源工具可以克隆任意声音,但请注意声音来源不能有任何侵权行为,且保证自己合法使用该工具,勿用于非法用途!
视频剪辑
有了故事、画面、声音,素材就算准备齐全了,我们只需要使用视频剪辑工具把它们组合起来即可。剪辑工具我认为不用太过纠结,直接用剪映就好,无论是对于新手的友好程度,还是对于剪辑的体验,都是非常不错的
视频的剪辑逻辑主要是以下步骤:
1.语音识别转字幕
这一步在剪映内就可以很方便的实现,转成字幕之后,就能在画面中看到字幕,再对字幕的字体、位置、大小等做详细调整
语音识别
2.字幕翻译
这个步骤不是必须的,如果你想做的是双语绘本,那么则需要将字幕再做一次翻译后,多加一层字幕。
需要注意的是,由于不同语言的语法问题,翻译后的字幕可能还需要对字幕位置和翻译内容做一遍校正(比如英文常见的倒装句,需要在中文中做调整),这一步会比较考验作者对应语言的功底
3.添加素材
把图片、音频、和字幕,全部在时间轴轨道调整排列好
4.画面动画
我们观察其他头部账号能发现,他们的画面不是静止不动的,而是会产生移动,这一点可以通过剪映的位置关键帧或缩放关键帧来实现
比如我们要实现画面从左往右移动的效果,我们就可以在第一帧打上位置关键帧,把画面拖到最左,然后在最后一帧打上关键帧,把画面拖到最右,那么剪映就可以通过你的关键帧信息,自动帮我们实现画面从左往右移动的效果
关键帧
当然了,实现这个效果的前提,是你的画面足够大,能够在窗口中左右拖动而不会出现黑边。
以下就是一个视频剪辑的画面,相比于其他复杂的视频剪辑,这个时间轴可以说是非常简单了
剪辑界面
三、如何变现
看到这里,其实你就已经学会了如何用AI制作一个儿童绘本了,那么它如何能变现呢?
其实对于变现方式来说,国内首选还是某书平台,前面也提到,某书面向的群体中会有大量的宝妈和孕妈,她们会更关注这一类的育儿教育类的笔记。所以我们要做的就是不断输出儿童绘本笔记。
对于某书平台来说,只要你的内容足够优质,起号只是早晚的事,如果你看的足够仔细,你会发现我前面对其他某书账号的截图中,并不是所有笔记都是有很高的流量的,这因为起号是有一个过程的,一旦账号起来,就会进到某书的流量池,有了流量之后,不管你的带货卖课,还是做教学教程,都可以实现变现了。
当然我们还可以探索更多的儿童绘本故事的变现方式,比如国内可以发某书,那么国外是否有类似的平台,做的这类账号的人不多,还有入场机会?更多方式,就要留给你们自己去思考了!
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
资料软件免费放送
次日同一发放请耐心等待
关于AI绘画技术储备
学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!
需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】
**一、AIGC所有方向的学习路线**
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
相关文章:

爆火的儿童绘本如何用AI制作?一文解锁从制作到变现的全流程!
大家好我是安琪! AI绘图发展势头如此猛烈,无论是Stable Diffusion,Midjourney,还是国内百度的文心一格,字节的豆包等,AI绘图技术越来越成熟,风格也越来越多样化。那么问题来了,对于普…...

Go interface{}类型转换
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…...

利用opencv自带的Haar级联分类器模型
OpenCV自带的Haar级联分类器模型: haarcascade_eye.xml: 这个模型用于检测眼睛。 haarcascade_eye_tree_eyeglasses.xml: 这个模型用于检测眼镜。 haarcascade_frontalcatface.xml: 这个模型用于检测猫脸。 haarcascade_frontalcatface_extended.xml: 这个模型用…...

国产USB音频转换芯片CL7016C 支持国美标线控USB Type-C音频编解码器
CL7016C是一款高保真 USB Type-C 兼容音频编解码芯片。可以录制和回放有 24 比特音乐和声音。内置回放通路信号 动态压缩, 最大42db录音通路增益, PDM 数字麦克风,和立体声无需电容耳机驱动放大器。 5V单电源供电。兼容 USB 2.0 全速工业标…...

【linux网络(六)】IP协议详解
💓博主CSDN主页:杭电码农-NEO💓 ⏩专栏分类:Linux从入门到精通⏪ 🚚代码仓库:NEO的学习日记🚚 🌹关注我🫵带你学更多操作系统知识 🔝🔝 Linux网络 1. 前言2. IP协议报…...
CesiumJS【Basic】- #012添加点线面(entity方式)
文章目录 添加点线面(entity方式)1 目标2 实现2.1 GeometryManager.ts2.2 main.ts添加点线面(entity方式) 1 目标 使用实体方式添加点线面 2 实现 2.1 GeometryManager.ts // src/GeometryManager.tsimport * as Cesium from cesium;export class GeometryManager {pr…...

【Redis】内存回收和内存淘汰机制
1 概念 Redis 所有的数据都是存储在内存中的, 如果不进行任何的内存回收, 那么很容易出现内存爆满的情况。因此,在某些情况下需要对占用的内存空间进行释放。 Redis 中内存的释放主要分为两类 Redis 中内存的释放主要分为两类: 内存回收: 将过期的 key 清除&#…...

PyTorch实战:借助torchviz可视化计算图与梯度传递
文章目录 Tensor计算的可视化(线性回归为例) 如何使用可视化库torchviz 安装graphviz软件 安装torchviz库使用 torchviz.make_dot() 在学习Tensor时,将张量y用张量x表示,它们背后会有一个函数表达关系,y的 grad_f…...

【软件测试】软件测试入门
软件测试入门 一、什么是软件测试二、软件测试和软件开发的区别三、软件测试在不同类型公司的定位1. 无组织性2. 专职 OR 兼职3. 项目性VS.职能性4.综合型 四、一个优秀的软件测试人员具备的素质1. 技能相关2. 非技能相关 一、什么是软件测试 最常见的理解是:软件测…...
Windows操作防火墙命令
Windows操作防火墙命令 启用防火墙: netsh advfirewall set allprofiles state on禁用防火墙: netsh advfirewall set allprofiles state off添加新的入站规则允许端口80(HTTP): netsh advfirewall firewall add r…...
二维数组的知识
二维数组: 1.同种数组类型的集合 2.连续的内存空间 3.由多个一维数组组成 定义方式: 存储类型 数据类型 数组名[常量表达式(行数)][常量表达式(列数)]࿱…...

HR3.0时代,人力资本效能如何进化?| 易搭云DHR
宏观经济增速放缓、市场竞争激烈,对各行各业、各种岗位都面临更大挑战,如何降本增效还是每个企业主的关注焦点。 企业的主要支出往往是员工成本,总体上超过企业总开支的75%,轻资产类型的企业甚至可能超80%,但裁员、加班…...

R语言做图
目录 1. 图形参数 2. 低级图形 3. 部分高级图形 参考 1. 图形参数 图形参数用于设置图形中各种属性。 有些参数直接用在绘图函数内,如plot函数可以用 pch(点样式)、col(颜色)、cex(文字符号大小倍数&…...

跟着我一步两步三步,用开源方式将AI带入企业
“AI有开源派与闭源派,你挺哪一派?”这是红帽公司针对媒体所做的一次小调查。结果显示,坚定的开源派占50%,挺闭源的仅有5.56%。如果是你,又会怎样选择? 如何才能让AI在企业中快速平稳落地,并且开…...

天途重磅推出无人机教管平台3.1版及飞课APP
天途无人机教管平台,是一款为院校和培训机构等企业级客户提供的公开版无人机在线培训系统,包含后台管理的【教管平台】和终端的【掌上天途APP】。 天途历经4年上百次调研和迭代打磨,已为一百多家院校和培训机构等企业级客户解决了无人机教学和…...

虚幻引擎 Gerstner Waves -GPU Gems 从物理模型中实现有效的水体模拟
这篇文章重点在于结合GPU Gems一书中有关Gerstner Waves 的数学公式,在虚幻引擎中复现正确的Gerstner Waves和正确的法线 文中内容整理自书中,并附带我的理解,与在虚幻引擎中的实现,可以参考原文看这篇文章,原文网上很…...

Labview_网络流
网络流的介绍 网络流是一种易于配置、紧密集成的动态通信方法,用于将数据从一个应用程序传输到另一个应用程序,其吞吐量和延迟特性可与 TCP 相媲美。但是,与 TCP 不同的是,网络流直接支持任意数据类型的传输,而无需先…...

让生产管理变简单
随着业务的发展,工厂每天要处理很多订单,还要统筹安排各部门工作以及协调上下游加工企业,生产管理问题也随之而来。 1.销售订单评审困难、无法及时抓取到历史数据做参考。由于数据的不及时性、不准确性无法为正常的生产和采购提供数据支撑。同…...
MySQL与SQLite的区别
MySQL 和 SQLite 是两种常见的关系型数据库管理系统,但它们在设计目标、架构和使用场景上有显著的区别。以下是它们的主要区别: 1. 架构与模式 MySQL: 客户端/服务器模式:MySQL 采用 C/S 架构,数据库服务器运行在一…...

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Event
CMSIS 2.0接口使用事件标志是实时操作系统(RTOS)中一种重要的同步机制。事件标志是一种轻量级的同步原语,用于任务间或中断服务程序(ISR)之间的通信。 每个事件标志对象可以包含多个标志位,通常最多为31个&…...

国防科技大学计算机基础课程笔记02信息编码
1.机内码和国标码 国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制,因此这个了16进制的数据既可以翻译成为这个机器码,也可以翻译成为这个国标码,所以这个时候很容易会出现这个歧义的情况; 因此,我们的这个国…...
【位运算】消失的两个数字(hard)
消失的两个数字(hard) 题⽬描述:解法(位运算):Java 算法代码:更简便代码 题⽬链接:⾯试题 17.19. 消失的两个数字 题⽬描述: 给定⼀个数组,包含从 1 到 N 所有…...

抖音增长新引擎:品融电商,一站式全案代运营领跑者
抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...

Keil 中设置 STM32 Flash 和 RAM 地址详解
文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面(Target 选项卡)1. IROM1(用于配置 Flash)2. IRAM1(用于配置 RAM)二、链接器设置界面(Linker 选项卡)1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数(如果没有勾选上面…...

HBuilderX安装(uni-app和小程序开发)
下载HBuilderX 访问官方网站:https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本: Windows版(推荐下载标准版) Windows系统安装步骤 运行安装程序: 双击下载的.exe安装文件 如果出现安全提示&…...
OpenLayers 分屏对比(地图联动)
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能,和卷帘图层不一样的是,分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

Linux --进程控制
本文从以下五个方面来初步认识进程控制: 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程,创建出来的进程就是子进程,原来的进程为父进程。…...

初学 pytest 记录
安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

Yolov8 目标检测蒸馏学习记录
yolov8系列模型蒸馏基本流程,代码下载:这里本人提交了一个demo:djdll/Yolov8_Distillation: Yolov8轻量化_蒸馏代码实现 在轻量化模型设计中,**知识蒸馏(Knowledge Distillation)**被广泛应用,作为提升模型…...