当前位置：首页 > news >正文

【AI视频】复刻抖音爆款AI数字人作品初体验

news 2026/2/11 1:10:26

在这里插入图片描述

博客主页： [小ᶻZ࿆] 本文专栏: AI视频 | AI数字人

文章目录

💯前言
💯抖音上的爆火AI数字人视频
💯注册HeyGen账号
💯复刻抖音爆款AI数字人
💯最终生成效果
💯小结

对比原视频效果：

左为原视频，右为本文生成

本文生成输入视频的完整效果：（注意：背景音乐是后期加上去的）

本文数字人视频完整生成结果

在这里插入图片描述

💯前言

随着人工智能技术的迅速发展，数字人不再是科幻电影中的虚构产物，而是逐渐走进了我们的日常生活。曾经只有大型企业和专业团队才能运用的这项技术，如今已经触手可及，大众也可以轻松使用。无论是内容创作者、企业宣传，还是个人娱乐，数字人都提供了一种全新的表达方式，让每个人都能够通过人工智能的力量，打造出独具特色的作品。
HeyGen

💯抖音上的爆火AI数字人视频

数字人在抖音上是一种非常新颖且有吸引力的表现形式。由于其独特的视觉效果和流畅的交互体验，AI数字人迅速成为了短视频平台上的热门趋势。不论是用于知识分享、品牌宣传，还是娱乐内容，这种技术都为创作者带来了前所未有的可能性。它不仅突破了传统真人视频的限制，还能够以高效、低成本的方式实现个性化的内容表达，吸引了大量用户的关注和互动。
本文将以这个点赞量12.6w的爆款数字人视频为例，手把手教你如何从零开始，初步体验AI数字人技术的入门步骤。这篇文章适合新手，内容简单易懂，不需要你具备太多技术背景。本文将带你了解如何选择基础的AI工具、简单地调整内容呈现方式，并进行基本的后期处理。通过这篇入门级教程，你将轻松掌握AI数字人制作的基础概念，开启你的数字创作之旅！

💯注册HeyGen账号

进入HeyGen官网点击Get started。
点击注册，如果有Google邮箱的话可以直接用Google
填写邮箱
登录邮箱拿到验证码填入
设置密码，长度必须为 8 到 35 个字符，包括大写、小写字母、数字和特殊字符。
注册成功后会跳转到HeyGen主界面，注意：一个账号一个月可以免费生成三次视频。

💯复刻抖音爆款AI数字人

在HeyGen主界面中，您可以轻松地开始您的视频制作。进入界面后，点击左侧菜单中的“Create video”按钮，即“创建视频”，如图所示。
在选择视频布局时，您可以根据需求选择横屏或竖屏模式。为了更好地展示数字人，我们建议选择竖屏模式。在创建视频的界面中，点击“Use portrait”按钮，即“使用肖像”选项
在这一步骤中，您需要选择一个合适的头像来作为视频中的数字人。进入头像选择界面后，点击“Studio Avatar”（工作室头像）选项
在选择头像的界面中，往下滚动页面，找到与爆款视频相同的数字人形象，如图中红框所示。

Looking for a wife? Must find a woman with a big temper. No temper is like a glass of water. Quench thirst, but tasteless. A woman with a temper is not the same. Her bark is worse than her bite. She is particularly kind. She worries about her family at home and her temper comes quickly and goes quickly. She's like a strong drink you can't forget. If you do, cherish it. Do you understand?

在这一步中，需要为您的数字人输入与目标视频相同的文案内容。点击左侧菜单中的“Script 脚本”选项，在文本框中输入视频中使用的文案内容，如上所示。
在这一步中，为了让数字人能够更好地传达视频内容，您可以选择合适的语音选项。点击“Script 脚本”界面中的语音选择区域，如图所示，可以从多个语音选项中进行挑选。不同的语音有着不同的语调、情感和节奏，选择一个与视频内容最契合的语音类型，可以让数字人的表现更加自然和有吸引力。

这里推荐用ctrl+G搜索Molly-Newscaster更方便快捷

在调整语音设置时，您可以根据需要修改数字人的语速，使其更符合视频的整体节奏和氛围。在“Script 脚本”界面中，点击语音设置旁边的选项按钮，进入“Voice settings 语音设置”菜单，如图所示。

差不多是设置1.5倍速

text模块可在视频里面加文本和标识。
为了确保数字人的画面与语音完美同步，您需要将时间轴上的数字人画面时长调整为与说话时间一致。
在完成所有设置并确认无误后，最后一步就是提交生成您的AI数字人视频。在编辑页面的右上角，点击“Submit 提交”按钮，如图所示。系统将开始处理您所设定的脚本、语音和画面，生成最终的视频。
在视频生成完成后，您可以在HeyGen平台的主界面中看到所有已生成的视频，下载到本地。

💯最终生成效果

本文生成的数字人视频最终效果：（注意：背景音乐是后期加上去的）

本文数字人视频完整生成结果

💯小结

虽然这篇文章仅是入门级别的教程，但它展示了数字人技术的无限潜力。我们可以看到，抖音上的爆款数字人视频不仅仅是娱乐内容的呈现，更是新媒体创作的一个缩影。这些技术使得创作者能够以更具创意和个性化的方式表达自我，同时也大大降低了制作门槛。
在创作过程中，我们意识到，无论是内容创作者还是企业推广，掌握AI数字人技术都是一个值得尝试的方向。它不仅能够提升内容的吸引力，还能为用户带来独特的体验。我希望这篇文章能为那些和我一样对数字人技术感兴趣的朋友提供帮助，让大家在数字创作的世界中找到属于自己的风格。
继续探索、不断尝试，我们都可以成为数字时代的创作者！希望你在阅读后也能感受到AI数字人带来的乐趣和可能性，期待看到更多精彩的数字人作品！

import tensorflow as tf;from tensorflow.keras import layers;import numpy as np;import matplotlib.pyplot as plt;np.random.seed(42);tf.random.set_seed(42);latent_dim=100;image_size=64;batch_size=64;epochs=10000;def build_generator():model=tf.keras.Sequential();model.add(layers.Dense(8*8*256,use_bias=False,input_shape=(latent_dim,)));model.add(layers.BatchNormalization());model.add(layers.LeakyReLU());model.add(layers.Reshape((8,8,256)));model.add(layers.Conv2DTranspose(128,(5,5),strides=(2,2),padding='same',use_bias=False));model.add(layers.BatchNormalization());model.add(layers.LeakyReLU());model.add(layers.Conv2DTranspose(64,(5,5),strides=(2,2),padding='same',use_bias=False));model.add(layers.BatchNormalization());model.add(layers.LeakyReLU());model.add(layers.Conv2DTranspose(3,(5,5),strides=(2,2),padding='same',use_bias=False,activation='tanh'));return model;def build_discriminator():model=tf.keras.Sequential();model.add(layers.Conv2D(64,(5,5),strides=(2,2),padding='same',input_shape=[image_size,image_size,3]));model.add(layers.LeakyReLU());model.add(layers.Dropout(0.3));model.add(layers.Conv2D(128,(5,5),strides=(2,2),padding='same'));model.add(layers.LeakyReLU());model.add(layers.Dropout(0.3));model.add(layers.Conv2D(256,(5,5),strides=(2,2),padding='same'));model.add(layers.LeakyReLU());model.add(layers.Dropout(0.3));model.add(layers.Flatten());model.add(layers.Dense(1));return model;def discriminator_loss(real_output,fake_output):real_loss=tf.keras.losses.BinaryCrossentropy(from_logits=True)(tf.ones_like(real_output),real_output);fake_loss=tf.keras.losses.BinaryCrossentropy(from_logits=True)(tf.zeros_like(fake_output),fake_output);return real_loss+fake_loss;def generator_loss(fake_output):return tf.keras.losses.BinaryCrossentropy(from_logits=True)(tf.ones_like(fake_output),fake_output);generator_optimizer=tf.keras.optimizers.Adam(1e-4);discriminator_optimizer=tf.keras.optimizers.Adam(1e-4);generator=build_generator();discriminator=build_discriminator();@tf.function;def train_step(images,generator,discriminator,batch_size,latent_dim):noise=tf.random.normal([batch_size,latent_dim]);with tf.GradientTape()as gen_tape,tf.GradientTape()as disc_tape:generated_images=generator(noise,training=True);real_output=discriminator(images,training=True);fake_output=discriminator(generated_images,training=True);gen_loss=generator_loss(fake_output);disc_loss=discriminator_loss(real_output,fake_output);gradients_of_generator=gen_tape.gradient(gen_loss,generator.trainable_variables);gradients_of_discriminator=disc_tape.gradient(disc_loss,discriminator.trainable_variables);generator_optimizer.apply_gradients(zip(gradients_of_generator,generator.trainable_variables));discriminator_optimizer.apply_gradients(zip(gradients_of_discriminator,discriminator.trainable_variables));return gen_loss,disc_loss;(train_images,train_labels),(_,_)=tf.keras.datasets.cifar10.load_data();train_images=train_images.reshape(train_images.shape[0],image_size,image_size,3).astype('float32');train_images=(train_images-127.5)/127.5;train_dataset=tf.data.Dataset.from_tensor_slices(train_images).shuffle(60000).batch(batch_size);def train(generator,discriminator,dataset,epochs,latent_dim,batch_size):for epoch in range(epochs):for image_batch in dataset:gen_loss,disc_loss=train_step(image_batch,generator,discriminator,batch_size,latent_dim);if epoch%100==0:print(f"Epoch {epoch}, Gen Loss: {gen_loss}, Disc Loss: {disc_loss}");generate_and_save_images(generator,epoch,latent_dim);def generate_and_save_images(model,epoch,latent_dim):noise=tf.random.normal([16,latent_dim]);generated_images=model(noise,training=False);fig=plt.figure(figsize=(4,4));for i in range(generated_images.shape[0]):plt.subplot(4,4,i+1);plt.imshow((generated_images[i]*127.5+127.5).astype(np.uint8));plt.axis('off');plt.savefig(f'generated_images_epoch_{epoch}.png');plt.show();train(generator,discriminator,train_dataset,epochs,latent_dim,batch_size)

在这里插入图片描述

【AI视频】复刻抖音爆款AI数字人作品初体验

博客主页： [小ᶻZ࿆] 本文专栏: AI视频 | AI数字人文章目录 💯前言💯抖音上的爆火AI数字人视频💯注册HeyGen账号💯复刻抖音爆款AI数字人💯最终生成效果💯小结对比原视频效果：…...

编程日记 2024/9/16 18:38:06

Mysql 面试题总结

1. Mysql 数据库，隔离级别有哪几个？ 在 MySQL 数据库中，事务的隔离级别决定了一个事务在执行期间对其他事务可见的数据变化情况。MySQL 支持 SQL 标准定义的四种隔离级别，从低到高依次为： 读未提交（READ U…...

编程日记 2024/9/16 18:37:05

stack - queue

1.容器适配器 (1) 什么是适配器？ 适配器是一种设计模式(设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结)，该种模式是将一个类的接口转换成客户希望的另外一个接口 (2) STL标准库中stack和queue的底层结构虽然stack和…...

编程日记 2024/9/16 18:34:02

微软九月补丁星期二发现了 79 个漏洞

微软将在2024 年 9 月补丁星期二修复 79 个漏洞。微软有证据表明，发布的四个漏洞被野外利用和/或公开披露；所有四个漏洞均已在CISA KEV上列出。微软还在修补四个关键的远程代码执行 (RCE) 漏洞。不同寻常的是，微软本月尚未修补任何浏览器…...

编程日记 2024/9/16 18:33:01

研1日记12

1. 改19->10 2. 学习数据不平衡问题 1. 欠采样合并两个样本数据两种方式 1. 按原分布比例划分。sklearn中train_test_split里，参数stratify含义解析_traintestsplit参数stratify-CSDN博客 3.刘二大人卷积操作待看论文： 刘老师指导&#xff1a…...

编程日记 2024/9/16 18:32:00

Rocky Linux 9安装mysqlclient库报错的解决方法

环境 VMware Rocky Linux 9.4 MySQL 8.0 安装mysqlclient报错 yum install python3-devel pip3 install mysqlclient报错： Downloading http://mirrors.aliyun.com/pypi/packages/37/fb/d9a8f763c84f1e789c027af0ffc7dbf94c9a38db961484f253f0552cbb47/mysqlcli…...

编程日记 2024/9/16 18:30:59

Spring Boot母婴商城：安全、便捷、高效

2 相关技术 2.1 SSM框架介绍本课题程序开发使用到的框架技术，英文名称缩写是SSM，在JavaWeb开发中使用的流行框架有SSH、SSM、SpringMVC等，作为一个课题程序采用SSH框架也可以，SSM框架也可以，SpringMVC也可以。SSH框架…...

编程日记 2024/9/16 18:29:58

php实现kafka

kafka类： <?phpclass b2c_kafka {public $broker_list;public $topic;public $group_id;protected $producer null;protected $consumer null;protected $receive_wait_time;protected $receive_wait_num;/*** 构造方法* param object app*/public function …...

编程日记 2024/9/16 18:28:56

YOLOv10改进系列，YOLOv10损失函数更换为Powerful-IoU（2024年最新IOU），助力高效涨点

改进前训练结果：改进后的结果：摘要边界框回归（BBR）是目标检测中的核心任务之一，BBR损失函数显著影响其性能。然而，观察到现有基于IoU的损失函数存在不合理的惩罚因子，导致回归过程中锚框扩展，并显著减缓收敛速度。为了解决这个问题，深入分析了锚框扩展的原因。针…...

编程日记 2024/9/16 18:25:54

工具知识 | Linux 常用命令参考手册

目录文件查看文件内容 headtailcatnlmore 创建 touchmkdirmktemp 删除 rmrmdir 查找文件 findlocate lspwdwcchattrpastestatgrepsedcdcpmvopensourcetreelnfilesortuniqsplitvim 系统管理 nohupwatchpingwhichshutdownrebootuptimecrontabatunameifconfigwhereischmodlsofc…...

编程日记 2024/9/16 18:19:48

mysql 常用知识点总结

MySQL 是一种广泛使用的关系型数据库管理系统（RDBMS），它基于结构化查询语言（SQL）。了解 MySQL 的语法对数据库管理和操作非常重要。以下是 MySQL 语法的详细完整解释，涵盖基本概念、创建表、查询、修改数据…...

编程日记 2024/9/16 18:17:46

conda常用指令

1、查看conda版本 conda --version 2、更新conda conda update conda 3、查看conda环境信息 conda info 4、查看已有虚拟环境 conda info --envs conda info -e conda env list 5、创建新虚拟环境 conda create --name myenv python3.8 6、激活环境和退出环境 conda…...

编程日记 2024/9/16 18:15:43

前后端分离项目--下载功能

文章目录不使用代理服务器blobblob构造函数通过FormData对象的getBlob方法创建Blob对象将Blob对象转换成UR 使用代理服务器前后端分离项目中下载与其他接口的使用不同，一般下载不走node，不通过代理服务器，而是直接在前台发送请求&#xff0…...

编程日记 2024/9/16 18:13:36

PMP--一模--解题--81-90

文章目录 4.整合管理81、 [单选] 一位先前不活跃的干系人参与程度突然增加，这种意外的参与导致了一些变更请求。项目经理应该做什么？ 4.整合管理82、 [单选] 公司的新产品系列将在两个月内发布，95%的项目任务均已完成。但是，管理层…...

编程日记 2024/9/16 18:12:35

计算机网络 --- 【2】计算机网络的组成、功能

目录一、计算机网络的组成 1.1 从组成部分看 1.2 从工作方式看 1.3 从逻辑功能看 1.4 总结二、计算机网络的功能 2.1 数据通信 2.2 资源共享编辑 2.3 分布式处理 2.4 提高可靠性 2.5 负载均衡一、计算机网络的组成 1.1 从组成部分看我们举例分析计算机网络从…...

编程日记 2024/9/16 18:10:32

『功能项目』切换职业技能面板【49】

我们打开上一篇48切换职业面板的项目， 本章要做的事情是制作第二职业法师技能面板、第三职业面板并且完成切换双击打开Canvas进入预制体空间复制三个技能栏面板重命名设置第一技能栏设置第二职业技能栏设置第三职业技能栏修改脚本：ChangeProfess…...

编程日记 2024/9/16 18:09:31

寻找排名好的自闭症学校？这些关键因素不可忽视

郑州市如果有一家如星贝育园这样的自闭症公办学校，那无疑将为当地的自闭症儿童及其家庭带来巨大的福音。星贝育园所展现出的专业性、承诺的康复效果保障、以及为特殊儿童提供的全方位支持，都体现了其对自闭症儿童教育康复事业的深刻理解和高度责任感。 …...

编程日记 2024/9/16 18:08:29

Git常用命令（记录）

提交代码 git status 查看状态git add .或者git add xx选择提交全部或者某文件git commit -m “提交信息”git push 创建新分支提交到新的分支 git checkout -b [branch-name] 创建并切换到新分支git add [file-name] 将要上传的文件添加到暂存区git commit -m “commit mes…...

编程日记 2024/9/16 18:07:28

STM32+ESP8266 WiFi连接机智云平台APP远程控制教程

本文档将介绍如何用STM32ESP8266 WiFi模块从零开始连接上机智云，并通过APP进行远程控制。机智云官网：机智云|智能物联网操作系统 (gizwits.com) 准备：STM32、ESP8266、手机、可上网的WiFi。 1.创建设备 1.1 注册登陆请自行注册账号并登陆…...

编程日记 2024/9/16 18:02:23

学懂C++（六十）：C++ 11、C++ 14、C++ 17、C++ 20新特性大总结（万字详解大全）

一、引言随着计算机科学与技术的飞速发展，编程语言也在不断进化以满足日益增长的需求。C是一门集高性能和灵活性于一身的编程语言，自1983年诞生以来不断演进，逐渐成为了众多领域的主流编程语言。为了进一步提升开发效率和代码质量&#xff0…...

编程日记 2024/9/16 17:58:16

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

大话软工笔记—需求分析概述

需求分析，就是要对需求调研收集到的资料信息逐个地进行拆分、研究，从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。需求分析的作用非常重要，后续设计的依据主要来自于需求分析的成果，包括: 项目的目的…...

编程新知 2026/1/28 10:58:50

智慧工地云平台源码，基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统，智慧工地全套源码，java版智慧工地源码，支持PC端、大屏端、移动端。智慧工地聚焦建筑行业的市场需求，提供“平台网络终端”的整体解决方案，提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

编程新知 2026/1/30 15:16:32

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/11/4 6:26:59

QMC5883L的驱动

简介本篇文章的代码已经上传到了github上面，开源代码作为一个电子罗盘模块，我们可以通过I2C从中获取偏航角yaw，相对于六轴陀螺仪的yaw，qmc5883l几乎不会零飘并且成本较低。参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

编程新知 2026/1/2 4:05:05

IGP（Interior Gateway Protocol，内部网关协议）

IGP（Interior Gateway Protocol，内部网关协议） 是一种用于在一个自治系统（AS）内部传递路由信息的路由协议，主要用于在一个组织或机构的内部网络中决定数据包的最佳路径。与用于自治系统之间通信的 EGP&…...

编程新知 2025/10/12 11:54:26

定时器任务——若依源码分析

分析util包下面的工具类schedule utils： ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类，封装了定时任务的创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz，先构建任务的 JobD…...

编程新知 2026/1/26 14:24:46