视频文字转语音经验笔记
自媒体视频制作的一些小经验,分享给大家。
一、音频部分:
1、文字转语音阐述:
微软语音识别 云希-青年男, 0.5-0.8变速 。注:云泽-中年男(不支持长音频录制), 适合郑重场合,关键知识点阐述。
测试工具:
a、小蜗软件,测试效果也可以,综合了各种文字字幕转换工具。ui比较专业,用的微软tts内核。
b、edge-tts-record0.1.1 (测试后推荐)。 也可自己录制后转音色的方式。30分钟录制限制。注:保存音频路径必须为英文或拼音。
c、关于佛教多音字发音校对的问题,微软ai对于专有中文名词发音有勿,需要用相应的其他词替代。
官方没提供快速字幕文字查找定位时间线功能。需要手动到处srt字幕,之后,在外部文本工具里,查看剪映相应的时间定位点。
不同的字数,会影响多音字发音ai判断。一乘了义 不带标点,仅四个字 了 发liao,多字带标点速以上,发le。
比如: 使用tts-vue1.9.15 软件ssml 标记语法输入词语拼音,并局部音频剪辑替换。
【阿弥陀佛】阿发错误音e,需要转为 【阿`弥陀佛】发a。
【一乘了义】错误了音le,一乘了义 不带标点,仅四个字 了 发liao,多字带标点速以上,发le。
【十行】错误音 hang 需要改为 【十`行】 xing
【诸佛刹土】错误音 sha 需要改为【诸`佛刹土】 cha
【迦叶】ye需要转为 【迦舍】发she
【舍利弗】fu改为【舍利佛】fo
d、录音期间,电脑要关闭下载等其他会发生的程序,以免夹杂。比如:网盘程序等。
2、配乐音效素材:
剪映官方,不多说,技术已经普及。
3、音色转换:
预方案:RMAIVoiceChanger(原入梦RVC软件)。暂时没使用。
选择了微软云希,简单快捷,语速设为0.8所有,平稳清晰。
二、图像部分:
1、图片素材来源:
baidu图片搜索,fooocus AI 图片生成修改。为了提升出图速度,建议关闭其他程序,仅运行ai程序。能保证在笔记本2070s显卡下稳定运算。
A、ai生成群体人物脸部扭曲错误,可以用ai换脸工具roop rope AI人脸替换离线版3.0完成批量替换。
测试工具:photoshop修图。
b、手部修复,不必用controlnet,可以在ps中简单重绘修补手部,外形,只后用ai重绘局部或全图。
c、图片缩放,fooocus 1.5倍放大,nv2070s显存能承担。2k左右。2倍放大卡死,估计显存不足。
2、音频转字幕生成:
剪映内置,ai语音转字幕。 每次转换限制字数5000内。支持文字参考输入。
a、超长分钟以上音频,需要先将语音音频剪裁为多段,每段与输入文本对应的内容,如果文字与音频内容不对应,整体长度不一致,会出现字幕生成错位问题。
b、每次转字幕时,必须把每段音频拖到新轨道,并点选音频轨道后。锁定并静音其他轨道,一次次生成。最终合并一起。
c、最后,每转一段,最好把音轨与字幕合成一个剪辑组,便于拖动组合。最后都合并为一轨道里,最后,可以取消各分段的剪辑组。恢复字幕和音频独立状态,再合并为一个大剪辑组。便于管理分割。
d、如果音频与视频分离的,可以合为同步视频,最红合为一个大的剪辑组,便于之后剪辑。
e、视频转化低编码,可以用file converter (右键快速菜单)工具。高效环保。
3、剪映剪辑技巧:
a、同轨道两片段拖动对齐时,后一个对不上前一个,差一点就自动建到新轨去了。经实验,发现,将当前游标,移到前片段尾部自动吸附后,再拖动后片段到前片段尾部就对齐了。
b、剪映没有阴影特效。只能通过假阴影模拟,一种是默认官方黑片+方形蒙版(边缘模糊)
另一种是ps 手动做个png透明阴影图片,导入。
c、复合片段,有变速标签项,可以后期整体变速,但音频部分要适当做音频变速补偿,否则会失真。
d、封面的导出,任何视频、音频、字幕导出,都会自动包含封面,可仅选择字幕导出即可输出封面,加快输出速度。
e、修改内容后,剪映预览无法更新问题。可以关闭自动渲染功能,并删除预渲染视频文件,即可完成视频的更新显示。在全局设置中,第三个标签项下,可以找到预渲染视频文件夹设置,和自动渲染选项,关闭自动渲染,固态硬盘无需预渲染,流畅度不影响。
4、其他经验:
b站视频回复时,如何添加快捷时间标记到回复里,作为内容预览大纲:
直接输入时间码 52:00 格式 空格+内容文字 即可。
南无阿弥陀佛
相关文章:
视频文字转语音经验笔记
自媒体视频制作的一些小经验,分享给大家。 一、音频部分: 1、文字转语音阐述: 微软语音识别 云希-青年男, 0.5-0.8变速 。注:云泽-中年男(不支持长音频录制), 适合郑重场合&#…...
视频融合共享平台LntonCVS统一视频接入平台智慧安防应用方案
安防视频监控平台LntonCVS是一款拥有强大拓展性和灵活部署能力的综合管理平台。它支持多种主流标准协议,包括国标GB28181、RTSP/Onvif、RTMP等,同时兼容各厂家的私有协议和SDK,如海康Ehome、海大宇等。LntonCVS不仅具备传统安防视频监控功能&…...
使用Python绘制动态螺旋线:旋转动画效果
文章目录 引言准备工作前置条件 代码实现与解析导入必要的库初始化Pygame绘制螺旋线函数主循环 完整代码 引言 螺旋线是一个具有美学和数学魅力的图形。通过编程,我们可以轻松创建动态旋转的螺旋线动画。在这篇博客中,我们将使用Python和Pygame库来实现…...
Symfony实战手册:PHP框架的高级应用技巧
引言 Symfony是一个功能强大且广泛应用于PHP应用程序开发的框架,它提供了许多高级特性和工具,可以帮助开发人员更高效地构建和管理复杂的Web应用程序。以下是Symfony框架的几个关键方面及其高级应用技巧: 1. 路由和控制器 Symfony的路由组…...
TOGAF培训什么内容?参加TOGAF培训有什么好处?考试通过率多少?
TOGAF培训什么内容?参加TOGAF培训有什么好处?考试通过率多少? TOGAF培训哪些内容? 通过本课程,你将掌握TOGAF的理论和实践,理解企业架构的影响,能够评估、启动、设 计、执行新一轮企业和IT架构…...
keepalived HA nginx方案
安装 centos: yum -y install epel-release yum -y install nginx keepalivedkeepalived配置解析 /etc/keepalived/keepalived.conf ! Configuration File for keepalived # 全局变量 global_defs {router_id nginx_ha # 主从保持一致script_user root # 执行健康检查的…...
报错:pathspec ‘xxx‘ did not match any file(s) known to git
在 escode 中进行分支切换时报如下错误 PS > git checkout xxx error: pathspec xxx did not match any file(s) known to git远程分支已经在 gitlab 客户端手动创建,在 escode 中也使用了拉取之类的操作,但是切换分支时依然报错。 解决方案 查看分…...
sed 保持空间命令之 x 的执行逻辑
目录 1. 将模式空间和保持空间的内容互换并打印 2. 将保持空间的内容交换回模式空间 3. 使用保持空间保存状态信息 4. 交换模式空间与保持空间隔行匹配 sed 有两个内置的缓存空间: 模式空间:该空间是 sed 内置的一个缓冲区,是 sed 执行的…...
按位异或^
在 Python 中,a ^ b 表示按位异或运算符。按位异或运算符对整数的每一位进行运算,如果对应位上的两个二进制数字不同,则结果为 1,否则为 0。 示例 a 5 # 二进制: 0101 b 3 # 二进制: 0011result a ^ b print(result) # 输…...
《企业实战分享 · 常用运维中间件》
📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 近期刚转战 CSDN,会严格把控文章质量,绝不滥竽充数,如需交流ÿ…...
PyCharm 2024.1简介
PyCharm 2024.1 是JetBrains公司发布的Python集成开发环境(IDE)的最新版本。作为一个深受开发者欢迎的工具,PyCharm以其强大的功能和高效的开发体验著称。以下是PyCharm 2024.1的主要特性和改进: 1. **性能提升**: …...
终身免费的Navicat数据库,不需要破解,官方支持
终身免费的Navicat数据库,不需要破解,官方支持 卸载了Navicat,很不爽上干货,Navicat免费版下载地址 卸载了Navicat,很不爽 公司不让用那些破解的数据库软件,之前一直使用Navicat。换了几款其他的数据库试了…...
Spring Boot中的模板引擎选择与配置
Spring Boot中的模板引擎选择与配置 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们来聊聊Spring Boot中的模板引擎选择与配置。模板引擎是生成动态网页…...
4、音视频封装格式---FLV
FLV FLV是一种容器封装格式,是由Adobe公司发布和维护的,用于将视频编码流与音频编码流进行封装。对于任意一种封装格式,都有其头部区域与数据区域,在FLV中,称之为FLV Header与Body。 对于FLV Header,一个FL…...
vscode 前行复制到下一行
目录 Ctrl d 会把当前行复制到下一行 步骤1:打开键绑定设置 目录 Ctrl d 会把当前行复制到下一行 步骤1:打开键绑定设置 使用VS Code设置换行 Ctrl d 会把当前行复制到下一行 步骤1:打开键绑定设置 打开 VS Code。按 CtrlShiftP 打开命…...
什么是文档透明加密|好用的文档透明加密软件有哪些?
在当今日益数字化和信息化的时代,数据安全问题愈发受到企业和个人的关注。文档作为信息的重要载体,其安全性不言而喻。为了保障文档的机密性和完整性,文档透明加密技术应运而生。本文将对文档透明加密进行详细介绍,并探讨一些好用…...
XTDrone-固定翼无人机编队跟踪无人车-配置教程
配置使用ROS版本为Neotic 1 配置 1.1 加载固定翼无人机编队跟踪控制工程文件 cp -r ~/XTDrone/coordination/fixed_wing_formation_control ~/catkin_ws/src 1.2 加载一些用到的功能包 sudo apt-get install ros-noetic-serial #根据自己的ROS版本修改 sudo apt-get insta…...
实现高性能、可扩展的实时数据采集系统:go-zero的应用与实践
随着互联网技术的高速发展,数据采集也越来越受到重视,成为企业获取商业价值的重要手段。在实际应用中,我们往往面临着数据量大、并发高、系统响应速度要求高、压力测试等挑战。如何实现高性能、可扩展的实时数据采集系统?本文将介…...
AUTOSAR NvM模块(五)
NvMRbCallbackSignatureAR45 改变回调函数的参数类型。 TRUE:根据AR44及之后版本,回调函数使用NvM_<Multi;Init>BlockRequestType参数类型。详细的函数调用参数请参考回调参数。 FALSE:根据AR43及之前版本,回调函数使用S…...
输出feign调用详细日志
开发新增一个feign调用类,调用另一个微服务的接口,总是报调用失败,想输出下调用的详细日志看看怎么回事。 第一步:查看feign的输出级别。 这个在qlm_config包里: /*** feign 日志记录级别* NONE:无日志记录…...
C++_核心编程_多态案例二-制作饮品
#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为:煮水 - 冲泡 - 倒入杯中 - 加入辅料 利用多态技术实现本案例,提供抽象制作饮品基类,提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...
SkyWalking 10.2.0 SWCK 配置过程
SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外,K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案,全安装在K8S群集中。 具体可参…...
智能在线客服平台:数字化时代企业连接用户的 AI 中枢
随着互联网技术的飞速发展,消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁,不仅优化了客户体验,还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用,并…...
Java多线程实现之Callable接口深度解析
Java多线程实现之Callable接口深度解析 一、Callable接口概述1.1 接口定义1.2 与Runnable接口的对比1.3 Future接口与FutureTask类 二、Callable接口的基本使用方法2.1 传统方式实现Callable接口2.2 使用Lambda表达式简化Callable实现2.3 使用FutureTask类执行Callable任务 三、…...
Neo4j 集群管理:原理、技术与最佳实践深度解析
Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档,本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石,用于构建高可用、可扩展且一致的图数据库服务…...
基于Docker Compose部署Java微服务项目
一. 创建根项目 根项目(父项目)主要用于依赖管理 一些需要注意的点: 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件,否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...
leetcodeSQL解题:3564. 季节性销售分析
leetcodeSQL解题:3564. 季节性销售分析 题目: 表:sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...
数据库分批入库
今天在工作中,遇到一个问题,就是分批查询的时候,由于批次过大导致出现了一些问题,一下是问题描述和解决方案: 示例: // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...
如何理解 IP 数据报中的 TTL?
目录 前言理解 前言 面试灵魂一问:说说对 IP 数据报中 TTL 的理解?我们都知道,IP 数据报由首部和数据两部分组成,首部又分为两部分:固定部分和可变部分,共占 20 字节,而即将讨论的 TTL 就位于首…...
力扣-35.搜索插入位置
题目描述 给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...
