【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe
【项目背景】
小编一直在尝试着短视频技术,在读文案的时候经常会读错;所以,只能用微软或者剪映的文本转语音软件。
很早之前在Github上也看到过真人人声训练的开源代码,尝试过一番之后,也是以失败告终;就在前几个月歌手语音的训练、个人真人声音的训练又火了一波,新的开源代码小编手上也有,但是无奈自己的N卡太弱,跑pytorch心有余而力不足。
这不,随着国内擅长声音处理的讯飞大模型融合了真人声音训练,小编借此机会对其做了一个小小的封装。可以导出下载自己的声音。
【项目实现】

https://xinghuo.xfyun.cn/desk
首先,需要用讯飞的大模型训练自己的声音,右上角点击创建发音人,这个时候需要录制10段个人语音,云端训练大概需要5~10分钟,训练好之后的界面同上图,可以选择发音人(真人人声)。
然后,就可以将自己的文本投喂给大模型,可以是问题,也可以是自己已经写好的文本,具体例子:
用户:请润色下面文本,并拟定1个吸睛的标题。
文本:
土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。坏处大家都应该知道,环境相对别的专业较差,有时候面对的班组劳务的教育水平不是很高,人际关系不好后期发展受限等。
星火大模型回答的文本,就出出现一个语音按钮,点击该按钮就可以听到你的真人发音。但是,该大模型已经禁止浏览使用开发模式,生成的TTS音频无法通过插件工具实现音频导出。
解决方案:通过声卡复制类软件,实现在朗读语音时,对声卡数据进行复制,进而实现音频导出。
请重新输出以下文本:土木工程现在房地产大环境下不是太热门,其实大学的专业作为对于每个人来讲(个人观点),本身就是将来对于自己的一个谋生的手段,这个专业大家最多的印象最多的就是提桶跑路吧,但是每个专业都有每个专业的好处与坏处,这个专业门槛低,就业前期工作收入比较高,就业方向比较多,造价,施工、设计,监理等,适合善于交际的人。

作为一个准程序员,这种方案可以解决问题,但总是差强人意。
于是,在想,能不能通过fiddler分析转换接口,形成API或者封装成一个工具?说干就干,刚好西安周末下雨,宅在家里,对其进行分析,最终封装成一个exe。

使用该工具,需要下载fiddler,获取ID和cookies。

上图,点击①链接,在②处复制header即可获取到cookie,在③处可以获取到ID(tts)。
接下来就可以用剪映工具制作视频(真人原声),从此告别千篇一律的机器声。
【工具下载】
https://intumu.com/article/202
【应用拓展】
真人人声+MD数字人?可以衍生出很多Ideas,感兴趣的小伙伴也可以加小编微信探讨。
学Python并不难,会敲键盘就能学!
【扩展操作】
第1步,借助天工AI搜索(tiangong.cn),直接手机短信验证就可以使用,该大模型已经接入互联网,注意提问方式。细心的筒子已经发现,该回答可能已经包含了逼乎的优质答案。举个例子:
设计院作为一种专业设计机构,在技术发展和社会变革的进程中,AI的出现无疑对其职能和工作方式产生了一定的影响。从不同的角度来看,可以得出以下结论:
-
辅助设计工具角度:AI在设计过程中可以作为一种辅助工具,提供更高效、精确的设计方案,例如自动生成设计草图、优化设计布局、预测设计风格趋势等。这使得设计师能够更加专注于创造性的思考和决策,提高整体设计效率和质量。2
-
可替代性角度:虽然AI在某些设计领域已经取得了一定的成就,但目前AI在感知、理解和创造性思维等方面仍存在局限性,难以完全替代设计师。设计师的专业知识、审美能力、情感共鸣等人类特质仍然是无法被AI所取代的重要优势。23
-
创新驱动角度:设计院作为创新的源头和推动者,需要不断引领和适应时代的发展潮流。AI作为一种前沿技术,可以为设计院注入新的思维和工具,推动设计过程中的技术创新和设计方法的更新。同时,设计院也需要拥抱AI,不断学习和掌握AI技术,以更好地应对未来的设计需求和挑战。2
-
可能的协作模式角度:AI和人类设计师可以形成一种合作共生的模式,人类设计师依托AI技术进行设计创造,而AI作为设计创意的辅助和扩展,提供更多样的设计选项和创意启发。这种协作模式可以将人机优势进行有机结合,创造出更具创新性和人性化的设计成果。2
-
市场需求角度:随着AI技术的不断发展和应用,一些低端和重复性的设计任务可能会逐渐被AI所取代,设计师需要转向更加高级和创造性的设计方向。同时,人们对于个性化、定制化设计的需求也在不断增加,这为设计师提供了更多的发展空间和机会。4
-
知识产权保护角度:在AI的设计过程中,对于涉及专利、版权等知识产权的问题,需要加强相关的法律和制度保护,以确保设计活动的公平性和正当性。AI与设计师之间应遵守知识产权的法律法规,保护设计成果的合法权益。2
-
教育培训角度:随着AI的发展应用,设计院需要不断更新教育培训内容和方法,加强对设计师的技术和人文素养的培养,使其具备与AI技术协作的能力和思维方式。同时,设计院也需要与高校、科研机构等合作,推动相关学科的交叉融合,培养具备跨学科综合素养的设计人才。3
-
社会认知角度:设计院的发展与社会对于AI的认知和接受程度密切相关。加强对于人工智能技术的普及和宣传,提高公众对AI的理解与信任,有助于推动设计院与AI的良好合作与发展。2
-
倫理責任角度:面对AI技术在设计领域的广泛应用,设计师和设计院应当重视伦理责任的问题,确保设计过程中的公正、公平和人类价值的尊重。避免AI技术的滥用和伦理风险,提倡科技与人文的有机结合,实现设计的社会效益最大化。23
-
发展前景角度:综上所述,AI对设计院的影响是不可忽视的,但目前并不存在AI能够完全取代设计院的可能。设计院在与AI技术的结合中应以智能化、创新化为方向,不断适应时代的发展,提高设计效率和质量,为社会经济建设提供更加优秀的设计方案。23
综合以上观点可以得出结论:设计院将与AI形成合作共生关系,利用AI技术提升设计效率和质量;设计师的专业知识、审美能力和创造性思维仍然是无法被AI所替代的重要优势;设计院需要适应和引领AI技术的发展趋势,重视伦理责任,推动设计创新和社会效益的最大化。
第2步,借助讯飞星火大模型的真人人声训练,可以避免千篇一律的机器人声音,这个时候需要借助工具,将你自己的声音导出。
第3步,借助必剪工具,图文成片,必剪可以根据文案生成对应的素材,字幕,背景音乐等。这个时候,我们需要删除字幕、背景音乐,只保留视频素材。
第4步,加载第2步生成的真人人声,再借助必剪工具的智能字幕根据真人人身匹配文案,这个时候可能出现原有视频素材长度大于真人人声,直接剪掉多余部分即可。最后,换上自己喜欢的背景音乐,加上封面,Over,发布在各大视频平台,慢慢积攒用户。
相关文章:
【真人语音】讯飞星火个人声音训练及导出下载工具V0.2.exe
【项目背景】 小编一直在尝试着短视频技术,在读文案的时候经常会读错;所以,只能用微软或者剪映的文本转语音软件。 很早之前在Github上也看到过真人人声训练的开源代码,尝试过一番之后,也是以失败告终;就…...
正中优配:创业板指大涨3.47%!减速器等概念板块掀涨停潮!
周二(8月29日),三大股指团体涨超1%。截至上午收盘,上证指数涨1.39%,报3141.82点;深证成指和创业板指别离涨2.41%和3.47%;沪深两市算计成交额6264.51亿元,总体来看,两市个股涨多跌少&…...
多功能租车平台微信小程序源码 汽车租赁平台源码 摩托车租车平台源码 汽车租赁小程序源码
多功能租车平台微信小程序源码是一款用于汽车租赁的平台程序源码。它提供了丰富的功能,可以用于租赁各种类型的车辆,包括汽车和摩托车。 这个小程序源码可以帮助用户方便地租赁车辆。用户可以通过小程序浏览车辆列表,查看车辆的详细信息&…...
spring事件和线程池区别
Spring事件(Spring Event)和线程池(Thread Pool)是两个不同的概念。 Spring事件是Spring框架中的一种机制,用于在应用程序中实现发布-订阅模式。通过定义事件和监听器,可以在特定事件发生时,通…...
深圳寄墨西哥专线国际物流详解
随着全球贸易的不断发展,国际物流服务的需求也越来越大。深圳这座中国的特区城市,不仅是全球电子产品供应链的重要节点,也是国际物流服务的中心之一。对于那些需要将物品从深圳邮寄到墨西哥的人来说,深圳邮寄到墨西哥专线的国际物…...
PHP教学资源管理系统Dreamweaver开发mysql数据库web结构php编程计算机网页
一、源码特点 PHP 教学资源管理系统是一套完善的web设计系统,对理解php编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。 源码 https://download.csdn.net/download/qq_41221322/88260480 论文 https://downl…...
机器学习---决策树算法(CLS、ID3、CART)
1. 决策树 决策树(Decision Tree)又称为判定树,是运用于分类的一种树结构。其中的每个内部结点 (internal node)代表对某个属性的一次测试,每条边代表一个测试结果,叶结点(leaf&am…...
【算法与数据结构】404、LeetCode左叶子之和
文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:思路比较简单,遍历所有节点然后判断该节点是否为左叶子节点,如果是,…...
Apifox下载安装步骤
我们先访问网址 https://apifox.com/?utm_sourcebaidu&utm_mediumsem&utm_campaign251430236&utm_content7810722111&utm_termapifox%E6%9F%A5%E7%9C%8B%E7%89%88%E6%9C%AC&bd_vid8323327349775096324 然后 这里这个免费下载已经写的这么明显了 那就直接点…...
大华摄像头有问题,海康摄像头也有问题
买了个大华摄像头,除了抗噪方面效果不好,我是很满意的。前一段时间摄像头启动出了点问题(忘记拔掉SD卡),于是买了个海康的。 大华摄像头是3寸,海康是2寸。视频效果差多了。看来大有大的道理。更可恨的是&a…...
Linux多线程同步机制(下)
文章目录 前言一、读写锁二、条件变量总结 前言 一、读写锁 多线程同步机制中的读写锁(Read-Write Lock)是一种特殊的锁机制,用于控制对共享资源的读写访问。读写锁允许多个线程同时读取共享资源,但在写操作时需要独占访问。 读…...
【QT】ComboBox的使用(14)
ComboBox这个控件我常用于多文本的储存、调用,正如他的中文意思为:下拉列表框。 下拉列表框:字面意思就是一个多文本的列表框,今天来看下如何使用ComboBox这个控件。 一.环境配置 1.python 3.7.8 可直接进入官网下载安装&…...
关于写英文论文的一些总结
名词连接名词组成名词,例如任务名,用task name,而不是name of task。其他各种词也是类似的;本文提出了什么什么,用 this study;多用it is become xx,这种更好,而不是we xx࿱…...
swagger 2.10.5 整合 spring boot
参考: http://springfox.github.io/springfox/ https://github.com/springfox/springfox http://springfox.github.io/springfox/docs/current/ https://github.com/springfox/springfox-demos https://github.com/springfox/springfox-demos/tree/2.9.2 https://gi…...
Python 练习:剔除数字
练习:剔除数字: 要求如下: 1、编写一段程序代码,程序运行后, 需要用户随意输入一段包含有数字和字母的字符串; 2、程序会自动删除字符串中的数字, 然后输出一串没有数字的字符串(纯…...
Linux系统编程:基础知识入门学习笔记汇总
Linux基础shell编程——>Linux 系统编程——>(计算机网络)——>Linux 网络编程 来源:黑马程序员-Linux系统编程 45小时 评价 这个老师好像讲了很多课程,都还不错我由于赶时间之前学过Linux的Shell编程和Linux的网络编程&…...
基于硬件隔离增强risc-v调试安全1_问题描述
安全之安全(security)博客目录导读 2023 RISC-V中国峰会 安全相关议题汇总 说明:本文参考RISC-V 2023中国峰会如下议题,版权归原作者所有。...
OpenCV简介
OpenCV简介 OpenCV(开源计算机视觉库:http://opencv.org)是一个开源库,包含数百种计算机视觉算法。OpenCV 具有模块化结构,主要包括下列模块: 核心功能(core) - 定义基本数据结构的…...
Windows下编译qt-src-5.15.10
首先从镜像站点下载qt源码: https://download.qt.io/static/mirrorlist/ 下载QT的镜像站点 下载源码后解压到 F: 盘 创建编译目录F:\qtbuild 打开VS2019的 X64 Native Tools Command Prompt for VS 2019 进入到源码目录 cd F:\qt-everywher…...
有关linux排查服务器资源问题
查看 磁盘占用 df -h 进入到某一个文件夹下 查看对应文件夹占用 du -sh /usr...
【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...
【WiFi帧结构】
文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成:MAC头部frame bodyFCS,其中MAC是固定格式的,frame body是可变长度。 MAC头部有frame control,duration,address1,address2,addre…...
深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法
深入浅出:JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中,随机数的生成看似简单,却隐藏着许多玄机。无论是生成密码、加密密钥,还是创建安全令牌,随机数的质量直接关系到系统的安全性。Jav…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...
c++ 面试题(1)-----深度优先搜索(DFS)实现
操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...
【论文笔记】若干矿井粉尘检测算法概述
总的来说,传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度,通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...
ETLCloud可能遇到的问题有哪些?常见坑位解析
数据集成平台ETLCloud,主要用于支持数据的抽取(Extract)、转换(Transform)和加载(Load)过程。提供了一个简洁直观的界面,以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...
【Web 进阶篇】优雅的接口设计:统一响应、全局异常处理与参数校验
系列回顾: 在上一篇中,我们成功地为应用集成了数据库,并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了!但是,如果你仔细审视那些 API,会发现它们还很“粗糙”:有…...
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken:OpenAI开发的专业"分词器" torch:Facebook开发的强力计算引擎,相当于超级计算器 理解词嵌入:给词语画"…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...
