当前位置: 首页 > news >正文

文字语音相互转换

目录

1.介绍

2.思路

3.安装python包

3.程序:

4.运行结果


1.介绍

当我们使用一些本地部署的语言模型的时候,往往只能进行文字对话,这一片博客教大家如何实现语音转文字和文字转语音,之后接入ollama的模型就能进行语音对话了。

2.思路

使用离线本地语音:pyttsx3实现文字转语言,然后使用whisper实现语音转文字

3.安装python包

pip install pyttsx3pip install whisper
  • 文字转语音 (TTS)
    • 使用 pyttsx3 将输入文本转换为音频文件 output.wav
    • pyttsx3 生成的语音文件是本地生成的,不依赖于网络。
  • 语音转文字 (STT)
    • 使用 Whisper 模型将 output.wav 文件中的语音转录为文字。
    • Whisper 通过 PyTorch 在本地运行,不需要外部网络访问。

3.程序:

import pyttsx3
import whisper
import os# 文字转语音(TTS)部分
def text_to_speech(text, output_file="语音文字相互转换/output.wav"):# 初始化 pyttsx3 引擎engine = pyttsx3.init()# 设置语速和音量engine.setProperty('rate', 150)    # 语速engine.setProperty('volume', 1.0)  # 音量# 将文本保存为音频文件engine.save_to_file(text, output_file)# 运行并生成语音文件engine.runAndWait()print(f"Text-to-Speech conversion complete! Audio saved as '{output_file}'.")# 语音转文字(STT)部分
def speech_to_text(input_file):# 加载 Whisper 模型model = whisper.load_model("base")# 转录音频文件result = model.transcribe(input_file)# 打印转录的文本print("Transcribed Text:", result["text"])# 主函数
if __name__ == "__main__":# 1. 输入文本text = "hello,today is a good day!"# 2. 文字转语音text_to_speech(text, output_file="语音文字相互转换/output.wav")# 3. 语音转文字speech_to_text("语音文字相互转换/output.wav")

4.运行结果

相关文章:

文字语音相互转换

目录 1.介绍 2.思路 3.安装python包 3.程序: 4.运行结果 1.介绍 当我们使用一些本地部署的语言模型的时候,往往只能进行文字对话,这一片博客教大家如何实现语音转文字和文字转语音,之后接入ollama的模型就能进行语音对话了。…...

DeepSeek-R1:通过强化学习激发大语言模型的推理能力

注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】 文章目录 DeepSeek大模型技术系列三DeepSeek大模型技术系列三》DeepSeek-…...

MATLAB中fft函数用法

目录 语法 说明 示例 含噪信号 高斯脉冲 余弦波 正弦波的相位 FFT 的插值 fft函数的功能是对数据进行快速傅里叶变换。 语法 Y fft(X) Y fft(X,n) Y fft(X,n,dim) 说明 ​Y fft(X) 用快速傅里叶变换 (FFT) 算法计算 X 的离散傅里叶变换 (DFT)。 如果 X 是向量&…...

【SpringBoot】【JWT】使用JWT的claims()方法存入Integer类型数据自动转为Double类型

生成令牌时使用Map存入Integer类型数据,将map使用claims方法放入JWT令牌后,取出时变成Double类型,强转报错: 解决: 将Integer转为String后存入JWT令牌,不会被自动转为其他类型,取出后转为Integ…...

Crack SmartGit

感谢大佬提供的资源 一、正常安装SmartGit 二、下载crackSmartGit crackSmartGit 发行版 - Gitee.com 三、使用crackSmartGit 1. 打开用户目录:C:\Users%用户名%\AppData\Roaming\syntevo\SmartGit。将crackSmartGit.jar和license.zip拷贝至 用户目录。 2. 用户…...

【备赛】在keil5里面创建新文件的方法+添加lcd驱动

一、先创建出文件夹和相应的.c和.h文件 因为在软件里面创建出的是在MDk文件那里面的,实际上是不存在你的新文件夹里的。 二、在keil5软件里面操作 1)添加文件夹 -*---------------------------------------------------------- 这里最好加上相对路径&…...

Rk3568驱动开发_驱动实现流程以及本质_3

1设备号: cat /proc/devices 编写驱动模块需要要想加载到内核并与设备正常通信,那就需要申请一个设备号,用cat /proc/devices可以查看已经被占用的设备号 设备号有什么用?不同设备其驱动实现不同用设备号去区分,例如字…...

【学习笔记】LLM+RL

文章目录 1 合成数据与模型坍缩(model collapse),1.1 递归生成数据与模型坍缩1.2 三种错误1.3 理论直觉1.4 PPL指标 2 基于开源 LLM 实现 O1-like step by step 慢思考(slow thinking),ollama,streamlit2.1…...

深入理解IP子网掩码子网划分{作用} 以及 不同网段之间的ping的原理 以及子网掩码的区域划分

目录 子网掩码详解 子网掩码定义 子网掩码进一步解释 子网掩码的作用 计算总结表 子网掩码计算 子网掩码对应IP数量计算 判断IP是否在同一网段 1. 计算步骤 2. 示例 3. 关键点 总结 不同网段通信原理与Ping流程 1. 同网段通信 2. 跨网段通信 网段计算示例 3. P…...

rust 前端npm依赖工具rsup升级日志

rsup是使用 rust 编写的一个前端 npm 依赖包管理工具,可以获取到项目中依赖包的最新版本信息,并通过 web 服务的形式提供查看、升级操作等一一系列操作。 在前一篇文章中,记录初始的功能设计,自己的想法实现过程。在自己的使用过…...

2.2 STM32F103C8T6最小系统板的四种有关固件的开发方式

2.2.1 四种有关固件的开发方式 四种有关于固件的开发方式从时间线由远及近分别是:寄存器开发、标准外设驱动库开发、硬件抽象层库开发、底层库开发。 四种开发方式各有优缺点,可以参考ST官方的测试与说明。 1.寄存器开发 寄存器编程对于从51等等芯片过渡…...

【C++】 stack和queue以及模拟实现

一、stack及其模拟实现 1.1 stack介绍 stack是一种容器适配器,专门用在具有后进先出操作的上下文环境中,其删除只能从容器的一端进行 元素的插入与提取操作。stack是作为容器适配器被实现的,容器适配器即是对特定类封装作为其底层的容器&am…...

python与C系列语言的差异总结(2)

Python有很多表达布尔值的方式,布尔常量False、0、Python零值None、空值(如空的列表[]和空字符串""),都被视为False。布尔常量True和其他一切值都被视为True。但不相等。这个自由度相比C类语言更加高。 if (not None):…...

Linux之文件系统

1.前言 文件 内容属性 文件分为被打开的文件(跟基础IO有关,在内存上)和没有被打开的文件(在磁盘上)。 在磁盘上找没有被打开的文件属于文件系统的工作 2.对硬件的理解 2.1 磁盘,服务器,机柜,机房 1.磁…...

LeetCode刷题 -- 23. 合并 K 个升序链表

小根堆排序与合并 K 个有序链表的实现 1. 介绍 本技术文档详细介绍了如何使用 小根堆(Min Heap) 实现 K 个有序链表的合并。 核心思想是: 使用 小根堆 维护当前最小的节点。每次取出堆顶元素(最小值)加入合并链表&…...

DeepSeek在MATLAB上的部署与应用

在科技飞速发展的当下,人工智能与编程语言的融合不断拓展着创新边界。DeepSeek作为一款备受瞩目的大语言模型,其在自然语言处理领域展现出强大的能力。而MATLAB,作为科学计算和工程领域广泛应用的专业软件,拥有丰富的工具包和高效…...

mapbox基础,使用geojson加载fill-extrusion三维填充图层

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️fill-extrusion三维填充图层样式二、�…...

基于 SpringBoot 的 “电影交流平台小程序” 系统的设计与实现

大家好,今天要和大家聊的是一款基于 SpringBoot 的 “电影交流平台小程序” 系统的设计与实现。项目源码以及部署相关事宜请联系我,文末附上联系方式。 项目简介 基于 SpringBoot 的 “电影交流平台小程序” 系统设计与实现的主要使用者分为 管理员 和…...

单片机裸机编程-时机管理

对于 RTOS 实时操作系统,我们是通过 TASK(任务)进行底层操作的,这与裸机编程中的函数(fun)类似。不同的任务或函数实现不同的功能,在RTOS中,单片机有信号量、队列等不同任务之间的通…...

Flutter系列教程之(2)——Dart语言快速入门

目录 1.变量与类型 1.1 num类型 1.2 String类型 1.3 Object与Dynamic 1.4 类型判断/转换 1.5 变量和常量 2.方法/函数 3.类、接口、抽象类 3.1 类 3.2 接口 4.集合 4.1 List 4.2 Set 4.3 Map 5.总结 Dart语言的语法和Kotlin、Java有类似之处,这里就通…...

告别万年历芯片!用STM32F4的RTC闹钟和唤醒功能实现低功耗定时任务(附代码)

用STM32F4内置RTC重构低功耗设备的时间管理架构 在物联网终端和便携式设备设计中,低功耗管理一直是工程师们面临的核心挑战。传统方案往往依赖外置RTC芯片配合主控实现定时唤醒功能,这种架构不仅增加BOM成本,还面临I2C通信可靠性和功耗开销的…...

网络拓扑发现实战:从LLDP数据采集到D3.js可视化前端全链路解析

网络拓扑发现实战:从LLDP数据采集到D3.js可视化全链路解析 现代网络架构正变得越来越复杂,从传统的三层架构到如今的云原生网络,设备之间的连接关系呈现出动态化、多样化的特征。对于网络运维团队而言,如何快速准确地掌握全网拓扑…...

StarUML 4.0.1导出清晰UML图,手把手教你修改JS文件去除烦人水印

StarUML 4.0.1导出清晰UML图的完整解决方案 你是否遇到过这样的困扰:精心设计的UML图在导出时被强制添加了"未注册"水印,严重影响专业文档的呈现效果?这个问题困扰着许多使用StarUML进行软件设计的开发者和学生。本文将为你提供一个…...

八大网盘直链下载助手:告别限速的终极完整指南

八大网盘直链下载助手:告别限速的终极完整指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / …...

yz-bijini-cosplay LoRA热加载性能测试:切换耗时<800ms实测数据与优化点

yz-bijini-cosplay LoRA热加载性能测试&#xff1a;切换耗时<800ms实测数据与优化点 1. 项目概述 yz-bijini-cosplay 是一个专为RTX 4090显卡优化的Cosplay风格文生图系统&#xff0c;基于通义千问Z-Image底座和专属LoRA权重构建。这个项目的核心创新在于实现了LoRA权重的…...

Uni-App开发者必看:隐私政策弹窗别再自己写了!用官方方案轻松过审华为、小米应用市场

Uni-App隐私合规实战&#xff1a;从审核失败到华为/小米一次通过的完整指南 去年夏天&#xff0c;我们团队的一款工具类App在华为应用市场连续被拒7次&#xff0c;每次都是同样的理由&#xff1a;"检测到应用在用户同意隐私政策前收集设备信息"。当时我们固执地认为自…...

【WinCC V7.5 实战:从零搭建污水处理监控系统】

1. 污水处理监控系统与WinCC V7.5的完美结合 污水处理是现代工业中不可或缺的一环&#xff0c;而监控系统则是确保处理过程稳定运行的关键。WinCC V7.5作为西门子经典的SCADA系统&#xff0c;在工业自动化领域有着广泛的应用。对于初学者来说&#xff0c;从零开始搭建一个完整的…...

如何在 PHP 包含文件中动态排除特定页面的导航项

...

深度学习篇---分类模型训练过程中涉及的所有“维度”概念以及流程的动态变化

这里的“维度”有两层含义&#xff1a;一是数学维度&#xff0c;即数据张量在模型各层中的形状变化&#xff1b;二是工程维度&#xff0c;即控制训练过程和模型容量的超参数空间。理解这两者的协同变化&#xff0c;是掌握深度学习训练逻辑的关键。一、 数学维度流&#xff1a;张…...

Qt 6.2 静态编译实战:从环境配置到IDE集成的完整指南

1. 环境准备&#xff1a;搭建静态编译的基础舞台 第一次尝试Qt静态编译时&#xff0c;我盯着满屏的英文文档和报错信息整整发呆了半小时。作为过来人&#xff0c;我理解那种面对复杂工具链的无力感。别担心&#xff0c;跟着我的步骤走&#xff0c;咱们用最稳妥的方式把地基打牢…...