windows部署PaddleSpeech详细教程
windows安装paddlespeech步骤:
1. 安装vs c++编译环境
对于 Windows 系统,需要安装 Visual Studio 来完成 C++ 编译环境的安装。
Microsoft C++ Build Tools - Visual Studio
2. 安装conda
conda create -y -p paddlespeech python=3.8
conda activate paddlespeech
conda install -y -c conda-forge sox libsndfile swig bzip2
3. 下载源码
git clone GitHub - PaddlePaddle/PaddleSpeech: Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translation and Keyword Spotting. Won NAACL2022 Best Demo Award.
cd PaddleSpeech
4. 安装依赖
pip install paddlepaddle==2.4.2
修改setup.py:
pip install opencc==1.1.7
pip install ppdiffusers==0.14.2
pip install paddlenlp==2.5.2
编译
absl-py==2.1.0
aiohappyeyeballs==2.4.3
aiohttp==3.10.11
aiosignal==1.3.1
antlr4-python3-runtime==4.9.3
anyio==4.5.2
astor==0.8.1
asttokens==2.4.1
async-timeout==5.0.1
attrs==24.2.0
audioread==3.0.1
babel==2.16.0
backcall==0.2.0
bce-python-sdk==0.9.23
blinker==1.8.2
bokeh==3.1.1
boltons==24.1.0
Bottleneck==1.4.0
braceexpand==0.1.7
certifi==2024.8.30
cffi==1.17.1
charset-normalizer==3.4.0
click==8.1.7
colorama==0.4.6
coloredlogs==15.0.1
colorlog==6.9.0
contourpy==1.1.1
cycler==0.12.1
Cython==3.0.11
datasets==3.1.0
decorator==5.1.1
dill==0.3.4
Distance==0.1.3
editdistance==0.8.1
einops==0.8.0
exceptiongroup==1.2.2
executing==2.1.0
fastapi==0.115.5
filelock==3.16.1
Flask==3.0.3
Flask-Babel==2.0.0
flatbuffers==24.3.25
fonttools==4.55.0
frozenlist==1.5.0
fsspec==2024.9.0
ftfy==6.2.3
future==1.0.0
g2p-en==2.1.0
g2pM==0.1.2.5
h11==0.14.0
h5py==3.11.0
huggingface-hub==0.26.2
humanfriendly==10.0
HyperPyYAML==1.2.2
idna==3.10
importlib_metadata==8.5.0
importlib_resources==6.4.5
inflect==7.0.0
intervaltree==3.1.0
ipython==8.12.3
itsdangerous==2.2.0
jedi==0.19.2
jieba==0.42.1
Jinja2==3.1.4
joblib==1.4.2
jsonlines==4.0.0
kaldiio==2.18.0
kiwisolver==1.4.7
librosa==0.8.1
llvmlite==0.41.1
loguru==0.7.2
lxml==5.3.0
markdown-it-py==3.0.0
MarkupSafe==2.1.5
matplotlib==3.7.5
matplotlib-inline==0.1.7
mdurl==0.1.2
mido==1.3.3
mock==5.1.0
mpmath==1.3.0
multidict==6.1.0
multiprocess==0.70.12.2
nara-wpe==0.0.11
nltk==3.9.1
note-seq==0.0.3
numba==0.58.1
numpy==1.23.5
omegaconf==2.3.0
onnx==1.12.0
onnxruntime==1.19.2
OpenCC==1.1.7
opencc-python-reimplemented==0.1.7
opencv-python==4.6.0.66
opt-einsum==3.3.0
packaging==24.2
paddle-bfloat==0.1.7
paddle2onnx==1.3.0
paddleaudio==1.1.0
paddlefsl==1.1.0
paddlenlp==2.5.2
paddlepaddle==2.4.2
paddlesde==0.2.5
paddleslim==2.6.0
paddlespeech @ file:///E:/%E5%B7%A5%E4%BD%9C/%E9%A1%B9%E7%9B%AE/%E6%99%BA%E8%83%BD%E5%8C%96%E4%BA%A7%E5%93%81/paddlespeech
paddlespeech-feat==0.1.0
pandas==2.0.3
parameterized==0.9.0
parso==0.8.4
pathos==0.2.8
pattern_singleton==1.2.0
pickleshare==0.7.5
pillow==10.4.0
platformdirs==4.3.6
pooch==1.8.2
portalocker==3.0.0
pox==0.3.5
ppdiffusers==0.14.2
ppft==1.7.6.9
praatio==5.1.1
pretty_midi==0.2.10
prettytable==3.11.0
prompt_toolkit==3.0.48
propcache==0.2.0
protobuf==3.20.0
psutil==6.1.0
pure_eval==0.2.3
pyarrow==17.0.0
pybind11==2.13.6
pycparser==2.22
pycryptodome==3.21.0
pydantic==1.10.19
pydub==0.25.1
Pygments==2.18.0
pygtrie==2.5.0
pyparsing==3.1.4
pypinyin==0.44.0
pypinyin-dict==0.8.0
pyreadline3==3.5.4
pytest-runner==6.0.1
python-dateutil==2.9.0.post0
pytz==2024.2
pywin32==308
pyworld==0.3.4
PyYAML==6.0.2
pyzmq==26.2.0
rarfile==4.2
regex==2024.11.6
requests==2.32.3
requests-mock==1.12.1
resampy==0.4.3
rich==13.9.4
ruamel.yaml==0.18.6
ruamel.yaml.clib==0.2.8
sacrebleu==2.4.3
safetensors==0.4.5
scikit-learn==1.3.2
scipy==1.10.1
sentencepiece==0.2.0
seqeval==1.2.2
shellingham==1.5.4
six==1.16.0
sniffio==1.3.1
sortedcontainers==2.4.0
soundfile==0.12.1
stack-data==0.6.3
starlette==0.41.3
swig==4.3.0
sympy==1.13.3
tabulate==0.9.0
TextGrid==1.6.1
threadpoolctl==3.5.0
timer==0.3.0
ToJyutping==0.2.1
tornado==6.4.2
tqdm==4.67.1
traitlets==5.14.3
trampoline==0.1.2
typeguard==2.13.3
typer==0.13.1
typing_extensions==4.12.2
tzdata==2024.2
urllib3==1.26.20
uvicorn==0.32.1
visualdl==2.4.2
wcwidth==0.2.13
webrtcvad==2.0.10
websockets==13.1
Werkzeug==3.0.6
win32-setctime==1.1.0
xxhash==3.5.0
xyzservices==2024.9.0
yacs==0.1.8
yarl==1.15.2
zhon==2.0.2
zipp==3.20.2
pip install pytest-runner
pip install .
5. 下载nltk_data
地址:https://paddlespeech.bj.bcebos.com/Parakeet/tools/nltk_data.tar.gz
目录:C:\Users\{USER_NAME}\AppData\Roaming\nltk_data
6.启动服务
paddlespeech_server start --config .\demos\streaming_tts_server\conf\tts_online_ws_application.yaml
7.apifox测试
新建websocket接口

127.0.0.1:8192/paddlespeech/tts/streaming

分别输入:
{"task": "tts","signal": "start"
}{"text": "你好,欢迎使用百度飞桨语音合成服务。","spk_id": 0
}{"task": "tts","signal": "end"
}
相关文章:
windows部署PaddleSpeech详细教程
windows安装paddlespeech步骤: 1. 安装vs c编译环境 对于 Windows 系统,需要安装 Visual Studio 来完成 C 编译环境的安装。 Microsoft C Build Tools - Visual Studio 2. 安装conda conda create -y -p paddlespeech python3.8 conda activate pad…...
线程条件变量 生产者消费者模型 Linux环境 C语言实现
只能用来解决同步问题,且不能独立使用,必须配合互斥锁一起用 头文件:#include <pthread.h> 类型:pthread_cond_t PTHREAD_COND_INITIALIZER 初始化 初始化:int pthread_cond_init(pthread_cond_t * cond, NULL);…...
C++ packaged_task
packaged_task 是 C11 标准库中引入的一个模板类,它用于将可调用对象(如函数、lambda 表达式、函数对象或绑定表达式)包装起来,并允许异步地获取其结果packaged_task 类提供了一种方便的方式来创建任务,这些任务可以被…...
【联表查询】.NET开源 ORM 框架 SqlSugar 系列
.NET开源 ORM 框架 SqlSugar 系列 【开篇】.NET开源 ORM 框架 SqlSugar 系列【入门必看】.NET开源 ORM 框架 SqlSugar 系列【实体配置】.NET开源 ORM 框架 SqlSugar 系列【Db First】.NET开源 ORM 框架 SqlSugar 系列【Code First】.NET开源 ORM 框架 SqlSugar 系列【数据事务…...
嵌入式C编程:宏定义与typedef的深入对比与应用
目录 一、宏定义(Macro Definition) 1.1. 特点与应用 1.1.1 定义常量 1.1.2 定义函数式宏 1.1.3 条件编译 1.2. 作用范围和生命周期方面 1.3. 应用注意事项 二、typedef 2.1. 特点与应用 2.1.1 简化类型声明 2.1.2 提高代码可读性 2.1.3 实现…...
高级java每日一道面试题-2024年12月03日-JVM篇-什么是Stop The World? 什么是OopMap? 什么是安全点?
如果有遗漏,评论区告诉我进行补充 面试官: 什么是Stop The World? 什么是OopMap? 什么是安全点? 我回答: 在Java虚拟机(JVM)中,Stop The World、OopMap 和 安全点 是与垃圾回收(GC)和性能优化密切相关的概念。理…...
【openGauss︱PostgreSQL】openGauss或PostgreSQL查表、索引、序列、权限、函数
【openGauss︱PostgreSQL】openGauss或PostgreSQL查表、索引、序列、权限、函数 一、openGauss查表二、openGauss查索引三、openGauss查序列四、openGauss查权限五、openGauss或PostgreSQL查函数六、PostgreSQL查表七、PostgreSQL查索引八、PostgreSQL查序列九、PostgreSQL查权…...
Dataset用load_dataset读图片和对应的caption的一个坑
代码: data_files {} if args.train_data_dir is not None:data_files["train"] os.path.join(args.train_data_dir, "**")dataset load_dataset("imagefolder",data_filesdata_files,cache_dirargs.cache_dir,) 数据࿱…...
【信息系统项目管理师】第7章:项目立项管理 考点梳理
文章目录 7.1 项目建议与立项申请7.2 项目可行性研究7.2.1 可行性研究的内容7.2.2 初步可行性研究7.2.3 详细可行性研究(重点) 7.3 项目评估与决策 【学习建议】本章大概考选择题2分左右,有可能考案例题。论文早年考过。本章知识点比较集中&a…...
知识库、提示词对大语言模型的影响测试
简介 通过对比有无知识库,测试大语言模型的回答 有无提示词对比测试 前提 大语言模型:Qwen1.5-1.8B-Chat-GPTQ-Int4 GPU:1650super,显存4G 提问:华为mate70 没有提示词 回答的内容如下 “华为mate70pro和mate40p…...
vistat-监控和分析网络状态
vistat 是一个用于监控和分析网络状态的工具,通常用于查看网络接口、流量、连接等实时数据。 原理:用户态调用系统接口获取内核中的网络统计信息。 核心功能:网络接口流量监控、查看连接状态、带宽使用分析。 使用方法: 查看接…...
EasyAnimateV5 视频生成大模型原理详解与模型使用
在数字内容创作中,视频扮演的角色日益重要。然而,创作高质量视频通常耗时且昂贵。EasyAnimate 系列旨在利用人工智能技术简化这一过程。EasyAnimateV5 建立在其前代版本的基础之上,不仅在质量上有所提升,还在多模态数据处理和跨语…...
水稻和拟南芥生命周期中单碱基分辨率的m6A定量分析-文献精读88
Quantitative profiling of m6A at single base resolution across the life cycle of rice and Arabidopsis 水稻和拟南芥生命周期中单碱基分辨率的m6A定量分析 水稻参考基因组(日本晴品种)-CSDN博客 “Xian”(籼)和“Geng”&…...
学习threejs,使用canvas更新纹理
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️Texture 贴图 二、…...
【笔记2-3】ESP32 bug:PSRAM chip not found or not supported 没有外部PSRAM问题解决
主要参考b站宸芯IOT老师的视频,记录自己的笔记,老师讲的主要是linux环境,但配置过程实在太多问题,就直接用windows环境了,老师也有讲一些windows的操作,只要代码会写,操作都还好,开发…...
大数据hadoop、spark、flink、kafka发展的过程
将sql 代发翻译成java 程序 将python 程序通过pyspark框架翻译成java 程序,然后运行在spark计算框架上...
设计模式-理论基础
理论基础 一、代码质量指标1.可维护性(maintainability)2.可读性(readability)3.可扩展性(extensibility)4.灵活性(flexibility)5.简洁性(simplicity)6.可复用…...
猎板 PCB特殊工艺:铸就电子行业核心竞争力新高度
在当今竞争激烈且技术驱动的电子制造领域,印制电路板(PCB)作为电子产品的关键基石,其特殊工艺的发展水平直接影响着整个行业的创新步伐与产品品质。猎板 PCB 凭借在厚铜板、孔口铺铜、HDI 板、大尺寸板以及高频高速板等特殊工艺方…...
用于目标检测的集中式特征金字塔
摘要 https://arxiv.org/pdf/2210.02093 视觉特征金字塔在多种应用中已展现出其在有效性和效率方面的优越性。然而,现有方法过度关注层间特征交互,却忽略了经验证明有益的层内特征调节。尽管一些方法试图借助注意力机制或视觉变换器来学习紧凑的层内特征表示,但它们忽略了…...
大舍传媒-关于海外媒体宣发的探讨
关于海外媒体宣发的探讨 一、海外媒体宣发的重要性 在当今全球化的时代,海外媒体宣发对于企业、组织和个人来说具有至关重要的意义。通过有效的海外媒体宣发,可以提升品牌知名度,拓展国际市场,增强影响力,吸引更多的潜…...
突破Emby功能限制:emby-unlocked的技术实现与应用指南
突破Emby功能限制:emby-unlocked的技术实现与应用指南 【免费下载链接】emby-unlocked Emby with the premium Emby Premiere features unlocked. 项目地址: https://gitcode.com/gh_mirrors/em/emby-unlocked 在媒体服务器领域,Emby作为一款功能…...
HoYo-Glyphs:11款米哈游游戏文字字体,轻松打造你的专属游戏世界
HoYo-Glyphs:11款米哈游游戏文字字体,轻松打造你的专属游戏世界 【免费下载链接】HoYo-Glyphs Constructed scripts by HoYoverse 米哈游的架空文字 项目地址: https://gitcode.com/gh_mirrors/ho/HoYo-Glyphs 你是否曾被《原神》中蒙德教堂的哥特…...
Arduino超声波测距库:基于外部中断的非阻塞HC-SR04驱动
1. 项目概述iarduino_HC_SR04_int是一款专为 Arduino IDE 设计的超声波测距传感器驱动库,面向 HC-SR04 模块提供高精度、非阻塞式距离测量能力。该库并非简单封装pulseIn()的轮询实现,而是基于硬件级外部中断机制构建,从根本上解决了传统超声…...
NVIDIA显卡隐藏功能终极解锁:10个性能调校技巧完全指南
NVIDIA显卡隐藏功能终极解锁:10个性能调校技巧完全指南 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 想让你的NVIDIA显卡发挥出全部潜能吗?NVIDIA Profile Inspector这款强大的…...
intv_ai_mk11基础教程:打开即用的Llama文本生成器使用全流程详解
intv_ai_mk11基础教程:打开即用的Llama文本生成器使用全流程详解 1. 快速了解intv_ai_mk11 intv_ai_mk11是一个基于Llama架构的中等规模文本生成模型,特别适合日常办公和内容创作场景。想象一下,你有一个随时待命的文字助手,可以…...
GHelper硬件控制工具:华硕笔记本性能优化与系统管理完全指南
GHelper硬件控制工具:华硕笔记本性能优化与系统管理完全指南 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Str…...
FocalNet目标检测、实例分割模型环境配置FocalNet目标检测、实例分割模型数据集调整FocalNet目标检测、实例分割模型代跑训练FocalNet目标检测、实例分割改进创新Focal
FocalNet目标检测、实例分割模型环境配置 FocalNet目标检测、实例分割模型数据集调整 FocalNet目标检测、实例分割模型代跑训练 FocalNet目标检测、实例分割改进创新 FocalNet环境配置:Windows、Ubuntu、Centos、Macos等系统环境,如果电脑拥有显卡&#…...
word简历模板(含范文),免费下载
word简历模板导言 在竞争激烈的求职市场中,一份专业、个性化的简历是叩开理想企业大门的关键。简历不仅是个人经历的罗列,更是能力、潜力与职业规划的集中体现。然而,许多求职者因缺乏经验或模板参考,难以突出自身优势࿰…...
公司SEO推广与关键词策略的关系是什么_公司SEO推广的长期效果如何确保
公司SEO推广与关键词策略的关系是什么_公司SEO推广的长期效果如何确保 什么是SEO推广? 我们来了解一下什么是SEO推广。SEO,全称搜索引擎优化,是通过优化网站内容和结构,提高其在搜索引擎自然排名中的位置,从而吸引更…...
模型量化基础知识 - PTQ - 训练后量化
文章目录一、PTQ 是什么二、PTQ 的标准流程(五大步骤)✅ Step 0:准备 FP 模型(Baseline)✅ Step 1:插入量化节点(Quantization Simulation)✅ Step 2:校准(Ca…...
