当前位置：首页 > news >正文

docker启动paddlespeech服务，并使用接口调用

news 2026/2/9 3:48:56

一、检查docker容器是否启动

1.输入命令 systemctl status docker

启动        systemctl start docker
守护进程重启   sudo systemctl daemon-reload
重启docker服务   systemctl restart  docker
重启docker服务  sudo service docker restart
关闭docker service docker stop
关闭docker systemctl stop docker
检查docker状态  systemctl status docker

若docker正常启动则显示界面如下

2.启动服务时可能出现报错

可能为权限不够导致

输入su，并输入当前用户登录密码即可进入root权限模式，再次启动即可

Docker启动失败报错Failed to start Docker Application Container Engine解决方案

二、docker启动paddlespeech镜像

1.安装

初始需要下载镜像到本地，参照官方文档docker安装paddlespeech，并启动服务

#下载并启动服务
docker run --name dev -v $PWD:/mnt -p xxxx:xxxx -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

其中xxxx:xxxx，前为端口映射端口，后为实际请求端口

比如想启动paddlespeech基础服务需要将实际请求设置为8090，包含中文语音识别，中文语音合成等等

但此服务语音识别和合成只能识别中文以及数字，字母及英文无法识别，使用需要注意

2.二次使用

docker run  -p XXXX:XXXX -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

使用此命令即可启动paddlespeech镜像

若想查看当前有哪些镜像，使用 docker images 命令即可查看

三、启动paddlespeech服务

1.官方文档说明有三种服务启动方式

#启动AI Studio服务，即包括语音识别，语音合成，音频分类等多种服务
paddlespeech_server start --config_file ./speech_server/conf/application.yaml
#启动完毕，即可看到启动端口为8090
#需要在启动docker镜像时指定实际端口

#启动流式tts服务
paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml

#启动流式asr服务
paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml

启动成功后应该显示

[2023-05-02 07:16:34,644] [    INFO] - start to init the engine
[2023-05-02 07:16:34,644] [    INFO] - asr : python engine.
W0502 07:16:37.497296  1187 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver API Version: 12.1, Runtime API Version: 11.7
W0502 07:16:37.502528  1187 gpu_resources.cc:91] device: 0, cuDNN Version: 8.8.
2023-05-02 07:16:38.195 | INFO     | paddlespeech.s2t.modules.embedding:__init__:153 - max len: 5000
[2023-05-02 07:16:39,064] [    INFO] - Initialize ASR server engine successfully on device: gpu:0.
[2023-05-02 07:16:39,064] [    INFO] - tts : python engine.
...
[2023-05-02 07:16:55] [INFO] [on.py:61] Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
[2023-05-02 07:16:55] [INFO] [server.py:212] Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)

2.若想使用中英文混合语音合成可以使用飞浆另一个产品PP-TTS飞浆文档

这里不多做说明，需要自行文档查阅

四、使用服务

1.使用以上服务可以有三种方法验证

1、命令行

2、api接口

3、python程序调用

此文档 paddlespeech正常服务使用方法具体说明每一种使用方式

若想使用流式tts和流式asr服务请参考以下文档

https://github.com/PaddlePaddle/PaddleSpeech/wiki/PaddleSpeech-Server-RESTful-API

PaddleSpeech Server WebSocket API · PaddlePaddle/PaddleSpeech Wiki · GitHub

使用postman请求，并带body参数请求服务，需要注意请求类型，正常服务一般为post请求

2.请求返回数据

audio数据为base64码，需要转为wav编码即可听到合成音频

到此服务启动->调用接口->使用数据结束

结束

docker启动paddlespeech服务，并使用接口调用

一、检查docker容器是否启动 1.输入命令 systemctl status docker 启动 systemctl start docker 守护进程重启 sudo systemctl daemon-reload 重启docker服务 systemctl restart docker 重启docker服务 sudo service docker restart 关闭docker service docker…...

编程日记 2023/9/2 18:02:27

如何训练ChatGPT以生成音乐和创意艺术作品？

训练ChatGPT生成音乐和创意艺术作品是一个令人兴奋且具有挑战性的任务。这种技术，也被称为生成式艺术，涉及将人工智能（AI）模型与创意艺术的融合。在本文中，我将探讨如何训练ChatGPT以生成音乐和创意艺术作品的过程&…...

编程日记 2023/9/2 18:01:26

北约报告：2023-2043，下一代量子技术的发展与挑战

“当今的新技术正在以令人眼花缭乱的速度发展，我们所有人都可以在负责任且合乎道德的方式开发和部署新技术方面发挥作用。” ——这是副秘书长Mircea Geoană在2023年3月22日、在布鲁塞尔发布《北约科学技术组织2023-2043年趋势报告》时传达的信息。 Geoană先生强调…...

编程日记 2023/9/2 18:00:25

arm版Linux下安装es集群

背景：由于生产上网络没通，没办法，只能自己安装一个es集群的测试环境了，我的电脑是Mac M2，安装的Linux是centos7，也是arm版的。第一步：查看自己Linux系统的版本命令：uname -a 例如…...

编程日记 2023/9/2 17:59:24

vConsole调试工具的三种使用方式

1.在html页面时, 在页面引入 cdn 方式引入 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" co…...

编程日记 2023/9/2 17:58:23

不用订阅，不用破解，永久免费使用Axure最新版教程

首先去官网下载最新的axure，你没听错，就是最新的。下载网址：Axure RP - UX Prototypes, Specifications, and Diagrams in One Tool 下载完后解压安装到本地，并注册属于你自己的账户，开始试用。可惜的是只有30天的试…...

编程日记 2023/9/2 17:57:21

合宙Air724UG LuatOS-Air LVGL API控件--复选框 (Checkbox)

复选框 (Checkbox) 复选框主要是让用户进行一些内容选择，或者同意用户协议。示例代码 – 复选框回调函数 function event_handler(obj, event) if event lvgl.EVENT_VALUE_CHANGED then print(“State”, lvgl.checkbox_is_checked(obj)) end end – 创建复选框…...

编程日记 2023/9/2 17:56:19

使用nps实现内网穿透

1、介绍当我们想把内网的一些资源暴露在公网上时，可以使用内网穿透功能。比如公司的内网服务器，部署了平时需要开发的项目，但是回到家中无法访问，就可以使用内网穿透，将公司内网的接口映射到一台公网的服务器上&a…...

编程日记 2023/9/2 17:55:17

时序预测 | MATLAB实现TCN-BiGRU时间卷积双向门控循环单元时间序列预测

时序预测 | MATLAB实现TCN-BiGRU时间卷积双向门控循环单元时间序列预测目录时序预测 | MATLAB实现TCN-BiGRU时间卷积双向门控循环单元时间序列预测预测效果基本介绍模型描述程序设计参考资料预测效果基本介绍 1.MATLAB实现TCN-BiGRU时间卷积双向门控循环单元时间序列预测&a…...

编程日记 2023/9/2 17:54:16

websocket和uni-app里使用websocket

一、HTTP是无状态协议特点： 1、浏览器发送请求时，浏览器和服务器会建立一个连接。完成请求和响应。在http1.0之前，每次请求响应完毕后，会立即断开连接。在http1.1之后，当前网页的所有请求响应完毕后，才断…...

编程日记 2023/9/2 17:53:15

Opencv-C++笔记 (18) : 轮廓和凸包

文章目录一、轮廓findContours发现轮廓drawContours绘制轮廓代码二.几何及特性概括——凸包(Convex Hull)凸包概念凸包扫描算法介绍——Graham扫描算法相关API介绍程序示例轮廓集合及特性性概括——轮廓周围绘制矩形框和圆形相关理论介绍轮廓周围绘制矩形 -API绘制步骤程序实…...

编程日记 2023/9/2 17:52:14

【半监督医学图像分割】2022-MedIA-UWI

【半监督医学图像分割】2022-MedIA-UWI 论文题目：Semi-supervise d me dical image segmentation via a triple d-uncertainty guided mean teacher model with contrastive learning 中文题目：基于对比学习的三维不确定性指导平均教师模型的半监督图像分…...

编程日记 2023/9/2 17:51:11

python发送邮件

为了安全起见，我们发送邮件需要使用tls，这样发送的内容都是加密的了，但是该工具批量发送带有自定义内容的邮件不方便，于是写了一个py脚本，使用--data参数，方便批量发送，我们的策略是每天随机发送…...

编程日记 2023/9/2 17:50:10

gitee上传本地项目bug

🤮这个破bug不知道浪费了多长时间，以前没有记录，每次都忘记，这次记下来问题描述 gitee创建仓库，然后根据它提示的如下命令，但一直报错原因分析： 把命令复制出来，粘贴到Sublime …...

编程日记 2023/9/2 17:49:09

自然语言处理2-NLP

目录自然语言处理2-NLP 如何把词转换为向量如何让向量具有语义信息在CBOW中在Skip-gram中 skip-gram比CBOW效果更好 CBOW和Skip-gram的算法实现 Skip-gram的理想实现 Skip-gram的实际实现自然语言处理2-NLP 在自然语言处理任务中，词向量（…...

编程日记 2023/9/2 17:48:07

穿上App外衣，保持Web灵魂——PWA温故

早在2015年，设计师弗朗西斯贝里曼和Google Chrome的工程师亚历克斯罗素提出“PWA（渐进式网络应用程序）”概念，将网络之长与应用之长相结合，其核心目标就是提升 Web App 的性能，改善 Web App以媲美Native的流…...

编程日记 2023/9/2 17:47:05

【跟小嘉学 Rust 编程】二十六、Rust的序列化解决方案(Serde)

系列文章目录【跟小嘉学 Rust 编程】一、Rust 编程基础【跟小嘉学 Rust 编程】二、Rust 包管理工具使用【跟小嘉学 Rust 编程】三、Rust 的基本程序概念【跟小嘉学 Rust 编程】四、理解 Rust 的所有权概念【跟小嘉学 Rust 编程】五、使用结构体关联结构化数据【跟小嘉学…...

编程日记 2023/9/2 17:45:02

菜鸟教程《Python 3 教程》笔记（14）：函数

菜鸟教程《Python 3 教程》笔记（14） 14 函数14.1 参数传递14.1.1 可更改(mutable)与不可更改(immutable)对象14.1.2 python 传不可变对象实例 14.2 参数14.2.1 必需参数14.2.2 关键字参数14.2.3 默认参数14.2.4 不定长参数 14.3 匿名函数14.4 强制位置参…...

编程日记 2023/9/2 17:43:59

SEC推迟ETF，BTC跌破26k，十年之约#6逢跌加仓

今日荐读：8.31教链内参《美证监会推迟所有的BTC现货ETF申请》。刘教链Pro《BTC的流速》。 * * * 刘教链原创 * * * 原本是9.2的截止日，美SEC昨晚就忙不迭地放出了话，所有现货比特币ETF的申请，推迟，统统推迟。不管你什…...

编程日记 2023/9/2 17:42:58

c++20 多线程并发 latch barrier semaphore

背景: c20 关于多线程并发新增了 latch, barrier, semaphore ,接下来就按照一个一个进行介绍 latch latch 是一次性使用的线程协调点, 一旦给定数量的线程达到latch点时, 所有线程都会解除阻塞, 并继续执行. 基本上它是一个计数器, 在每个线程到达latch点时倒数, 一旦计数器达…...

编程日记 2023/9/2 17:41:56

OpenLayers 可视化之热力图

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 热力图（Heatmap）又叫热点图，是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...

编程新知 2025/12/9 21:15:58

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/12/11 18:28:17

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述通过动态调整节点通信的能量开销，平衡网络负载，延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

编程新知 2026/2/6 5:38:46

【2025年】解决Burpsuite抓不到https包的问题

环境：windows11 burpsuite:2025.5 在抓取https网站时，burpsuite抓取不到https数据包，只显示： 解决该问题只需如下三个步骤： 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...

编程新知 2026/1/28 3:43:20

音视频——I2S 协议详解

I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议，专门用于在数字音频设备之间传输数字音频数据。它由飞利浦（Philips）公司开发，以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...

编程新知 2026/2/1 2:08:53

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化（Gradient Normalization） (2) 判别器梯度间隙正则化（Discriminator Gradient Gap Regularization） (3) 自注意力机制（Self-Attention） 3. 完整损失函数二…...

编程新知 2026/1/31 10:58:46