当前位置：首页 > news >正文

前端 vue3 对接科大讯飞的语音在线合成API

news 2026/2/9 15:48:48

主要的功能就是将文本转为语音，可以播放。

看了看官方提供的demo，嗯....没看懂。最后还是去网上找的。

网上提供的案例，很多都是有局限性的，我找的那个他只能读取第一段数据，剩下的不读取。

科大讯飞的接口，返回的是一个数组，因为需要合成的文本多，所以将数据切割成多份，然后返回的。

例子：

封装了个方法，直接调用方法就可以了。

import CryptoJS from 'crypto-js';
import { Base64 } from 'js-base64';
import { message } from 'ant-design-vue';let APPID = '';
let API_SECRET = '';
let API_KEY = '';// 正确的URL
function getWebSocketUrl(apiKey, apiSecret) {let url = 'wss://tts-api.xfyun.cn/v2/tts';const host = 'tts-api.xfyun.cn';const date = new Date().toGMTString();const algorithm = 'hmac-sha256';const headers = 'host date request-line';const signatureOrigin = `host: ${host}\ndate: ${date}\nGET /v2/tts HTTP/1.1`;const signatureSha = CryptoJS.HmacSHA256(signatureOrigin, apiSecret);const signature = CryptoJS.enc.Base64.stringify(signatureSha);const authorizationOrigin = `api_key="${apiKey}", algorithm="${algorithm}", headers="${headers}", signature="${signature}"`;const authorization = btoa(authorizationOrigin);url = `${url}?authorization=${authorization}&date=${date}&host=${host}`;return url;
}// 文本编码
function encodeText(text, encoding) {switch (encoding) {case 'utf16le': {const buf = new ArrayBuffer(text.length * 4);const bufView = new Uint16Array(buf);// eslint-disable-next-line no-plusplusfor (let i = 0, strlen = text.length; i < strlen; i++) {bufView[i] = text.charCodeAt(i);}return buf;}case 'buffer2Base64': {let binary = '';const bytes = new Uint8Array(text);const len = bytes.byteLength;// eslint-disable-next-line no-plusplusfor (let i = 0; i < len; i++) {binary += String.fromCharCode(bytes[i]);}return window.btoa(binary);}case 'base64&utf16le': {return this.encodeText(this.encodeText(text, 'utf16le'), 'buffer2Base64');}default: {return Base64.encode(text);}}
}// eslint-disable-next-line no-shadow
function TextToSpeechConfig(APPID, vcn, speed, volume, pitch, tte, text) {// 私有方法：生成参数对象function generateParams() {return {common: {app_id: APPID,},business: {aue: 'lame',auf: 'audio/L16;rate=16000',sfl: 1,vcn,speed,volume,pitch,bgs: 1,tte,},data: {status: 2,text: encodeText(text, tte === 'unicode' ? 'base64&utf16le' : ''), // 假设 encodeText 是一个已定义的函数},};}// 公共方法，暴露给外部调用以获取参数对象return generateParams();
}export default class TTSWSS {static _instance; // 使用下划线表示这是一个内部使用的属性text = '';vcn = '';speed = '';volume = '';pitch = '';tte = 'UTF8';ttsWS = null;static getInstance(text, vcn, speed, volume, pitch) { // 单例模式// if (!TTSWSS._instance) {//   TTSWSS._instance = new TTSWSS(text, vcn, speed, volume, pitch);// }TTSWSS._instance = new TTSWSS(text, vcn, speed, volume, pitch);return TTSWSS._instance;}constructor(text, vcn, speed, volume, pitch) {this.text = text;this.vcn = vcn;this.speed = speed;this.volume = volume;this.pitch = pitch;const url = getWebSocketUrl(API_KEY, API_SECRET);if ('WebSocket' in window) { // 构造函数时就创建websocket对象this.ttsWS = new WebSocket(url);} else if ('MozWebSocket' in window) {this.ttsWS = new WebSocket(url);} else {// alert('浏览器不支持WebSocket');message.error('浏览器不支持WebSocket');}}setText(text) {this.text = text;}setTextVCN(vcn) {this.vcn = vcn;}setSpeed(speed) {this.speed = speed;}setVolume(volume) {this.volume = volume;}// setTte(istte=false){//   this.tte = istte==true ? "unicode" : "UTF8"// }connectWebSocket() {this.ttsWS.onopen = () => {// console.log(TextToSpeechConfig(APPID, this.vcn, this.speed, this.volume, this.pitch, this.tte, this.text), '请求参数');this.ttsWS.send(JSON.stringify(TextToSpeechConfig(APPID, this.vcn, this.speed, this.volume, this.pitch, this.tte, this.text)));};this.ttsWS.onerror = () => {// console.error(e);};this.ttsWS.onclose = () => {// console.log(e);};}disconnectWebSocket() {TTSWSS._instance = null;this.ttsWS.close(); // 关闭 WebSocket 连接this.ttsWS = null; // 清空 WebSocket 对象// console.log('WebSocket disconnected');}send_newMessage = text => {const params = {common: {app_id: APPID,},business: {aue: 'lame',sfl: 1,auf: 'audio/L16;rate=16000',vcn: this.vcn,speed: this.speed,volume: this.volume,pitch: this.pitch,bgs: 1,tte: 'UTF8',},data: {status: 2,text: encodeText(text, this.tte === 'unicode' ? 'base64&utf16le' : ''),},};this.ttsWS.send(JSON.stringify(params));};getMessage() {const that = this.ttsWS;const messages = []; // 用于存储所有消息return new Promise((resolve, reject) => {that.onmessage = e => {const jsonData = JSON.parse(e.data);// 合成失败if (jsonData.code !== 0) {// eslint-disable-next-line prefer-promise-reject-errorsreject({ message: '失败', data: jsonData });return; // 退出当前处理}// 存储成功的消息messages.push({message: '成功',type: 'base64',data: jsonData.data.audio,isLastData: jsonData.data.status === 2,});// 如果接收到最后一条数据，解析所有消息并关闭连接if (jsonData.data.status === 2) {that.close();resolve(messages); // 返回所有消息}};});}TTS_close_reset() {this.ttsWS?.close();// audioPlayer.reset();}static resetInstance() {TTSWSS._instance = null; // 清空实例// console.log('TTSWSS instance has been reset.');}
}
export function setConfig(params) {APPID = params?.APPID;API_SECRET = params?.APISecret;API_KEY = params?.APIKey;
}

使用：

import TTWss from '@/utils/voice/index.js';const audio_url = ref('');
const ttsinstance = ref(null); // 初始化为 null
const voiceLoading = ref(false); // 加载音频中function playVoice() {voiceLoading.value = true;ttsinstance?.value?.disconnectWebSocket();ttsinstance.value = null;audio_url.value = null; // 清空音频 URLconst { text } = props; // 这里是要转成语音的文字，我这个是写在组件里面的用props接收的，所以要这样写，到时候替换成自己要合成的文字就行// 创建 TTS 实例ttsinstance.value = TTWss.getInstance(text, 'xiaoyan', 50, 50, 50);// 连接 WebSocketttsinstance.value.connectWebSocket();// 获取消息ttsinstance.value.getMessage().then(result => {// 这里需要特殊处理，因为返回的数据是数组，所以要先将数组中的数据拿出来，放在每项里面的data中，然将不要先拼接，而是要先解码，然后将解码后的数据在拼接起来，这样就是一整段完整的录音文件了。const allData = result.map(it => atob(it.data));const binaryString = allData.join('');const len = binaryString.length;const bytes = new Uint8Array(len);for (let i = 0; i < len; i++) {bytes[i] = binaryString.charCodeAt(i);}const blob = new Blob([bytes], { type: 'audio/mp3' }); // 根据音频格式修改MIME类型const url = URL.createObjectURL(blob);audio_url.value = url; // 将生成的 URL 赋值给 audio_url// 这里展开后可以直接下载// const aTag = document.createElement('a');// aTag.href = url;// aTag.download = 'audio_file_name.mp3'; // 设置文件名// aTag.style.display = 'none';// document.body.appendChild(aTag);// aTag.click();// document.body.removeChild(aTag);// 播放音频playItem(url);voiceLoading.value = false;}).catch(err => {// console.log('失败', err);message.error(err);voiceLoading.value = false;});
}let currentAudio = null;
function playItem(url) {// 如果当前有音频在播放，则停止它if (currentAudio) {currentAudio.pause();currentAudio.currentTime = 0; // 可选：重置播放时间}currentAudio = new Audio(url);currentAudio.play().then(() => {// console.log('音频播放开始');}).catch(error => {// console.error('音频播放失败', error);message.error(error);});// 释放对象URL（可选）currentAudio.addEventListener('ended', () => {URL.revokeObjectURL(url);currentAudio = null; // 音频结束后清空实例});
}

HTML：

<img:src="PlayVoice"alt=""class="icon-img"@click.stop="playVoice"/>

前端 vue3 对接科大讯飞的语音在线合成API

主要的功能就是将文本转为语音，可以播放。看了看官方提供的demo，嗯....没看懂。最后还是去网上找的。网上提供的案例，很多都是有局限性的，我找的那个他只能读取第一段数据，剩下的不读取。科大讯飞的接口&#xf…...

编程日记 2024/10/4 20:23:49

缺省参数

一、概念在声明或定义函数时为函数的参数指定一个默认值，调用时，如果对应参数没有传参，则使用其默认值，否则使用指定的实参 void TestFunc(int a 0) {cout<<a<<endl; }int main() {TestFunc(); // 没有传参&am…...

编程日记 2024/10/4 20:20:46

Stable Diffusion绘画 | 来训练属于自己的模型：炼丹启动

经过前面几轮辛苦的准备工作之后，现在开始进入终篇的炼丹环节。在「上传素材」页面，点击「开始训练」： 可以在「查看进度-进度」中，查看模型训练的整体进度： 求助！！！操作「开始训练…...

编程日记 2024/10/4 20:17:42

import cv2 import numpy as npimg cv2.imread(image0.jpg,1) font cv2.FONT_HERSHEY_SIMPLEXcv2.rectangle(img,(500,400),(200,100),(0,255,0),20) # 1 dst 2 文字内容 3 坐标 4 5 字体大小 6 color 7 粗细 8 line type cv2.putText(img,flower,(200,50),font,1,(0,0,250)…...

编程日记 2024/10/4 20:14:40

【笔记】选择题笔记+数据结构笔记

文章目录 2014 41方法一先序遍历方法二连通分量是极大连通子图一个连通图的生成树是一个极小连通子图无向图的邻接表中，第i个顶点的度为第i个链表中的结点数邻接表和邻接矩阵对不同的操作各有优势。最短路径算法: 单源最短路径已知图G(V,E)，我们…...

编程日记 2024/10/4 20:13:38

浅谈汽车智能座舱如何实现多通道音频

一、引言随着汽车智能座舱的功能迭代发展，传统的 4 通道、6 通道、8 通道等音响系统难以在满足驾驶场景的需求，未来对于智能座舱音频质量和通道数会越来越高。接下来本文将浅析目前智能座舱如何实现音频功放，以及如何实现多路音频功放方案。…...

编程日记 2024/10/4 20:12:37

系统架构设计师教程第13章 13.1层次式体系结构概述笔记

13.1 层次式体系结构概述分层式体系结构是一种最常见的架构设计方法，能有效地使设计简化，使设计的系统机构清晰，便于提高复用能力和产品维护能力。层次式体系结构设计是将系统组成一个层次结构，每一层为上层服务，并…...

编程日记 2024/10/4 20:08:34

cnn突破一（先搞定三层反馈神经网络bpnet，c#实现）

惦记cnn很久了，一直搞机器视觉，走不出来，现在megauging已经实现，说明书也写了不少，该突破的突破了，该改进的也改进了，一个心病治好了，有空把人工智能在机器视觉上的延伸，…...

编程日记 2024/10/4 20:05:30

如何创建一个docker，给它命名，且下次重新打开它

1.创建一个新的docker并同时命名 docker run -it --name one ubuntu:18.04 /bin/bash 这时候我们已经创建了一个docker,并且命名为"one" 2.关闭当前docker exit 3.这时docker已经终止了，我们需要使用它要重新启动 docker start one 4.现在可以重新打…...

编程日记 2024/10/4 20:03:28

【D3.js in Action 3 精译_025】3.4 让 D3 数据适应屏幕（中）—— 线性比例尺的用法

当前内容所在位置（可进入专栏查看其他译好的章节内容） 第一部分 D3.js 基础知识第一章 D3.js 简介（已完结） 1.1 何为 D3.js？1.2 D3 生态系统——入门须知1.3 数据可视化最佳实践（上）1.3 数据可…...

编程日记 2024/10/4 20:01:25

Python的多线程与多进程：并发编程基础与实战

随着计算机硬件的不断发展，现代计算机通常配备多核处理器，使得在程序中同时处理多个任务成为可能。并发编程是提升程序性能、充分利用多核处理器能力的重要技术之一。在Python中，并发编程的实现主要包括多线程、多进程以及异步编程（如asyncio）。然而，由于Python的全局解释…...

编程日记 2024/10/4 20:00:24

HarmonyOS Next应用开发——响应式布局之媒体查询

响应式布局之媒体查询媒体查询作为响应式设计的核心，在移动设备上应用十分广泛。媒体查询可根据不同设备类型或同设备不同状态修改应用的样式，常用于多屏幕的应用适配。媒体查询常用于下面两种场景： 针对设备和应用的属性信息（…...

编程日记 2024/10/4 19:58:23

240 搜索二维矩阵 II

解题思路： \qquad 解这道题最重要的是如何利用从左到右、从上到下为升序的性质，快速找到目标元素。 \qquad 如果从左上角开始查找，如果当前matrix[i][[j] < target，可以向右、向下扩展元素都是升序，但选择哪个方向…...

编程日记 2024/10/4 19:57:22

jenkins微服务

如果vim进去某个文件里，可以按键盘的向下键查阅其它部分记得每天备份虚拟机的项目一.在linux安装jenkins 1.上传文件我们采用安装包的方式安装。先用SShclient在/usr/local/下创建jenkins文件夹，然后向其中导入两个包 2.安装jenkins 再在控制…...

编程日记 2024/10/4 19:56:21

【Kotlin基于selenium实现自动化测试】初识selenium以及搭建项目基本骨架(1)

导读大纲 1.1 Java: Selenium 首选语言1.2 配置一个强大的开发环境 1.1 Java: Selenium 首选语言 Java 是开发人员和测试人员进行自动化 Web 测试的首选 Java 和 Selenium 之间的协同作用受到各种因素的驱动,从而提高它们的有效性为什么Java经常被认为是Selenium的首选语言广…...

编程日记 2024/10/4 19:54:19

汽车追尾为什么是后车的责任？

简单点说：因为人后面没有长眼睛。结论在汽车追尾事故中，通常情况下后车被认为是责任方的原因在于交通法规对驾驶安全标准的约定和实践中的责任识别原则。虽然追尾事故常见地被归责于后车，但具体判断并不是绝对的，仍需综合多种…...

编程日记 2024/10/4 19:53:18

[运维]4.bookinfo无法部署的问题

为了拉取镜像，搭建了阿里云镜像仓库，教程见：K8S中基于NFS-Subdir-External-Provisioner存储组件实现的StorageClass-CSDN博客但是bookinfo的ratings和productpage无法运行，部署后显示crashLoopBackOff [rootmaster ~]# kubectl…...

编程日记 2024/10/4 19:48:12

ACT调试pycharm报错

在运行ACT 代码时，根据官方readme使用命令行需要在wandb选择的时候输入3 但是，使用pycharm运行的时候会报错 wandb.errors.UsageError: api_key not configured (no-tty). call wandb.login(key[your_api_key]) 网上搜索都是说要注册什么key&#xf…...

编程日记 2024/10/4 19:47:11

记一次控件提升后，运行却不显示的Bug

.h文件 #ifndef VOLUMETOOLBTN_H #define VOLUMETOOLBTN_H#include <QToolButton> #include <memory>class VolumeToolBtn : public QToolButton { Q_OBJECTpublic:explicit VolumeToolBtn(QWidget *parent nullptr);~VolumeToolBtn() override;void initUi(); p…...

编程日记 2024/10/4 19:45:09

关于深度学习torch的环境配置问题

已经下好了torch在虚拟环境中，结果在ipynb文件中无法运行后来在终端直接用python语句编译发现没有问题在编辑测试py文件发现runcode有问题原来是插件默认base环境具体操作参考VS Code插件Code Runner使用python虚拟环境_coderunner怎么在虚拟环境中使用-CSD…...

编程日记 2024/10/4 19:44:08

大数据学习栈记——Neo4j的安装与使用

本文介绍图数据库Neofj的安装与使用，操作系统：Ubuntu24.04，Neofj版本：2025.04.0。 Apt安装 Neofj可以进行官网安装：Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法最新版…...

编程新知 2026/2/8 4:37:08

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

JUC笔记(上)-复习涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换即使单核CPU也可以进行多线程执行代码，CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短，所以CPU会不断地切换线程执行，从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

编程新知 2026/1/31 23:25:09

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别直接训练提示词嵌入向量的核心区别您提到的代码： prompt_embedding = initial_embedding.clone().requires_grad_(True) optimizer = torch.optim.Adam([prompt_embedding...

编程新知 2025/7/4 0:50:01

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

3-11单元格区域边界定位(End属性)学习笔记

返回一个Range 对象，只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意：它移动的位置必须是相连的有内容的单元格…...

编程新知 2026/2/9 15:39:14

回溯算法学习

一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...

编程新知 2026/1/24 12:01:38

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

在2025年的AI硬件浪潮中，苹果AI眼镜（Apple Glasses）正在引发一场关于“人机交互形态”的深度思考。它并非简单地替代AirPods或Apple Watch，而是开辟了一个全新的、日常可接受的AI入口。其核心价值不在于功能的堆叠，而在于如何通过形态设计打破社交壁垒，成为用户“全天佩戴…...

编程新知 2025/12/22 12:09:15

Kubernetes 节点自动伸缩（Cluster Autoscaler）原理与实践

在 Kubernetes 集群中，如何在保障应用高可用的同时有效地管理资源，一直是运维人员和开发者关注的重点。随着微服务架构的普及，集群内各个服务的负载波动日趋明显，传统的手动扩缩容方式已无法满足实时性和弹性需求。 Cluster Auto…...

编程新知 2026/1/24 16:55:05

webpack面试题

面试题：webpack介绍和简单使用一、webpack（模块化打包工具）1. webpack是把项目当作一个整体，通过给定的一个主文件，webpack将从这个主文件开始找到你项目当中的所有依赖文件，使用loaders来处理它们&#x…...

编程新知 2025/10/19 1:38:36

前端 vue3 对接科大讯飞的语音在线合成API

相关文章：

前端 vue3 对接科大讯飞的语音在线合成API

缺省参数

Stable Diffusion绘画 | 来训练属于自己的模型：炼丹启动

08_OpenCV文字图片绘制

【笔记】选择题笔记+数据结构笔记

浅谈汽车智能座舱如何实现多通道音频

系统架构设计师教程第13章 13.1层次式体系结构概述笔记

cnn突破一（先搞定三层反馈神经网络bpnet，c#实现）

如何创建一个docker，给它命名，且下次重新打开它

【D3.js in Action 3 精译_025】3.4 让 D3 数据适应屏幕（中）—— 线性比例尺的用法

Python的多线程与多进程：并发编程基础与实战

HarmonyOS Next应用开发——响应式布局之媒体查询

240 搜索二维矩阵 II

jenkins微服务

【Kotlin基于selenium实现自动化测试】初识selenium以及搭建项目基本骨架(1)

汽车追尾为什么是后车的责任？

[运维]4.bookinfo无法部署的问题

ACT调试pycharm报错

记一次控件提升后，运行却不显示的Bug

关于深度学习torch的环境配置问题

大数据学习栈记——Neo4j的安装与使用

MFC内存泄露

JUC笔记(上)-复习涉及死锁 volatile synchronized CAS 原子操作

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

Redis数据倾斜问题解决

3-11单元格区域边界定位(End属性)学习笔记

回溯算法学习

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

Kubernetes 节点自动伸缩（Cluster Autoscaler）原理与实践

webpack面试题