当前位置：首页 > article >正文

【前端 vue 或者麦克风，智能语音识别和播放功能】

article 2026/2/26 6:18:21

前端 vue 或者麦克风，智能语音识别和播放功能

1. 终端安装

npm install recordrtc

2.引入

import RecordRTC from 'recordrtc'

3.html（根据自己业务更改）

<div class="Page"><el-form ref="mainFormRef" class="mainForm" :model="main_form" label-width="100px" label-position="top"><el-form-item :label="'热词设置:\n(一行一个关键字，空格隔开权重,如将1号屏和3号屏调换 20)'"><el-input type="textarea" v-model="main_form.hotWords" placeholder="请输入热词":autosize="{ minRows: 5, maxRows: 15 }"></el-input></el-form-item><el-form-item label="语音识别结果显示:"><div :class="resultDetails && resultDetails.status <= 0 ? 'result_content r_h_input_red' : 'result_content'">{{main_form.result }}</div></el-form-item><el-form-item label="声纹采集:" prop="file"><div class="voiceGather_btn"><el-select :disabled="voiceStatus" style="width: 100%" v-model="main_form.chooseMicDeviceId"placeholder="请选择麦克风"><el-option v-for="item in Mic" :key="item.deviceId" :label="item.label" :value="item.deviceId"></el-option></el-select><div class="voiceGather" v-if="main_form.chooseMicDeviceId != ''"><el-button style="margin-left: 20px" @click="voiceInput" :loading="startLoading">{{ voiceStatus ? "取消录音" :"开始录音" }}</el-button></div></div><div class="voiceGather_btn"><audio controls v-if="recordedBlob" :src="recordedBlob"></audio></div></el-form-item></el-form></div>

4.data初始化数据

data() {return {recorder: '',voiceStatus: false, // 是否正在录音main_form: {chooseMicDeviceId: '', // 选择的麦克风idhotWords: '', // 热词result: '', // 语音识别结果},Mic: [], // 可选择的麦克风RMSList: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0,],audioURL: null,file: null,resultDetails: {},//语音识别结果startLoading: false,recordedBlob: null, // Blob对象存储录制内容};},

5.mounted获取getMic

mounted() {this.getMic()
}

6.methods中开始录音和结束之后上传到后台服务器

methods() {getMic() {let that = this;if (navigator.mediaDevices && navigator.mediaDevices.getUserMedia) {// 弹框获取麦克风navigator.mediaDevices.getUserMedia({ audio: true }).then((stream) => {navigator.mediaDevices.enumerateDevices().then(function (devices) {devices.forEach(function (device) {if (device.kind === 'audioinput') { // 麦克风if (device.deviceId != 'default' && device.deviceId != 'communications') {that.Mic.push(device)}}that.main_form.chooseMicDeviceId = that.Mic[0] ? that.Mic[0].deviceId : ''});})stream.getTracks().forEach(track => track.stop());})}},// 语音输入点击按钮事件voiceInput() {// 正在语音输入if (this.voiceStatus) {this.stopRecord() // 停止输入} else { // 开启语音输入this.resultDetails ={}this.main_form.result = ''this.recordedBlob = nullthis.startRecord()}},// 开始录音startRecord() {console.log('startRecord:鼠标摁下------------------------------')var that = thisthis.voiceStatus = true// mediaDevices可提供对相机和麦克风等媒体输入设备的连接访问window.navigator.mediaDevices.getUserMedia({ audio: { deviceId: this.main_form.chooseMicDeviceId } }).then((stream) => {this.stream = stream;this.getVoice()this.recorder = RecordRTC(stream, {type: 'audio',// 音频 或者videomimeType: 'audio/wav',recorderType: RecordRTC.StereoAudioRecorder,desiredSampRate: 16000,numberOfAudioChannels: 1, // 单声道timeSlice: 1000,// bufferSize: 4096, // 缓存大小ondataavailable: this.sendData,});this.recorder.startRecording();}).catch(function (err) {alert('当前浏览器不支持开启麦克风!');that.voiceStatus = false});},// 获取到文件流（没用到这个函数内容，可以忽略）sendData(blob) {return//var BB = new Blob([blob], { 'type': 'audio/wav; codecs=opus' })// var audioURL = window.URL.createObjectURL(BB)// 播放// const audio = document.createElement('audio')// audio.controls = true // 音频是否显示控件// audio.src = audioURL// audio.play()// 下载// let a = document.createElement("a");// a.href = audioURL;// a.download = '测试';// a.click();// // 释放这个临时的对象url// window.URL.revokeObjectURL(audioURL);// let file = new window.File([BB], '测试.wav')// this.file = file// console.log('录音已停止，文件已保存---------------------', this.file);},// 结束录音stopRecord() {console.log('stopRecord:鼠标放开------------------------------')if (this.recorder != null) {this.startLoading = truelet recorder = this.recorder// 处理停止事件recorder.stopRecording(() => {const blob = this.recorder.getBlob(); // 获取Blob对象this.recordedBlob = URL.createObjectURL(blob);// 创建URL对象，用于<audio>标签播放// console.log('录音已停止，文件已保存---------------------', this.recordedBlob);var BB = new Blob([blob], { 'type': 'audio/wav; codecs=opus' })let file = new window.File([BB], '测试.wav')this.file = fileconsole.log('获取到文件流上传到后台---------------------', this.file);this.uploadSubmit();});let stream = this.stream;clearInterval(this.timer1);stream.getAudioTracks().forEach(track => track.stop());}},// 上传到后台服务器uploadSubmit() {uploadAudio(this.file, this.main_form.hotWords).then(res => {this.resultDetails = res.data.data || {}this.main_form.result = res.data.data.result || ''this.voiceStatus = falsethis.startLoading = false}).catch(err => {this.voiceStatus = falsethis.startLoading = false})},// 获取音量值大小getVoice() {const audioContext = new (window.AudioContext || window.webkitAudioContext)()// 将麦克风的声音输入这个对象const mediaStreamSource = audioContext.createMediaStreamSource(this.stream)// 创建分析节点const analyserNode = audioContext.createAnalyser()// 连接节点mediaStreamSource.connect(analyserNode)// 可以实时听到麦克风采集的声音// analyserNode.connect(audioContext.destination)// 获取音量数据const dataArray = new Uint8Array(analyserNode.frequencyBinCount);function getVolume() {analyserNode.getByteFrequencyData(dataArray);let sum = 0;for (let i = 0; i < dataArray.length; i++) {sum += dataArray[i];}// 计算平均音量const averageVolume = sum / dataArray.length;return averageVolume;}// 每隔一段时间获取一次音量this.timer1 = setInterval(() => {const volume = getVolume();console.log('音量:', Math.round(volume));// this.RMSList.value.unshift(Math.round(volume));// this.RMSList.value.pop();// 在这里可以根据需要进行相应的处理}, 1000);},
}

【前端 vue 或者麦克风，智能语音识别和播放功能】

前端 vue 或者麦克风，智能语音识别和播放功能 1. 终端安装 npm install recordrtc2.引入 import RecordRTC from recordrtc3.html（根据自己业务更改） <div class"Page"><el-form ref"mainFormRef" class&qu…...

编程日记 2025/12/22 23:17:23

122.买卖股票的最佳时机II (1)题目描述: (2)解题思路: class Solution { public:int maxProfit(vector<int>& prices) {int result 0;for (int i 1; i < prices.size(); i) {result max(prices[i] - prices[i - 1], 0);}return result;} }; (3)总结: 1.假…...

编程日记 2026/2/20 22:14:00

Python---数据分析(Pandas十一:二维数组DataFrame统计计算二)

1、std 用于计算 DataFrame 中数值的标准差。 DataFrame.std(axis0, skipnaTrue, ddof1, numeric_onlyFalse, **kwargs) 描述说明axis {0 或 ‘index’, 1 或 ‘columns’, None}, 默认为 0。这个参数决定了计算标准差是在哪个轴上进行： 如果 axis0 或 axisindex&…...

编程日记 2026/2/25 23:45:25

OpenCV平滑处理：图像去噪与模糊技术详解

引言在图像处理中，噪声是一个常见的问题，它可能来自于图像采集设备、传输过程或环境干扰。为了去除噪声并改善图像质量，平滑处理（Smoothing）是一种常用的技术。OpenCV提供了多种平滑处理方法，包括均值滤波…...

编程日记 2026/2/20 17:12:32

【LeetCode】大厂面试算法真题回忆(36)--相同数字的积木游戏

题目描述小华和小薇一起通过玩积木游戏学习数学。他们有很多积木，每个积木块上都有一个数字，积木块上的数字可能相同。小华随机拿一些积木挨着排成一排，请小薇找到这排积木中数字相同且所处位置最远的2块积木块，计算他们的距离…...

编程日记 2026/2/16 1:20:13

使用Python将视频转化为gif

使用Python将视频转化为gif 一、前言二、准备三、测试一、前言最近想把喜欢的视频片段作成gif，就试着用Python做了下，感觉效果还行，这里做个记录。二、准备先下载安装对应的库，命令如下： pip install moviepy …...

编程日记 2026/2/15 5:54:20

HTTP长连接与短连接的前世今生

HTTP长连接与短连接的前世今生大家好！作为一名在互联网摸爬滚打多年的开发者，今天想跟大家聊聊HTTP中的长连接和短连接这个话题。记得我刚入行时，对这些概念一头雾水，希望这篇文章能帮助新入行的朋友少走些弯路。什么是HTTP…...

编程日记 2026/2/24 17:53:16

批量将 PPT 文档中的图片提取到文件夹

在 PPT 文档中我们可以插入很多的图片来丰富我们的幻灯片页面，但是当我们需要将 PPT 幻灯片中的图片提取出来的时候，会非常的麻烦，因为我们需要打开 PPT 然后将图片保存起来。会非常的耗费我们的时间和精力。今天给大家介绍的就是一种批量将 …...

编程日记 2026/2/24 21:44:49

yolo目标检测算法在DJI上的研究分析（大纲）

yolo目标检测算法在DJI上的研究分析面向边缘计算的实时目标检测系统设计与部署第一章绪论 1.1 研究背景与意义目标检测技术需求： DJI设备（如无人机、摄像头）在安防、巡检、农业等场景中的广泛应用现有YOLO算法在高分辨率图像或资源受限…...

编程日记 2026/2/24 14:22:48

图像处理篇：图像预处理——从数据到模型的桥梁

图像预处理是计算机视觉任务中至关重要的一环，它直接影响模型的训练效果和推理性能。无论是深度学习还是传统机器学习，图像预处理都是不可或缺的步骤。本文将深入探讨图像预处理的核心技术、常见方法及其在实际应用中的最佳实践，帮助你从零开…...

编程日记 2026/2/19 7:55:36

MyBatisPlus（SpringBoot版）学习第二讲：基本CRUD

目录 1.BaseMapper 2. 基本CRUD 1. 插入一条记录 2. 删除 1>. 根据ID删除 2>. 根据实体（ID）删除 3>. 根据columnMap条件删除 4>. 根据entity条件删除 5>. 根据ID批量删除 3. 修改 1>. 根据ID修改 2>. 根据whereEntity条…...

编程日记 2026/2/21 16:50:00

SAP-ABAP：SAP系统架构技术白皮书

SAP系统架构技术白皮书模块化设计高性能扩展智能优化一、核心架构：三层模型技术解析架构拓扑图 [用户端] ←HTTP/DIAG→ [应用服务器集群] ←SQL→ [数据库服务器] │ │ └─SAP GUI/Web───┘ 分层技术指标对比架构层组件构成性能…...

编程日记 2026/2/22 10:20:00

Django REST Framework 请求封装源码解析与实现流程

版本说明： Django: V4.2.20 Django Rest Framework: V3.15.2 一、核心封装流程示意图 #mermaid-svg-qXJLIa9Bx1TCiPSN {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-qXJLIa9Bx1TCiPSN .error-icon{fill…...

编程日记 2026/2/20 19:38:20

RK3588开发笔记-buildroot添加telnet服务

目录前言一、Telnet服务背景与适用场景二、telnet服务开启 Busybox 配置三、固件编译及烧录 RK3588烧录验证客户端连接测试 3.1 Linux/MacOS连接 3.2 Windows连接总结前言本文主要介绍在RK3588 SDK文件包中添加telnet服务，由于sdk buildroot默认添加的是ssh服…...

编程日记 2026/2/15 18:01:50

基于Spring Boot的企业内管信息化系统的设计与实现（LW+源码+讲解）

专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌。技术范围：SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：…...

编程日记 2026/2/19 3:08:20

Bitcoin Thunderbolt 内测通道开启，加速比特币交易新时代

比特币作为全球领先的加密货币，一直占据着去中心化金融的核心地位。然而，随着比特币生态的不断扩展，其交易速度和扩容问题逐渐成为制约发展的关键瓶颈。为解决这一难题， 比特币雷电网络（Bitcoin Thunderbolt&#xff0…...

编程日记 2026/2/19 20:08:04

STM32 模拟SPI 模式0

SPI 模式 0 的时钟极性（CPOL）为 0，时钟相位（CPHA）为 0。CPOL 0 意味着时钟信号空闲时为低电平，CPHA 0 表示在时钟信号的第一个跳变沿（上升沿）进行数据采样。 #include "stm3…...

编程日记 2026/2/24 19:00:25

QT笔记----QCheckBox

文章目录概要1、QCheckBox 的基本概念2、单个QCheckBox3、多个QCheckBox同时应用3.1、实现效果3.2、实现Demo 概要在 Qt 应用程序开发中，QCheckBox 是一个常用的用户界面元素，它允许用户在两种状态（选中和未选中）之间进行切换&a…...

编程日记 2026/2/21 7:44:28

GR00T N1——英伟达开源的通用人形VLA：类似Helix的快与慢双系统，且可类似ViLLA利用海量的无标注视频做训练

前言就在昨天3.19日的凌晨，英伟达发布的GR00T N1还是很有含金量的(上午已有好几个朋友私我了)，由此可以看到很多相关工作的影子，比如helix π0 LAPA，具体而言，其具有双系统架构 VLM模块(系统2)通过视觉和语言指令解…...

编程日记 2026/2/25 7:32:19

Bash 脚本基础

一、Bash 脚本基础什么是 Bash 脚本：Bash 脚本是一种文本文件，其中包含了一系列的命令，这些命令可以被 Bash shell 执行。它用于自动化重复性的任务，提高工作效率。 Bash 脚本的基本结构：以 #!/bin/bash 开头&#x…...

编程日记 2026/2/13 14:06:56

SQLite Delete 语句详解

SQLite Delete 语句详解 SQLite 是一种轻量级的数据库管理系统，广泛应用于移动设备、嵌入式系统和服务器端应用。在数据库管理中，删除数据是一项基本操作。SQLite 提供了强大的删除功能，本文将详细介绍 SQLite 的 Delete 语句及其用法。 1.…...

编程日记 2025/12/21 20:42:15

Mysql深分页的解决方案

在数据量非常大的情况下，深分页查询则变得很常见，深分页会导致MySQL需要扫描大量前面的数据，从而效率低下。例如，使用LIMIT 100000, 10时，MySQL需要扫描前100000条数据才能找到第10000页的数据。在MySQL中解决深分页…...

编程日记 2026/1/23 11:12:09

数据建模流程: 概念模型＞＞逻辑模型＞＞物理模型

数据建模流程概念模型概念模型是一种高层次的数据模型，用于描述系统中的关键业务概念及其之间的关系。它主要关注业务需求和数据需求，而不涉及具体的技术实现细节。概念模型通常用于在项目初期帮助业务人员和技术人员达成共识，确保对业务需…...

编程日记 2026/2/23 2:48:47

光谱仪与光谱相机的核心区别与协同应用

一、核心功能与数据维度 ‌光谱仪‌ ‌功能定位‌：专注单点或线状区域的光谱分析，通过色散元件（光栅/棱镜）分离波长，生成一维或二维光谱曲线，用于量化光强、吸收率等参数‌。 ‌数据维度‌：输…...

编程日记 2026/2/21 1:20:35

路由工程师大纲-2：结合AI技术构建路由拓扑与BGP异常检测的知识链体系

一、领域交叉技术图谱 1. 路由拓扑测绘：图神经网络（GNN）：建模网络结构，预测链路稳定性。复杂网络分析：计算节点中心性（如PageRank）、社区发现（Louvain算法）。可视化工具：Gephi/NetworkX + PyTorch Geometric（图嵌入）。2. BGP异常检测：时间序列模型：LSTM/Tran…...

编程日记 2026/1/9 3:55:06

运行时智控：PanLang 开发者指南（一）运行时系统核心模块实现——PanLang 原型全栈设计方案与实验性探索5

运行时智控：PanLang 开发者指南（一）运行时系统核心模块实现——PanLang 原型全栈设计方案与实验性探索5 文章目录运行时智控：PanLang 开发者指南（一）运行时系统核心模块实现——PanLang 原型全栈设计方案与…...

编程日记 2026/2/15 6:18:34

再次理解 Spring 中的 IOC、DI、AOP 与多态

目录引言 1. IOC（控制反转） 1.1 什么是 IOC？ 1.2 IOC 的核心思想 1.3 IOC 的实现 2. DI（依赖注入） 2.1 什么是 DI？ 2.2 DI 的实现方式 2.3 DI 的核心作用 3. AOP（面向切面编程&#x…...

编程日记 2025/12/26 17:05:41

rocky linux 与centos系统的区别

Rocky Linux 和 CentOS 都是基于 Red Hat Enterprise Linux（RHEL）的社区发行版，但两者在目标定位、更新策略和社区管理上有显著差异。以下是核心区别的详细对比： 一、背景与定位特性Rocky LinuxCentOS起源由 CentOS 联合创始人…...

编程日记 2025/12/14 13:41:13

操作系统导论——第13章抽象：地址空间

一、早期系统从内存来看，早期的机器并没有提供多少抽象给用户。基本上，机器的物理内存如图13.1所示操作系统曾经是一组函数（实际上是一个库），在内存中（在本例中，从物理地址0开始）&…...

编程日记 2026/2/25 6:42:27

C# 调用 VITS，推理模型将文字转wav音频net8.0 跨平台

一、系统环境操作系统：win10，win11 运行环境：dotnet8 工具:命令行，powershell 开源库:sherpa-onnx 二、工具和源码下载开源库:https://k2-fsa.github.io/sherpa/onnx/index.html 运行环境下载 https://dotnet.microsoft.c…...

编程日记 2026/2/17 22:50:57

【前端 vue 或者麦克风，智能语音识别和播放功能】

前端 vue 或者麦克风，智能语音识别和播放功能

1. 终端安装

2.引入

3.html（根据自己业务更改）

4.data初始化数据

5.mounted获取getMic

6.methods中开始录音和结束之后上传到后台服务器

相关文章：

【前端 vue 或者麦克风，智能语音识别和播放功能】

3.23 代码随想录第二十四天打卡

Python---数据分析(Pandas十一:二维数组DataFrame统计计算二)

OpenCV平滑处理：图像去噪与模糊技术详解

【LeetCode】大厂面试算法真题回忆(36)--相同数字的积木游戏

使用Python将视频转化为gif

HTTP长连接与短连接的前世今生

批量将 PPT 文档中的图片提取到文件夹

yolo目标检测算法在DJI上的研究分析（大纲）

图像处理篇：图像预处理——从数据到模型的桥梁

MyBatisPlus（SpringBoot版）学习第二讲：基本CRUD

SAP-ABAP：SAP系统架构技术白皮书

Django REST Framework 请求封装源码解析与实现流程

RK3588开发笔记-buildroot添加telnet服务

基于Spring Boot的企业内管信息化系统的设计与实现（LW+源码+讲解）

Bitcoin Thunderbolt 内测通道开启，加速比特币交易新时代

STM32 模拟SPI 模式0

QT笔记----QCheckBox

GR00T N1——英伟达开源的通用人形VLA：类似Helix的快与慢双系统，且可类似ViLLA利用海量的无标注视频做训练

Bash 脚本基础

SQLite Delete 语句详解

Mysql深分页的解决方案

数据建模流程: 概念模型＞＞逻辑模型＞＞物理模型

光谱仪与光谱相机的核心区别与协同应用

路由工程师大纲-2：结合AI技术构建路由拓扑与BGP异常检测的知识链体系

运行时智控：PanLang 开发者指南（一）运行时系统核心模块实现——PanLang 原型全栈设计方案与实验性探索5

再次理解 Spring 中的 IOC、DI、AOP 与多态

rocky linux 与centos系统的区别

操作系统导论——第13章抽象：地址空间

C# 调用 VITS，推理模型将文字转wav音频net8.0 跨平台