当前位置：首页 > article >正文

Web Speech API 实现语音识别

article 2026/4/17 22:43:02

场景很简单就是当用户长按按钮说话之后可以将识别到的语音转为文字效果图如下长按转换文字断句动态拼接分隔符识别的文字由浮层展示光标在哪语音插入到哪支持中途编辑清除文本和复制文本长按按钮有动画效果需要解决的核心问题recognition.start() 不是立即开始录音用户如果刚按下按钮就开始说话很可能语音没有被录到因此需要做一个延迟的处理。result.isFinal 这个方法只有在断句之前才进行一次拼接就会给用户延迟显示文本的情况我们需要 “边说边出字”一起来看完整代码template div classvoice-wrapper div classinput-container textarea reftextareaRef v-modeldisplayText classresult-box placeholder语音识别内容会显示在这里可直接编辑/textarea tiny-icon-copy v-if!copied classinput-icon copy-icon clickhandleCopy / tiny-icon-yes v-else classinput-icon copy-icon / tiny-icon-clear v-if!deleted classinput-icon clear-icon clickhandleClear / tiny-icon-yes v-else classinput-icon clear-icon / /div div classbtn-container div v-iftempText classfloat-temp-text {{ tempText }} /div button idrecordBtn :class{ recording: isRecording } mousedownstartRecord touchstart.preventstartRecord mouseup.stopstopRecord touchend.stopstopRecord tiny-icon-mic classmic-icon / /button /div /div /template script setup import { ref, nextTick, onMounted } from vue import { IconMic, IconCopySolid, IconRichTextDeleteTable, IconYes } from opentiny/vue-icon const TinyIconMic IconMic() const TinyIconYes IconYes() const TinyIconCopy IconCopySolid() const TinyIconClear IconRichTextDeleteTable() const textareaRef ref(null) const isRecording ref(false) const isPressing ref(false) const displayText ref() const tempText ref() const copied ref(false) const deleted ref(false) let copyTimer null let deleteTimer null let lastProcessedIndex 0 const Recognition window.SpeechRecognition || window.webkitSpeechRecognition const recognition new Recognition() recognition.lang zh-CN recognition.continuous true recognition.interimResults true recognition.onresult (e) { let finalChunk let interimChunk for (let i lastProcessedIndex; i e.results.length; i) { const result e.results[i] if (!result.isFinal) continue const transcript result[0].transcript.trim() if (!transcript) continue finalChunk transcript lastProcessedIndex i 1 } const lastResult e.results[e.results.length - 1] if (lastResult !lastResult.isFinal) { interimChunk lastResult[0].transcript.trim() } if (finalChunk) { tempText.value insertAtCursor(finalChunk) } tempText.value interimChunk } recognition.onaudiostart () { if (isPressing.value) isRecording.value true else recognition.stop() } recognition.onend () { if (isPressing.value) setTimeout(() safeStart(), 50) } function insertAtCursor(text) { const el textareaRef.value if (!el) return const start el.selectionStart const end el.selectionEnd const val displayText.value const before val.substring(0, start) const after val.substring(end) const isNewParagraph start 0 const lastChar before.slice(-1) const isAlreadyPunctuation /[。、]/g.test(lastChar) const needComma before !isNewParagraph !isAlreadyPunctuation const insert needComma ? text : text displayText.value before insert after nextTick(() { const newPos start insert.length el.setSelectionRange(newPos, newPos) }) } function safeStart() { try { recognition.start() } catch {} } function startRecord(e) { e?.preventDefault() if (isPressing.value) return lastProcessedIndex 0 isPressing.value true safeStart() } function stopRecord() { isPressing.value false if (isRecording.value) { recognition.stop() isRecording.value false setTimeout(() tempText.value , 400) } } const handleCopy async () { try { await navigator.clipboard.writeText(displayText.value) copied.value true clearTimeout(copyTimer) copyTimer setTimeout(() copied.value false, 2000) } catch {} } function handleClear() { deleted.value true clearTimeout(deleteTimer) deleteTimer setTimeout(() deleted.value false, 2000) displayText.value } onMounted(() { try { recognition.start(); recognition.stop() } catch {} }) /script style scoped .voice-wrapper { position: fixed; top: 0; left: 0; right: 0; bottom: 0; display: flex; flex-direction: column; background: #fff; box-sizing: border-box; } .input-container { position: relative; flex: 1; padding: 15px; display: flex; flex-direction: column; min-height: 0; } .result-box { flex: 1; width: 100%; padding: 12px; font-size: 16px; line-height: 1.6; border: 1px solid #eee; border-radius: 8px; resize: none; outline: none; box-sizing: border-box; overflow-y: auto; } .btn-container { position: relative; padding: 20px 0; display: flex; justify-content: center; align-items: center; border-top: 1px solid #f5f5f5; background: #fff; } .float-temp-text { position: absolute; bottom: 100px; left: 50%; transform: translateX(-50%); background: rgba(0, 0, 0, 0.6); color: #fff; padding: 6px 12px; border-radius: 6px; font-size: 14px; white-space: nowrap; pointer-events: none; z-index: 10; max-width: 80%; overflow: hidden; text-overflow: ellipsis; } #recordBtn { position: relative; width: 68px; height: 68px; background: #42b983; border: none; border-radius: 50%; display: flex; align-items: center; justify-content: center; cursor: pointer; user-select: none; } #recordBtn.recording { background: #2f9e6e; transform: scale(1.08); box-shadow: 0 0 0 6px rgba(66, 185, 131, 0.25); } #recordBtn.recording::after { content: ; position: absolute; inset: 0; border-radius: 50%; background: rgba(66, 185, 131, 0.35); animation: pulse 1.5s infinite; } keyframes pulse { 0% { transform: scale(1); opacity: 0.6; } 100% { transform: scale(1.6); opacity: 0; } } #recordBtn:active { background: #359469; } .input-icon { position: absolute; font-size: 24px; bottom: 25px; fill: #323233; cursor: pointer; } .copy-icon { right: 60px; } .clear-icon { right: 25px; } .mic-icon { fill: #fff; font-size: 30px; } /style

Web Speech API 实现语音识别

相关文章：

Web Speech API 实现语音识别

微信读书的划线，同步到 Notion 只是开始；接上 AI 才算“拥有“

从复古游戏到电子墨水屏：聊聊Floyd-Steinberg抖动算法的那些神奇应用场景

告别base环境自动激活：CentOS7安装Miniconda后必做的几项贴心配置

嵌入式老鸟的VSCode私房插件清单：除了C/C++，这些调试和效率工具让你事半功倍

大模型RAG （一）

深度剖析：LangGraph中的状态管理与循环逻辑

微软新 Xbox 负责人阿莎·夏尔马忙不停：Game Pass 定价待调，“螺旋计划”影响几何？

vivo X300 Ultra长焦套件集市游玩体验佳，小巧轻便成家庭出游必备！

RAG基本流程

Super Qwen Voice World智能语音助手开发：基于Python的完整项目实战

如何监控AWR数据收集Job_DBA_SCHEDULER_JOBS中的BSLN_MAINTAIN_STATS

【Gartner 2024 DevOps趋势验证】：已上线智能代码生成的团队，MTTR缩短61%，但89%未启用变更影响分析——你的流水线安全吗？

Py之pycocotools：从COCO数据加载到自定义标注可视化的实战指南

阿里云国际版防火墙规则：从安全组配置到流量过滤的深度实操

2026届最火的十大降AI率方案实测分析

2026奇点智能技术大会核心成果发布（AI文档生成引擎v3.2正式开源）

ComfyUI-Impact-Pack终极指南：如何快速掌握AI图像增强与面部细化技术

20天速通LeetCode day07：前缀和

给数学恐惧者的图解：用几何直觉理解SVM中的对偶问题与KKT条件

Python实战：从零实现Transformer中的多头注意力机制

Jupyter Notebook代码补全插件安装踩坑实录：从nbextensions不显示到完美解决（Anaconda环境）

若依WMS仓库管理系统：企业级仓储管理的现代化解决方案

从零搭建思澈科技SiFli-Solution开发环境：避坑指南与实战演练

Python实现图形化井字棋——人机对战

MOPSO算法实战：如何用它搞定你的多目标优化项目？（从理论到调参全解析）

5分钟上手LogcatReader：安卓设备日志查看神器

【2026奇点智能技术大会权威解码】：AI原生数据结构生成的5大范式跃迁与工程落地路径

科学图像分析难题破解：3个步骤让Fiji成为你的得力助手

英雄联盟智能工具箱：重新定义你的游戏体验