当前位置: 首页 > news >正文

iOS如何实现语音转文字功能?

1.项目中添加权限

Privacy - Speech Recognition Usage Description : 需要语音识别权限才能实现语音转文字功能

2.添加头文件

#import <AVFoundation/AVFoundation.h>

#import<Speech/Speech.h>

3.实现语音转文字逻辑:

3.1 根据wav语音文件创建请求

    SFSpeechURLRecognitionRequest *recognitionRequest= [[SFSpeechURLRecognitionRequest alloc] initWithURL:[NSURL fileURLWithPath:wavFilePath]];

3.2 创建语言配置

    SFSpeechRecognizer *recongnizer= [[SFSpeechRecognizer alloc] initWithLocale:[[NSLocale alloc] initWithLocaleIdentifier:@"zh_CN"]];

3.2 根据请求和语言配置创建任务,同时设置代理<SFSpeechRecognitionTaskDelegate>对象为自己

    SFSpeechRecognitionTask *task == [recongnizer recognitionTaskWithRequest:recognitionRequest delegate:self];

3.3 取消方法:

    [task cancel];

3.4 代理方法:

// Called for all recognitions, including non-final hypothesis
- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didHypothesizeTranscription:(SFTranscription *)transcription{NSLog(@"转换中...");
}// Called when recognition of all requested utterances is finished.
// If successfully is false, the error property of the task will contain error information
- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didFinishSuccessfully:(BOOL)successfully{NSLog(@"转换完成 是否成功:%d",successfully);}

以上为针对单个语音文件转文字的整体逻辑

在实际使用中,会涉及到多条语音转文字,此时有一个环节需要注意:

当我们进行多条语音转文字时,可以将上述逻辑封装为一个一个类个体,每进行一条语音转文字时,创建一个对象进行处理

用多个对象来进行各自的语音转文字行为.

但是!!!这是行不通的.

因为即使每一个语音转文字逻辑是一个对象个体,但依然在未处理完当前的任务时,处理下一个语音转文字,会导致当前的语音转文字行为直接终止,并失败.

所以,针对这块儿,可以做成队列形式,也就是当有多个语音转文字的操作时,我们是可以将这多个任务添加到队列中,并依次执行.(这里队列是用数组方式实现)

最后展示实际代码截图

调用方式:

具体demo可以参考链接

https://gitee.com/huanxin666/EMDemo-oc

语音消息长按可显示出转文字的按钮,点击转文字即可进行转换

效果如下

Demo演示iOS语音转文字实现

相关文章:

iOS如何实现语音转文字功能?

1.项目中添加权限 Privacy - Speech Recognition Usage Description : 需要语音识别权限才能实现语音转文字功能 2.添加头文件 #import <AVFoundation/AVFoundation.h> #import<Speech/Speech.h> 3.实现语音转文字逻辑: 3.1 根据wav语音文件创建请求 SFSpeechU…...

【下载器篇】获取微软应用商店应用安装包的方法

【下载器篇】获取微软应用商店应用安装包的方法 微软应用商店历史版本应用下载方法&#xff0c;部分历史版本无法搜索到—【蘇小沐】 文章目录 【下载器篇】获取微软应用商店应用安装包的方法1.实验环境 &#xff08;一&#xff09;微软商店的在线链接生成器1、复制该应用的在…...

云安全—集群攻击入口攻与防

0x00 前言 说到云安全肯定不能避免的是集群相关的内容&#xff0c;最出色的就是Kubernetes&#xff0c;也就是k8s。当然docker相关的内容也算是集群的一部分。但是docker容器本身的问题还是归属于容器本身。 0x01 概述 在集群攻击入口处的内容主要为&#xff1a; 应用安全恶…...

“传统”开发与AI开发的区别与联系(更新了GPT3.5的反馈)

1、传统开发的算法和软件整体&#xff0c;也可以看成是一个“大模型”&#xff0c;其中有不同层次的处理&#xff0c;最终能够完成从输入到输出的计算&#xff0c;不过&#xff0c;其中的计算都是人工定义的&#xff0c;一般依赖于研究成果的应用。研究成果在实际中的应用处理。…...

Unity 文字显示动画(2)

针对第一版的优化&#xff0c;自动适配文字大小&#xff0c;TextMeshPro可以拓展各种语言。第一版字母类语言效果更好。 using System.Collections; using System.Collections.Generic; using TMPro; using UnityEngine; using UnityEngine.UI;public partial class TextBeat…...

力扣每日一题53:最大子数组和

题目描述&#xff1a; 给你一个整数数组 nums &#xff0c;请你找出一个具有最大和的连续子数组&#xff08;子数组最少包含一个元素&#xff09;&#xff0c;返回其最大和。 子数组 是数组中的一个连续部分。 示例 1&#xff1a; 输入&#xff1a;nums [-2,1,-3,4,-1,2,1,…...

图论04-【无权无向】-图的广度优先遍历

文章目录 1. 代码仓库2. 广度优先遍历图解3.主要代码4. 完整代码 1. 代码仓库 https://github.com/Chufeng-Jiang/Graph-Theory 2. 广度优先遍历图解 3.主要代码 原点入队列原点出队列的同时&#xff0c;将与其相邻的顶点全部入队列下一个顶点出队列出队列的同时&#xff0c;将…...

layui的一些问题

为什么table.render, ins1.config有时候获取的值是上一次的?例如ins1.conf.page.curr? 这是一段table.render代码 let ins1 table.render({...})一般情况下ins1.conf可以获得表格的当前页,页数等;但是有时候获得的页数是上一次的;主要是因为在table.reload后没有继续赋值的…...

设计模式_中介者模式

中介者模式 介绍 设计模式定义案例问题堆积在哪里解决办法中介者代替了多个对象之间的互动 使对象1 2 3 之间的互动 变为&#xff1a; 对象1->中介 对象2->中介 对象3->中介好友之间 约饭好友1 通知 好友2 -3 -4 等等加一个群 谁想吃饭就 通知一下 类图 代码 角色 …...

062:mapboxGL通过jumpTo方式跳转到某位置

第062个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+mapbox中通过jumpTo方式跳转到某位置。 直接复制下面的 vue+mapbox源代码,操作2分钟即可运行实现效果 文章目录 示例效果配置方式示例源代码(共122行)相关API参考:专栏目标示例效果 配置方式 1)查看基础设置…...

学成在线第一天-课程内容管理服务搭建以及查询课程接口设计

目录 一、搭建课程内容管理服务 二、设计接口 三、面试题 四、总结 一、搭建课程内容管理服务 没什么好说的&#xff0c;直接就是创建内容模块 然后这个继承父模块&#xff0c;然后再课程内容模块下面创建三个子模块&#xff0c;model、sevice、controller model依赖base…...

4.7 IP多播

思维导图&#xff1a; **4.7.1 IP多播的基本概念** --- **1. 定义和背景** - IP多播&#xff1a;从一个源点发送信息至多个终点的技术。 - 1988年&#xff1a;Steve Deering首次提及IP多播。 - 1992年&#xff1a;IETF进行了首次IP多播试验&#xff0c;当时有20个网点参与。 …...

XML与html解析,区别,如何使用

目录 简介: HTML&#xff08;超文本标记语言&#xff09;&#xff1a; 如何使用HTML&#xff1a; XML&#xff08;可扩展标记语言&#xff09;&#xff1a; 如何使用XML&#xff1a; 区别&#xff1a; 简介: XML&#xff08;可扩展标记语言&#xff09;和 HTML&#xff…...

【广州华锐互动】利用VR开展建筑塔吊安全操作学习的好处?

随着科技的不断发展&#xff0c;虚拟现实&#xff08;VR&#xff09;技术已经逐渐渗透到各个领域&#xff0c;为人们的生活带来了前所未有的便利。在工程教育领域&#xff0c;VR建筑塔吊安全操作学习作为一种新型的教学手段&#xff0c;正逐渐成为提高教学质量和培养高素质工程…...

分享一下怎么开发一个陪诊小程序

开发一个陪诊小程序需要综合考虑许多方面&#xff0c;包括但不限于市场需求、用户体验、技术实现和运营策略。以下是一篇以开发陪诊小程序为主题的文章。 一、背景介绍 随着社会的发展和人口老龄化的加剧&#xff0c;越来越多的老年人、病患和孕妇需要就医&#xff0c;而由于各…...

从一道面试题开始学习C++标准库提供的并发编程工具

一个空列表&#xff0c;用两个函数&#xff08;只可调用一次&#xff09;轮流写入值&#xff08;一个写奇数&#xff0c;一个写偶数&#xff09;&#xff0c; 最终实现列表的值为1-100&#xff0c;有序排列。 简单分析&#xff1a;假设这两个函数分别为A和B&#xff0c;A函数往…...

第三章 内存管理 十三、页面置换算法(最佳置换算法、先进先出置换算法、最近最久未使用置换算法、时钟置换算法、改进型的时钟置换算法)

目录 一、定义 二、分类 1、最佳置换算法 / 最远置换算法&#xff08;OPT&#xff0c;Optimal): 1.1、定义&#xff1a; 1.2、例子&#xff1a; 2、先进先出置换算法(FIFO&#xff09;: 2.1、定义&#xff1a; 2.2、实现方法&#xff1a; 2.3、例子&#xff1a; 3、最…...

连接到EC2,开启root登录

1.启动完新实例&#xff0c;下载密钥对密钥对登录 ssh -i "ec2-user.pem" ec2-userec2-xx-xx-xx-xx.compute-1.amazonaws.com2.为root设置密码 sudo passwd root3.切换到root权限 su root4.修改ssh配置文件&#xff0c;允许密码登陆 vi /etc/ssh/sshd_config Pas…...

线性代数-Python-02:矩阵的基本运算 - 手写Matrix及numpy中的用法

文章目录 一、代码仓库二、矩阵的基本运算2.1 矩阵的加法2.2 矩阵的数量乘法2.3 矩阵和向量的乘法2.4 矩阵和矩阵的乘法2.5 矩阵的转置 三、手写Matrix代码Matrix.pymain_matrix.pymain_numpy_matrix.py 一、代码仓库 https://github.com/Chufeng-Jiang/Python-Linear-Algebra-…...

6.MySQL内置函数

个人主页&#xff1a;Lei宝啊 愿所有美好如期而遇 日期函数 current_date() 当前日期 select 可以做表达式和函数的计算。 current_time() 当前时间 current_timestamp() 当前日期加时间 注意&#xff1a;值得说明的是这三个函数底层调用的都是同一个函数&#xff0c;只不…...

现货库存ADAU1701JSTZ-RL是TI的一款高性能、低功耗的28/56位音频数字信号处理器(DSP),广泛应用于对音质要求较高的便携式音频设备、汽车音响和多媒体扬声器系统中

ADAU1701JSTZ-RL‌ 是亚德诺&#xff08;ADI&#xff09;推出的一款高性能、低功耗的28/56位音频数字信号处理器&#xff08;DSP&#xff09;&#xff0c;广泛应用于对音质要求较高的便携式音频设备、汽车音响和多媒体扬声器系统中。该芯片集成了ADC、DAC与可编程音频处理功能&…...

微信视频通话时,你的声音和画面走了两条不同的路?一个Wireshark抓包实验告诉你真相

微信视频通话背后的传输路径之谜&#xff1a;用Wireshark揭开音视频分流的真相 当你和好友进行微信视频通话时&#xff0c;可能从未想过这样一个问题&#xff1a;你的声音和画面是否真的在同一条路径上传输&#xff1f;这个看似简单的日常功能背后&#xff0c;隐藏着令人惊讶的…...

如何为AndroidPdfViewer添加PDF打印功能:完整实现指南

如何为AndroidPdfViewer添加PDF打印功能&#xff1a;完整实现指南 【免费下载链接】AndroidPdfViewer Android view for displaying PDFs rendered with PdfiumAndroid 项目地址: https://gitcode.com/gh_mirrors/an/AndroidPdfViewer 你是否在为Android应用中集成PDF打…...

告别配置烦恼!Visual Studio 2022 + Python 3.11 下 Pybind11 环境搭建保姆级教程

告别配置烦恼&#xff01;Visual Studio 2022 Python 3.11 下 Pybind11 环境搭建保姆级教程 在C与Python混合开发领域&#xff0c;Pybind11凭借其轻量级和高效性已成为连接两种语言的黄金桥梁。然而&#xff0c;随着Visual Studio 2022和Python 3.11的发布&#xff0c;许多开发…...

终极Windows系统优化指南:使用RyTuneX实现性能提升300%的完整方案

终极Windows系统优化指南&#xff1a;使用RyTuneX实现性能提升300%的完整方案 【免费下载链接】RyTuneX RyTuneX is a cutting-edge optimizer built with the WinUI 3 framework, designed to amplify the performance of Windows devices. Crafted for both Windows 10 and 1…...

Spring Cloud Gateway 踩坑实录:升级到2020+版本后,lb://服务名路由503?一个依赖搞定

Spring Cloud Gateway 2020版本升级指南&#xff1a;解决lb://服务名路由503问题 最近在将Spring Cloud项目从Hoxton升级到2020.0.x及以上版本时&#xff0c;不少开发者遇到了一个奇怪的问题&#xff1a;原本运行良好的Gateway路由配置突然失效&#xff0c;特别是使用lb://服务…...

GenUI:从“文本对话”到“可操作界面”的范式转移

写在前面假如我问你&#xff1a;“帮我推荐几双500元以下的跑鞋。”传统AI会回复一段文字&#xff1a;“推荐李宁超轻系列&#xff0c;价格XXX&#xff1b;安踏氢跑系列……”你读完&#xff0c;再去电商App搜索、筛选、下单。整个过程在“读—搜—筛”之间反复跳转。但如果AI直…...

告别游戏进度丢失:XGP存档提取器终极指南

告别游戏进度丢失&#xff1a;XGP存档提取器终极指南 【免费下载链接】XGP-save-extractor Python script to extract savefiles out of Xbox Game Pass for PC games 项目地址: https://gitcode.com/gh_mirrors/xg/XGP-save-extractor 还在为Xbox Game Pass存档无法迁移…...

Python自动化办公:实战企业微信机器人Webhook消息推送

1. 企业微信机器人Webhook入门指南 第一次接触企业微信机器人Webhook时&#xff0c;我也被它强大的自动化能力惊艳到了。想象一下&#xff0c;你的Python脚本能像真人一样在企业微信群里发消息&#xff0c;还能根据不同的条件自动特定成员&#xff0c;这简直就是运维和项目管理…...

3分钟实战:用VoiceFixer拯救受损语音的完整应用手册

3分钟实战&#xff1a;用VoiceFixer拯救受损语音的完整应用手册 【免费下载链接】voicefixer General Speech Restoration 项目地址: https://gitcode.com/gh_mirrors/vo/voicefixer 你是否曾为会议录音中的杂音而苦恼&#xff1f;是否为老磁带转录的嘶嘶声感到无奈&…...