安卓手机搭建智能语音客服/通话播音/聊天播音乐技术实现
声明,此项技术需要root支持,如果因为刷机导致手机变砖或其他不可预料的后果请自行解决。
场景
我有一个朋友他是做业务的,主要还是做电销,其实电销相对于以前纪念没那么好做了(我自己觉得主要是互联网冲击,各个细分领域把对应的流量分走了,于是电销的转化效果就打了折扣,不过电销由于使用的真人发音,在在建立信任度方面,会比文字聊天或者机器人更加有优势)。
但是电销的成本确实也在不断提高,为了节约成本,大家都在想办法,比如我这个朋友他就准备用语音识别+真人录制的方式做客服,因为他的业务本来就很单一,客户问到的问题基本在他们的培训资料上都有标准回答,他们只需要按照这个标准回答回复即可,一方面他觉得枯燥乏味,另一方面,她希望能提高效率,摆脱这种困境。
针对这种场景,我觉得确实可以用自动化来做,而且能大大节约成本,他们希望能把原来的硬件设备能用上,比如手机,sim卡等。在经过认真思考后,我给出了我的低成本的技术架构。
通话替换语音技术
业务分析
首先,他们的手机是小米6的手机,对于他们业务员来说,其实并没有要求用多好的手机,只要不卡,打电话够用就行。二米6在二手市场上大量的存货,价格基本也就是3,4百一台的样子。加上电话卡每个业务员的硬件成本并不高。主要的投入还是在庞大的业务人员薪资上。如果能够实现自动化,在一定程度上能节省至少一半的业务员的支出。
他问我,最近不是出了个ChatGpt吗,是不是可以用他来做人工客服,然后利用语音合成来做智能机器人。我给比较难,然后出了三点原因:
- ChatGpt投入比较大,目前垂直领域的公司用ChatGpt接入到现有系统的公司基本都是大公司,他们利用自己的语料库在原本的大模型上进行训练。而训练大模型需要大量的算例,头部公司的硬件投入就在几十上百万张v100。这对于一般小公司来讲不切实际。而如果仅仅是对于原有模型进行微调,需要用到的硬件成本也不会很低,包括训练工程师以及一个完整的团队。通常来讲,这样去做的都是本着做平台去做的。
- ChatGpt的大模型里面包含了众多的语料数据,试想一下,你的智能客服本来是推广产品的,但是和客户聊着聊着变成了瞎聊,完全和业务不沾边,这种情况肯定需要去规避,但是客户可不是经过专门训练的,他不知道应该问那些问题,如果要分割这个大模型,这里面需要做的微调可就多了,不是一时半会能搞定的事情。
- 前面说的是成本,在接入后,使用效果也未必能达到想要的效果。可能花了比业务员或者客服更多的钱,但是收效甚微,这就有点不划算。综合考虑,还是先用更容易施行的方案,等Gpt的服务成本下来后在考虑介入进去。
解决方案
那怎么做呢?我是这样架构的:客户通讯录放在后台,应用端请求通讯录数据到手机上,手机开始拨号,拨号出去后电话接通,通过检测接通的信号开始播放预先录制好的音频流。当客户说话的时候停止播放音频流,并将客户过来的额音频流推送到后台服务器进行识别处理,这种音频识别技术在国内已经相当成熟了,有配套的解决方案。转化成文字后,对文字进行关键词检索和匹配,匹配后利用关键词去匹配预先录制好的语料数据,将预料数据推送到客户的电话端。
这种情况下我们并不需要太多的语料,基本上只要将培训时用到的语料都覆盖,就可以解决7成以上的问题,但是由于我们并不是真人,因为也会遇到一些处理不了的情况,比如说客户的发言并没有识别到准确的关键词,或者触发了特定关键词:如人工客服,人工服务等。这个时候就需要业务员或者客服主动介入处理。

即是说,相对于全人工的情况,上面只有在触发需要人工的时候才会介入。但却又在一开始让客户认为是真人在听他们讲话而且不会对他们的发言做出消极回应。
实际上,我给他算了一下这套方案的成本,主要是这套程序的开发,而这里面最大的技术难点在于手机在接通电话时候接入音频并输送到对方,同时录制对方传过来的声音,以流的方式推送出去。而这套技术我们已经实现了。剩下来的就是做关键词的提取和匹配,以及语音识别等等。有一些系统甚至已经介入了人工合成语音的机器人,但是效果不太理想,我觉得介入这个结束后,转化率和效果会大大提高。
相关文章:
安卓手机搭建智能语音客服/通话播音/聊天播音乐技术实现
声明,此项技术需要root支持,如果因为刷机导致手机变砖或其他不可预料的后果请自行解决。 场景 我有一个朋友他是做业务的,主要还是做电销,其实电销相对于以前纪念没那么好做了(我自己觉得主要是互联网冲击,…...
【学习笔记】PKUSC2023 不知道咋记
挺快乐的。到 P K U PKU PKU感受了一下北大校园,其实并没有想像中那么令人惊艳,但是看到了许多亲切的学长以及他们的热心陪伴(虽然有的我甚至不认识),感觉心里还是挺暖的。 如果不算上 D 2 T 1 D2T1 D2T1被平衡树板子…...
Packet Tracer - 配置基于区域的策略防火墙 (ZPF)
Packet Tracer - 配置基于区域的策略防火墙 (ZPF) 拓扑图 地址分配表 设备 接口 IP 地址 子网掩码 默认网关 交换机端口 R1 G0/1 192.168.1.1 255.255.255.0 不适用 S1 F0/5 S0/0/0 (DCE) 10.1.1.1 255.255.255.252 不适用 不适用 R2 S0/0/0 10.1.1.2 255…...
全方位揭秘!大数据从0到1的完美落地之运行流程和分片机制
一个完整的MapReduce程序在分布式运行时有三类实例进程: MRAppMaster: 负责整个程序的过程调度及状态协调MapTask: 负责Map阶段的整个数据处理流程ReduceTask: 负责Reduce阶段的整个数据处理流程 当一个作业提交后(mr程序启动),大概流程如下࿱…...
后端程序员的前端必备【Vue】 - 07 ES6新语法
ES6新语法 1 let定义变量2 const定义常量3 模板字符串4 方法默认值5 箭头函数6 解构6.1 对象解构6.2 数组解构6.2 使用解构实现变量交换 7 Spread Operator8 模块化编程 1 let定义变量 使用let定义变量能更加精准的确定变量的作用域 //for(var i 0 ; i < 10 ; i){} for(let…...
AI落地:程序员如何用AI?
对于程序员来说,真正能提高效率、可落地的AI应用场景都有哪些? 目前已经能切实落地,融入我日常工作生活的有以下几个场景: 开发工作:自然语言生成代码,自动补全代码 日常工作学习:写作、翻译、…...
掌握优化+创新模式,轻松提升APP广告eCPM
无论是市场占有率高的综合性应用程序(App),还是透过特定目的所设计的专业化应用程序(App),内部嵌入广告已成为其主要的盈利方式。 而优化和创新作为提升广告收益的两大关键词。通过不断的数据分析和优化,结合对用户需求的深刻理解去优化和…...
在docker上安装运行Python文件
目录 一、在docker中安装python 1.1 输入镜像拉取命令 1.2 查看镜像 1.3 运行 1.4 查看是否成功 1.5 查看python版本 二、运行py文件 2.1准备运行所需文件 2.2 准备文件夹 2.3 大概是这幅模样 2.4 打包上传到服务器上 2.5 构建镜像示例 2.6 查看镜像 2.7 优化镜像的…...
RocketMQ第三节(生产者和消费者)
目录 1:生产者(同步、异步、单向) 1.1:同步发送消息(每发送一条等待mq返回值) 1.2:异步发送消息 1.3:单向发送消息(不管成功失败,只管发送消息)…...
人大金仓亮相国际金融展,打造“金融+产业+生态”创新模式
4月27日,以“荟萃金融科技成果,展现数字金融力量,谱写金融服务中国式现代化新篇章”为主题的2023中国国际金融展圆满落幕。作为已经举办30年的行业盛会,人大金仓再一次重磅亮相,全方位展示国产数据库前沿应用和创新服务…...
Syslog-ng RHEL 的安装和配置
syslog-ng 作为 syslog 的替代工具,可以完全替代 syslog 的服务,并且通过定义规则,实现更好的过滤功能。 作为运维来说一个好的日志工具比什么都重要。 通常我们会管理不同的服务器,因此我们需要把日志集中一下以便于快速查找。…...
得物直播低延迟探索 | 得物技术
1.背景 直播的时效性保证了良好的用户体验,根据经验在交易环节,延迟越低转化效果也会越好。传统的直播延迟问题已经成为了一个不容忽视的问题,高延迟不仅破坏了用户的观看体验,也让主播难以实时获取到用户的反馈。为了进一步优化…...
【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)
论文题目: Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制 红外小目标数据集 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中&am…...
Axios概述
一、Json-server 获得零编码的完整伪造 REST API zero coding 在不到 30 秒的时间内 (认真)。 使用 <3 创建,适用于需要快速后端进行原型设计和模拟的前端开发人员,模拟后端发送过来json数据。 1.安装 npm install -g jso…...
用右雅克比对旋转矩阵进行求导
考虑一个向量 a \bold{a} a对其进行旋转, 旋转用旋转矩阵 R \bold{R} R表示, 用朴素的倒数定义进行求导而不是用扰动模型, 我得到了这个过程与结果 和高博的新书结果 − R J r a ∧ -\bold{R}\bold{J}_{r}\bold{a}^{\wedge} −RJra∧结果不一样, 雅克比矩阵位置不同, 是不是…...
高性能HMI 走向扁平化
个人计算机作为图形用户界面(GUI)在自动化中已经使用了30多年。在那段时间里,从技术、术语、功能到用于创建接口的标准和指南,发生了许多变化。 PC 技术的飞速发展,特别是图形显示,用户界面的技术发展导致了…...
虚幻引擎配置物体水面浮力的简便方法
虚幻引擎配置物体水面浮力的简便方法 目录 虚幻引擎配置物体水面浮力的简便方法前言前期工作配置水面浮力针对一个立方体的水面浮力配置针对船3D模型的水面浮力配置 小结 前言 在使用虚幻引擎配置导入的3D模型时,如何快速地将水面浮力配置正确,从而使得…...
WatchGuard 防火墙策略、配置和日志分析器
获取 Internet 活动见解并及时了解安全事件是一项具有挑战性的任务,因为安全设备会生成大量的安全和流量日志。Firewall Analyzer 针对 WatchGuard 防火墙设备的报告功能具有一系列功能,使您能够增强网络安全。WatchGuard 日志分析器软件,可让…...
Web自动化测试——XAPTH高级定位
XAPTH高级定位 一、xpath 基本概念二、xpath 使用场景三、xpath 相对定位的优点四、xpath 定位的调试方法五、xpath 基础语法(包含关系)六、xpath 顺序关系(索引)七、xpath 高级用法1、[last()]: 选取最后一个2、[属性名属性值 an…...
CentOS 7 安装 Nginx
前言 最近,在公司经常会进行项目的部署,但是服务器环境都是导师已经搭建好了的,我就是将项目文件放到特定目录。于是,周末在家就进行了 Nginx 的安装学习。之前,在 Windows 上使用过 Nginx,但是在 Linux 环…...
s2-pro部署实操:CSDN平台GPU资源监控与s2-pro服务性能关联分析
s2-pro部署实操:CSDN平台GPU资源监控与s2-pro服务性能关联分析 1. 专业语音合成工具s2-pro简介 s2-pro是Fish Audio开源的专业级语音合成模型镜像,它能够将文本转换为自然流畅的语音,并支持通过参考音频来复用特定音色。这个工具特别适合需…...
Struts2拦截器实战:从零构建权限控制与日志记录
1. Struts2拦截器机制解析 Struts2拦截器是框架最核心的机制之一,它采用AOP(面向切面编程)思想,在Action执行前后插入自定义逻辑。想象一下拦截器就像地铁安检系统:每个乘客(请求)都必须经过安检…...
SAP资产会计数据迁移:除了AS91,你还需要检查这些关键配置(传输日期、抵销科目详解)
SAP资产会计数据迁移:AS91之外的7个关键配置陷阱与解决方案 当你在凌晨三点盯着屏幕上不平的资产折旧凭证时,AS91的简单操作指南显然已经不够用了。作为经历过数十个SAP上线项目的顾问,我发现90%的资产数据迁移问题都源于那些容易被忽略的后台…...
vLLM-v0.17.1效果展示:vLLM在中文古诗生成任务中的韵律保持能力
vLLM-v0.17.1效果展示:vLLM在中文古诗生成任务中的韵律保持能力 1. vLLM框架简介 vLLM是一个专为大型语言模型(LLM)设计的高性能推理和服务库,以其出色的速度和易用性著称。这个项目最初由加州大学伯克利分校的天空计算实验室开发,现在已经…...
告别定位漂移:用Python手把手实现GNSS载波相位平滑伪距(附代码)
告别定位漂移:用Python手把手实现GNSS载波相位平滑伪距(附代码) 在无人机自主飞行或自动驾驶小车导航时,你是否遇到过这样的困扰:明明设备静止不动,地图上的定位点却像喝醉酒一样左右摇摆?这种&…...
爱毕业aibye精选6大AI论文平台榜单:助力高效写作与智能降重,科研工作者的得力助手!
工具名称 核心功能 特色优势 Aibiye 论文生成降AI率 全学科覆盖、仿写优化、自动图表生成 Aicheck AI检测文献综述辅助 精准查新、3分钟高效成文 GPT学术版 润色/翻译/代码解释 多模型协同、PDF深度解析 摆平论文 大纲生成降重改写 三步出稿、本硕博通用 QuillB…...
深入解析影像显示驱动:MIPI与I2C的协同设计与应用
1. MIPI与I2C:影像显示驱动的黄金搭档 第一次拆开手机屏幕排线时,我看到两条截然不同的线路——细如发丝的MIPI差分对和普通的I2C双绞线。这就像发现城市地下的两套管网系统:MIPI是高压供水主管道,每秒输送数GB的图像数据…...
专利数据挖掘与商业价值转化:开源工具驱动的技术创新与决策变革
专利数据挖掘与商业价值转化:开源工具驱动的技术创新与决策变革 【免费下载链接】patents-public-data Patent analysis using the Google Patents Public Datasets on BigQuery 项目地址: https://gitcode.com/gh_mirrors/pa/patents-public-data 在数字化转…...
MD_DS3231库:工业级DS3231 RTC全功能驱动设计与实践
1. MD_DS3231库深度解析:面向工业级RTC应用的DS3231全功能驱动设计与工程实践DS3231是Maxim(现属Analog Devices)推出的高精度IC实时时钟芯片,其2ppm温漂特性、内置温度补偿晶振(TCXO)、独立电池供电备份、…...
当我谈 Rax 按端拆分代码的时候我谈些什么:代码规范相关
前言在跨端开发领域,Rax 作为一个备受关注的框架,凭借其“一次编写,多端运行”的理念,为开发者带来了巨大的效率提升。然而,随着业务规模的扩大和终端形态的多样化(Web、Weex、小程序、Node 等)…...
