当前位置：首页 > news >正文

RPA除了和OCR、NLP技术结合，还能和什么技术结合？

news 2026/5/11 21:10:46

鉴于业内现在也经常把RPA称为数字员工，就虚拟一个人的形象来解答吧。

首先是头部，实现人的“听看说想”能力：

听：ASR（语音识别技术），主要用于听取和理解语音输入，让RPA能处理语音数据，可以用在需要用户互动或者语音控制的系统中。

看：OCR（光学字符识别技术），主要用于识别和提取图像或扫描文档中的文本，实现的是“看”文本部分功能，这个题主公司已经用到了，但还有一项CV（计算机视觉技术），这个技术主要用于识别、理解图像和视频，进一步补充RPA“看”的范围。

想：NLP（自然语言理解技术），主要用于理解和处理文本数据，能让RPA更好地理解任务信息，从而实现更广泛的应用范围。此外，这部分还可以引入机器学习、深度学习等技术，也就是现在很火热的大模型，能让RPA不断地自我深化学习，处理需要想象力、创造性、判断性的工作，比如决策判断、文章写作等。

说：TTS（语音合成技术），主要用于将文本转换为自然语音，让RPA可以与用户进行口头交流或提供口头反馈。

再往下就是人的四肢，实现“做”的能力：

做：RPA（机器人流程自动化），主要用于实现具备规则性的重复工作的自动化处理。

当然，除了通过技术结合强化RPA本身的应用之外，还可以通过流程挖掘技术进行RPA实施前的场景发掘、结合云计算技术使RPA能获得弹性计算资源、存储和分析工具，强化任务支持能力等。

RPA除了和OCR、NLP技术结合，还能和什么技术结合？

相关文章：

RPA除了和OCR、NLP技术结合，还能和什么技术结合？

AssertionError: Torch not compiled with CUDA enabled

【Ubuntu 系统使用进入，自动进入base虚拟环境解决最全】

C++项目——云备份-⑨-服务端与客户端功能联调

Linux两条服务器实现相互免密登录

华纳云Ubuntu环境怎么编译安装PHP和Nginx

Ubuntu 23.10（Mantic Minotaur）正式发布，支持Linux 6.5和GNOME 45

Linux：KVM虚拟化

HTML标签，列表，表格相关

【音视频】Linux | FFmpeg源码搭建

Ansible中常用模块

2000-2021年上市公司产融结合度量数据

2023最新最全Web自动化测试面试题

List的add(int index,E element)陷阱，不得不防

如何使用drawio画流程图以及导入导出

腾讯云轻量服务器“镜像类型”以及“镜像”选择方法

docker-compose 简单部署Flask + Redis + Nginx环境搭建网站

debian和ubuntu

恒驰服务 | 华为云数据使能专家服务offering之数仓建设

AI与Prompt：解锁软件开发团队的魔法咒语，在复杂任务上生成正确率更高的代码

打卡信奥刷题（3245）用C++实现信奥题 P8563 Magenta Potion

Apache Airflow 系列教程 | 第28课：Backfill 与数据回填策略

vue3-vant-mobile项目部署指南：Netlify零配置发布终极教程

从通信原理到Verilog：一个约束长度7的卷积码编码器是如何炼成的？

气象数据分析实战：用Python+cinrad从雷达基数据中提取组合反射率并可视化

RT-Thread实战：小熊派上BH1750光照数据采集与MQTT上云完整流程（附源码）

100+ RPG Maker MV/MZ插件：零代码打造专业级游戏体验的完整指南

HC32F4A0 ADC+DMA实战：8通道模拟量采集，从时钟配置到数据搬运的保姆级避坑指南

新手父母必备：开源婴儿护理知识库架构与核心技能解析

STK Target Sequence实战：不写一行代码，30分钟搞定卫星初始轨道参数优化