AI和人工智能与机器学习全景报告
今天分享的是AI系列深度研究报告:《AI和人工智能与机器学习全景报告》。
(报告出品方:appen)
报告共计:30页



获取
数据获取仍是AI应用构建团队的主要瓶颈。
原因各不相同。例如,特定用例的数据可能不足,新的机器学习技术需要更多的数据,或者并未建立轻松高效获取所需数据的适当流程。
受访者对AI生命周期数据管理的看法有着强烈的共识,即企业领导者了解AI生命周期数据管理的价值 (90%同意),AI生命周期数据管理正在改变本企业的的经营方式 (87%同意)。决策者在AI生命周期四个阶段会平均分配数据管理时间。7成 (71%) 的受访者表示本企业在AI生命周期的许多阶段都很纠结。
尽管大多数受访者(88%)认为本企业拥有AI各阶段数据管理的必要内部资源,但只有42%的技 术专家认为,AI生命周期的数据获取阶段很有挑战性。不过,认为数据获取很有挑战性的企业 领导者并不太多(24%)。这表明,在对AI生命周期数据管理最大瓶颈的认识方面,技术专家和企业领导者之间仍然存在分歧。这就导致企业内的优先事项与预算的错位。
要使AI解决方案正常运行,就需要大量高质量数据来训练底层神经网络。多语言自然语言处理 (NLP) 便是个很好的示例。NLP依赖于数百万人的语音输入,并以ML(机器学习) 模型可以接受的格式准备和输入。
虽然我们调查的受访者中有五分之四表示他们拥有支持AI项目所需的适当数据量(81%) ,并且可以使用完成AI相关工作所需的工具 (90%),但他们中的大多数人仍在为低劣的数据质量而苦恼。依靠如此数据生成的系统往往性能不佳。当在NLP中集成多模态,或连接支持多种语言和内容类型的多个独立NLP解决方案时,数据质量问题就成为一个更大的挑战。




质量
世界日新月异,随着越来越多的智能设备、多屏幕的使用和收集信息的新数字工具的出现,全球数字足迹产生的数据量迅猛增长准确地构建和标注数据比以往任何时候都更加重要。
51%的受访者认为,数据准确性对其AI用例至关重要,46%的受访者认为,虽然这点很重要,但也可以变通。但只有20%的受访者认为,数据准确率高于80%,而认为数据准确率超过90%的受访者只有6%。
在AI生命周期开始阶段就使用正确的数据,将使后续阶段获得更好的结果。用于管理和准备数据的平均时间比例呈下降趋势,今年的平均占时间为47.4%,而2021年这一数字为53%。由于大多数受访者都使用外部数据提供商,因此可以推断,通过外包数据获取和准备工作,企业的数据科学家正在节省时间,并正确管理、清理和标注数据。
平均而言,管理和准备数据的平 均时间比例呈下降趋势今年这一 数字为47.4%,而 2021年为53%。
AI计划的最大障碍是数据管理。
AI计划的最大障碍是数据管理,41%的受访者表示,数据管理是最大的瓶颈。紧随其后的是,39%的受 访者表示,缺乏合格的人才——数据科学家和技术专家、数据架构师和工程师稀缺。31%的受访者表 示,缺乏足够的人员编制预算,增加了数据管理团队人员配备的挑战。合格数据科学家和技术专家的 短缺凸显了确保关键人才专注从事需要其宝贵技能的工作的重要性。为了解决这一问题,企业希望利 用外部数据提供商减少本企业在数据获取等领域的工作量,为数据科学家省出时间从事其他AI项目。



评估
机器学习模型需要持续监控和调整,以确保输出准确、相关的信息。
虽然部署后的模型基本上是自主的,但模型验证和再训练却需要人机协同。受访者对人机协同的重要性有着强烈的共识。81%的受访者认为,它非常重要或极其重要,97%的受访者认为,人机协同评估对于AI模型的准确性很重要。
AI生命周期是个持续的过程,需要不断地获取、准备和评估新的数据输入和模型输出。因此,有很多企业使用外部数据提供商 (88%) ,从我们衡量的需要持续更新模型的数据点中也可见一斑。去年,有86%的企业至少每季度更新一次模型,今年这一数字已增加到91%。
随着数据的及时更新,接下来就需要与外部数据提供商合作,找到合适的合作伙伴非常重要。92%的受访者认为,使用合适的数据合作伙伴对于成功的模型部署和验证至关重要,大多数受访者(83%)希望能够使用一个合作伙伴为AI生命周期的所有阶段提供支持。持续验证模型性能很重要,它对成功的模型输出至关重要。
携手具有技术和专业能力的合适合作伙伴对于获得高质量的结果至关重要。在AI生命周期各阶段, 技术和专业能力对于获得高质量的结果都很重要,93%的受访者对此表示同意,51%的受访者表示强烈同意。
人工模型评估在很大程度上分配的预算最少,40%的受访者表示,他们给AI生命周期的最 后阶段分配的预算最少。预算分配与人机协同的重要性之间存在差距。模型评估对于确保AI模型的准确性以及减少数据 量需求至关重要。预先对人机协同投入更多预算,企业将节约资金和时间,降低未来重新评估的可能性。


采用
2022年,AI的采用将继续实现增长,带来效益与应用,这源于企业创新以及提高效率和生产力的强烈愿望。
随着AI使用的日益普及,改善A的工具和最佳实践也变得越来越先进。
在疫情期间竞相推出AI之后,人们对企业AI先进水平的看法可能正在转变。我们的数据显示,认为本企业在业内领先的受访者有所下降 (对于美国市场,2021为66%,2022年为55%),这可能是由于疫情期间AI使用的大量涌现和各行各业AI用例的大量增加。虽然很少有受访者认为本企业在AI采用方面落后,但认为本企业领先的企业领导者(49%) 及和同行不相上下的企业领导者(49%) 数量不分伯仲。
与欧洲企业相比,美国企业更有可能表示其在采用AI方面领先于同行 (分别为44%和55%) 。

相关文章:
AI和人工智能与机器学习全景报告
今天分享的是AI系列深度研究报告:《AI和人工智能与机器学习全景报告》。 (报告出品方:appen) 报告共计:30页 获取 数据获取仍是AI应用构建团队的主要瓶颈。 原因各不相同。例如,特定用例的数据可能不足…...
【计算机网络】(网络层)定长掩码和变长掩码
目录 1、IPV4地址的应用规划 2、例题分析 2.1、定长的子网掩码 2.2、变长的子网掩码 1、IPV4地址的应用规划 定长的子网掩码(FLSM): 使用同一个子网掩码划分子网,每个子网所分配的IP地址数量相同,造成IP地址的浪费…...
008 OpenCV matchTemplate 模板匹配
目录 一、环境 二、模板匹配算法原理 三、代码演示 一、环境 本文使用环境为: Windows10Python 3.9.17opencv-python 4.8.0.74 二、模板匹配算法原理 cv.matchTemplate是OpenCV库中的一个函数,用于在图像中查找与模板匹配的特征。它的主要应用场景…...
PTA 海盗分赃
P 个海盗偷了 D 颗钻石后来到公海分赃,一致同意如下分赃策略: 首先,P 个海盗通过抽签决定 1 - P 的序号。然后由第 1 号海盗提出一个分配方案(方案应给出每个海盗分得的具体数量),如果能够得到包括 1 号在…...
零基础学Linux内核:1、Linux源码组织架构
文章目录 前言一、Linux内核的特征二、Linux操作系统结构1.Linux在系统中的位置2.Linux内核的主要子系统3、Linux系统主要数据结构 三、linux内核源码组织1、下载Linux源码2、Linux版本号3、linux源码架构目录讲解 前言 这里将是我们从零开始学习Linux的第一节,这节…...
STM32中Msp函数的意义
msp(MCU Support Package) 举个例子:串口初始化函数HAL_UART_Init()与串口底层初始化函数HAL_UART_MspInit() HAL_UART_Init()用于初始化串口通讯协议如波特率、有效位等 HAL_UART_MspInit()用于初始化于MCU相关的配置比如时钟、NVIC、GPI…...
PTA NeuDs_数据库题目
二.单选题 1.数据库应用程序的编写是基于数据库三级模式中的。 A.模式 B.外模式 C.内模式 D.逻辑模式 用户应用程序根据外模式进行数据操作,通过外模式一模式映射,定义和建立某个外模式与模式间的对应关系 2.对创建数据库模式一类的数据库对象的授权…...
pulseaudio是如何测试出音频延迟的
通常专业的音频设备生产厂商都有专业的设备来测试精确的音频链路延时。 那么没有专业设备怎么测试出音频延迟呢?如下图,我们可以看到pulseaudio可以测试出硬件音频延迟。 那么,他是怎么测试出硬件延迟的呢?他的理论依据是什么呢?接下来我带大伙一起探索一下。 /*占位…...
【docker】docker的基础命令
基础操作 docker info #查看docker的基本信息docker version #查看docker版本信息一、镜像操作 1、搜索镜像 docker search nginx2、下载镜像 docker pull nginx#从仓库中下载镜像,若没有指定标签,则下载最新的版本,也就是标签为: lat…...
RocketMq 主题(TOPIC)生产级应用
RocketMq是阿里出品(基于MetaQ)的开源中间件,已捐赠给Apache基金会并成为Apache的顶级项目。基于java语言实现,十万级数据吞吐量,ms级处理速度,分布式架构,功能强大,扩展性强。 官方…...
队列实现栈VS栈实现队列
目录 【1】用队列实现栈 思路分析 易错总结 Queue.c&Queue.h手撕队列 声明栈MyStack 创建&初始化栈myStackCreate 压栈myStackPush 出栈&返回栈顶元素myStackPop 返回栈顶元素myStackTop 判断栈空否myStackEmpty 释放空间myStackFree MyStack总代码…...
C/C++: 统计整数
【问题描述】 输入若干个整数,统计出现次数最多的那个整数。如果出现最多的整数有两个以上,打印最早输入的那个整数。 【输入形式】 从标准输入读取输入。第一行只有一个数字N(1≤N≤10000),代表整数的个数。以后的N行…...
docker容器生成镜像并上传个人账户
登录到 Docker Hub 账户: docker login这将提示你输入你的 Docker Hub 账户名和密码。 为容器创建镜像 docker commit <容器名或容器ID> <你的用户名>/<镜像名:标签>例子 docker commit my_container yourusername/my_image:latest推送镜像到…...
hdlbits系列verilog解答(exams/m2014_q4g)-48
文章目录 一、问题描述二、verilog源码三、仿真结果一、问题描述 本次我们将一次创建多个逻辑门,对两个输入a和b通过组合逻辑实现七种不同的输出: out_and: a and bout_or: a or bout_xor: a xor bout_nand: a nand bout_nor: a nor bout_xnor: a xnor bout_anotb: a and-no…...
在vue或者react或angular中,模板表达式中的箭头函数是无效的吗?为什么无效?
出现此问题的背景: 我在Angular项目中对一个标签属性绑定了一个箭头函数,编译报错。 在vue或者react或angular中,模板表达式中的箭头函数是无效的吗? 在 Vue、React 或 Angular 中,模板表达式中的箭头函数是无效的。…...
C++11『lambda表达式 ‖ 线程库 ‖ 包装器』
✨个人主页: 北 海 🎉所属专栏: C修行之路 🎃操作环境: Visual Studio 2022 版本 17.6.5 文章目录 🌇前言🏙️正文1.lambda表达式1.1.仿函数的使用1.2.lambda表达式的语法1.3.lambda表达式的使用…...
MATLAB算法实战应用案例精讲-【数模应用】漫谈机器学习(四)(附实战案例及代码实现)
目录 机器学习学习路线 学习编写抽象类 固定随机数种子 先加载少量数据...
JavaScript 中松散类型的理解
JavaScript 是一种动态类型语言,它的松散类型是其独特的特性之一。本文将深入探讨 JavaScript 中松散类型的概念以及如何在代码中应用。 引言 JavaScript 是一种强大而灵活的语言,它的松散类型使得变量的类型可以在运行时动态改变。这为开发人员带来了…...
java基于springboot公益帮学网站 新闻发布系统的设计与实现vue
以Java为开发平台,综合利用Java Web开发技术、数据库技术等,开发出公益帮学网站。用户使用版块:可以选择注册并登录,可以浏览信息、可以网上互动、发布文章、内容推荐等。后台管理员管理版块:以管理员身份登录网站后台…...
VMware 安装 Centos7 超详细过程
VMware 安装 Centos7 超详细过程 分类 编程技术 1.软硬件准备 软件:推荐使用 VMware,我用的是 VMware 12 镜像:CentOS6 ,如果没有镜像可以在阿里云下载 centos安装包下载_开源镜像站-阿里云 硬件:因为是在宿主机上运行虚拟化软…...
深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...
【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密
在实际项目中,用户注册、登录、修改密码等操作,都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输,在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
Golang dig框架与GraphQL的完美结合
将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序
一、开发环境准备 工具安装: 下载安装DevEco Studio 4.0(支持HarmonyOS 5)配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化: ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...
EtherNet/IP转DeviceNet协议网关详解
一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...
2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师(题目+回答)
安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 腾讯[实习]科恩实验室-安全工程师 一、网络与协议 1. TCP三次握手 2. SYN扫描原理 3. HTTPS证书机制 二…...
(一)单例模式
一、前言 单例模式属于六大创建型模式,即在软件设计过程中,主要关注创建对象的结果,并不关心创建对象的过程及细节。创建型设计模式将类对象的实例化过程进行抽象化接口设计,从而隐藏了类对象的实例是如何被创建的,封装了软件系统使用的具体对象类型。 六大创建型模式包括…...
【从零开始学习JVM | 第四篇】类加载器和双亲委派机制(高频面试题)
前言: 双亲委派机制对于面试这块来说非常重要,在实际开发中也是经常遇见需要打破双亲委派的需求,今天我们一起来探索一下什么是双亲委派机制,在此之前我们先介绍一下类的加载器。 目录 编辑 前言: 类加载器 1. …...
spring boot使用HttpServletResponse实现sse后端流式输出消息
1.以前只是看过SSE的相关文章,没有具体实践,这次接入AI大模型使用到了流式输出,涉及到给前端流式返回,所以记录一下。 2.resp要设置为text/event-stream resp.setContentType("text/event-stream"); resp.setCharacter…...
