当前位置: 首页 > news >正文

人工智能机器学习系统技术要求

一 术语和定义

1.1机器学习系统 machinelearningsystem

能运行或用于开发机器学习模型、算法和相关应用的软件系统。

1.2机器学习框架 machinelearningframework

利用预先构建和优化好的组件集合定义模型,实现对机器学习算法封装、数据调用处理和计算资源使用的软件库。

1.3机器学习服务 machinelearning service

利用机器学习模型算法及其系统作为工具为组织或个人提供一种其期望的便利的方式价值的IT服务。

注:机器学习算法服务是机器学习服务的一种,用于接受用户的应用请求,对输入数据进行处理,返回处理结果。

1.4模型编译器 model compiler

将机器学习模型定义的计算过程转换为能在特定人工智能计算资源上执行的代码序列的计算机程序。

注:本文件中定义的模型编译器仅用于机器学习领域。

1.5资源池 resource pool

各类系统资源的集合体。

1.6作业 job

机器学习训练或推理任务的逻辑组合。

注:一个作业属于且仅属于某一个资源池,一个作业包括一个或多个任务。

1.7任务 task

实现特定目标所需要的活动。

注:任务用于完成一个相对独立的业务功能,一个任务属于且仅属于一个作业。

二 系统框架

机器学习系统包含机器学习运行时组件,机器学习框架,机器学习服务组件,工具和运维管理。提供机器学习应用的开发,训练,部署,运行和管理能力,机器学习系统框架图如下图

2.1机器学习运行组件

机器学习运行时组件是为保障机器学习应用按照预期在特定机器学习系统上运行所必需的软件环境,包括设备驱动软件和算子库。

设备驱动软件负责机器学习各种类型任务的调度与执行,包括为机器学习任务分配提供资源管理通道,为应用提供存储管理、设备管理、执行流管理、事件管理和核函数执行功能。算子库提供机器学习算法在设备执行调度的最小计算单元,包括面向机器学习计算任务的通用算子和面向特定设备计算加速任务的优化算子。

2.2 机器学习框架

机器学习框架包含模型训练,模型推理及算法库三个模块,为机器学习应用开发、优化、验证和部署过程提供工具支撑。

模型训练用于机器学习应用设计开发阶段,该模块提供自动微分、损失函数和优化器等调用接口,提供模型定义、自动分布式并行训练和多硬件后端适配等能力。

模型推理用于机器学习应用的验证部署阶段,该模块提供模型加载、微调、性能评估和转换等接口,提供模型部署及推理加速等能力。

算法库面向机器学习训练、推理和模型性能优化任务,提供预先优化好的算法,以封装函数库的方式供用户调用,提升机器学习模型开发、优化、验证和部署的效率。

2.3 机器学习服务组件

机器学习服务是人工智能行业应用访问、利用机器学习能力和资源的主要方式,机器学习服务组件支持工作流管理、通用算法模板和应用部署。机器学习系统通过服务组件,进行服务部署、运行环境准备、运行状态汇报和服务容错等,并提供服务调用接口,供各领域上层应用调用。为满足应用场景的需求,机器学习系统可提供文本、图像、音频和视频及其他类型智能化操作的算法服务。

2.4 工具

2.4.1 数据管理工具

数据管理工具提供人工智能数据的生存周期,包含定义、采集、预处理、模型构建、系统部署、系统维护,数据退出和系统退出的管理能力。提供各类数据源,包括结构化,半结构化和非结构化数据的接入、标注和质量控制,中间数据的管理、最终数据的管理、元数据的管理和数据使用溯源等能力,支持对海量结构化、非结构化数据的预处理与特征挖掘。

2.4.2 模型管理工具

模型管理工具提供常用的机器学习模型及其变形,能按照一定的方式,如算法结构、应用范围,提供模型的分类检索:模型管理工具也可扩展支持模型导入、导出、更新、发布、迁移和版本控制等功能。在机器学习应用开发阶段,通过多模型组合开发、多模型集成、超参数设置和模型二次训练等方式支持模型优化与应用开发。

2.4.3 开发环境

开发环境是机器学习全流程开发工具链,支持模型开发、算子开发和应用开发三个主流程中的开发任务,提供模型可视化、算力测试和IDE单机仿真调试等功能。

2.4.4 模型编译器

模型编译器将计算过程的计算图和算子转换为环境兼容的中间表达或设备可执行的代码,支持编译优化、编译参数自动寻优、编译结果存储载入、自定义算子注册编译、模型格式转换等功能

2.5 运维管理

运维管理提供系统所需的基本运维(例如安装部署、扩展、监控、报警、健康检查、问题及故障定位升级和补丁、备份恢复和操作审计等)及管理功能(例如计算资源管理、权限管理、用户管理、日志管理,配置管理,安全管理等)

三 可靠性要求

可靠性要求包括:

  1. 应具备跟踪任务的执行状态,并对异常任务进行提示的能力;

  2. 应具备资源受限或系统失效后持续提供或恢复服务的能力,如具备历史版本回滚、框架提供参数的保存能力等;

  3. 应具备容错机制,具备系统在检测出异常输入或危险操作时的错误提示功能;

  4. 应具备对误操作的抵御能力,确保误操作后系统的正常运行;

  5. 应具备不同容量场景过载控制机制;

  6. 应具备系统故障诊断能力,如机器学习框架可保存关键运行数据以用于故障定位和恢复;

  7. 应具备系统故障隔离能力,如集群训练中,单一节点出现故障时可快速隔离;

  8. 宜具备系统状态文件的几余备份功能和容灾能力。

四 维护性要求

维护性要求包括:

a) 应具备数据集规模、均衡性、标注质量和污染情况对算法结果的影响分析功能;

b) 应具备在设计、实现和运行各阶段对应的性能度量指标和验证方法;

c) 应具备代码实现算法功能的正确性分析能力,包括代码规范性和代码漏洞检查;

d) 应具备系统实际运行中环境干扰的影响分析能力,包括噪声干扰和数据分布迁移等;

e) 宜具备异常数据的存储和导出能力。

五 兼容性要求

5.1 软件兼容性要求

软件兼容性要求包括:

a. 应具备软件服务兼容性,相互关联的软件服务能够正常运行,且在数据、信息和交互三个方面具有相互兼容的性质;

b. 不应依赖特定的软件运行环境;

c. 应具备系统运行的可移植性;

d. 应兼容主流操作系统,兼容多种编程语言;

e. 应兼容开源的通用接口,根据系统要求在最新版本中增强或优化;

f. 应具备模块间及模块内接口信息传递和互操作功能;

g. 应具备异源数据、异构数据库和新旧数据接口的转换功能;

h. 应兼容不同场景应用,兼容特定应用系统下的优化和扩展。

5.2 硬件兼容性要求

硬件兼容性要求包括:

a. 应兼容多种计算单元,例如CPU、GPU、FPGA和ASIC等;

b. 应兼容多种存储系统,例如分布式云存储和本地存储等;

c. 应兼容多种网络连接方式,例如以太网和InfiniBand网络;

d. 宜兼容多种计算平台,例如服务器、移动通信终端、平板式计算机和可穿戴设备等。

六 安全性要求

安全性要求包括:

a. 应提供对训练数据、部署模型、算法程序和服务接口的访问权限管理能力;

b. 应提供抵御对抗样本攻击和噪声污染的能力;

c. 应具备对访问用户的访问历史查询能力;

d. 应具备对权重文件的防篡改能力以及保护能力;

e. 应具备将任务详细状态输出到日志的能力;

f. 应具备对分布式任务的鉴别和加密通信能力;

g. 应具备部分模型的可解释能力;

h. 应具备部分模型的差分隐私训练能力;

i. 应具备部分模型和任务的稳健性评估能力;

j. 应屏蔽非法输人。

七 可扩展性要求

可扩展性要求包括:

a. 应具有标准格式的接口,降低维护和运行机器学习模型的成本;

b. 应具有模型部署到生产环境的标准流程,降低系统整合风险;

c. 应提供机器学习生存周期管理工具。

相关文章:

人工智能机器学习系统技术要求

一 术语和定义 1.1机器学习系统 machinelearningsystem 能运行或用于开发机器学习模型、算法和相关应用的软件系统。 1.2机器学习框架 machinelearningframework 利用预先构建和优化好的组件集合定义模型,实现对机器学习算法封装、数据调用处理和计算资源使用的软件库。 1…...

学习整理使用JavaScript中如何判断变量是否存在的四种常用方法

学习整理使用JavaScript中如何判断变量是否存在的四种常用方法 前言1. 使用 typeof 运算符判断变量类型2. 使用全局对象 window 或 global 判断变量是否存在3. 使用 in 关键字判断变量是否存在4. 使用 try…catch 块判断变量是否存在5. 综合示例总结 前言 在 JavaScript 中&am…...

docker实现jenkins+git+naocas一体化自动部署

一、jenkins安装 1.1 docker 安装jenkins docker pull jenkins/jenkins 1.2 docker 启动jenkins docker run --name myjenkins -d -p 8081:8080 -p 8085:8085 jenkins/jenkins –name 指定容器名称为myjenkins -d 表示后台运行 -p 8081:8080 表示Docker Host(运行Do…...

Flutter 中的 PerformanceOverlay 小部件:全面指南

Flutter 中的 PerformanceOverlay 小部件:全面指南 Flutter 是一个由 Google 开发的跨平台 UI 框架,它允许开发者使用 Dart 语言构建高性能、美观的应用。在 Flutter 的开发过程中,性能监控是一个重要的方面。PerformanceOverlay 是 Flutter…...

es的总结

es的collapse es的collapse只能针对一个字段聚合(针对大数据量去重),如果以age为聚合字段,则会展示第一条数据,如果需要展示多个字段,需要创建新的字段,如下 POST testleh/_update_by_query {…...

React常见的一些坑

文章目录 两个基础知识1. react的更新问题, react更新会重新执行react函数组件方法本身,并且子组件也会一起更新2. useCallback和useMemo滥用useCallback和useMemo要解决什么3. react的state有个经典的闭包,导致拿不到最新数据的问题.常见于useEffect, useMemo, useCallback4. …...

Java基础29(编码算法 哈希算法 MD5 SHA—1 HMac 算法 堆成加密算法)

目录 一、编码算法 1. 常见编码 2. URL编码 3. Base64编码 4. 小结 二、哈希算法 1. 哈希碰撞 2. 常用哈希算法 MD5算法 SHA-1算法 自定义HashTools工具类 3. 哈希算法的用途 校验下载文件 存储用户密码 4. 小结 三、Hmac算法 小结: 四、对称加密…...

人脸识别——OpenCV

人脸识别 创建窗口创建按钮设置字体定义标签用于显示图片选择并显示图片检测图片中的人脸退出程序返回主界面 创建窗口 导入tkinter库,创建窗口,设置窗口标题和窗口大小。 import tkinter as tkwin tk.Tk() win.title("人脸识别") win.geom…...

深入探索容器:什么是容器及其在现代软件开发中的作用

深入探索容器:什么是容器及其在现代软件开发中的作用 引言 在今天的软件开发和运维领域,容器技术已经成为了一个不可或缺的工具。从初创企业到大型企业,从Web应用到微服务架构,容器都在发挥着其独特的作用。那么,什么…...

STM32-- GPIO->EXTI->NVIC中断

一、NVIC简介 什么是 NVIC ? NVIC 即嵌套向量中断控制器,全称 Nested vectored interrupt controller 。它 是内核的器件,所以它的更多描述可以看内核有关的资料。M3/M4/M7 内核都是支持 256 个中断,其中包含了 16 个系统中…...

【介绍下WebStorm开发插件】

🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…...

推荐丨一键申请SSL证书,让网站实现HTTPS访问!

申请HTTPS证书可以简化为以下几个直接步骤,以便您能快速理解和操作: 1. 确定证书类型: - 单域名证书:适用于一个特定域名。 - 通配符证书:适用于同一主域名下的所有子域名。 - 多域名证书:覆盖多个不同的域…...

交叉导轨在医疗设备上的作用!

随着医疗器械行业的需求逐步增长,交叉导轨给医疗器械行业带来了广阔的发展前景。作为重要的精密传动元件,交叉导轨具有寿命长、高精度、高刚性、高耐腐蚀性和高稳定性等优点,满足精密仪器上对产品的高要求使用场景。 在医疗设备领域中交叉导轨…...

【云原生】Docker Compose 使用详解

目录 一、前言 二、Docker Compose 介绍 2.1 Docker Compose概述 2.2 Docker Compose特点 2.3 Docker Compose使用场景 三、Docker Compose 搭建 3.1 安装docker环境 3.2 Docker Compose安装方式一 3.2.1 下载最新版/如果不是最新可替换最新版本 3.2.2 设置权限 3.2.…...

通过LabVIEW提升生产设备自动化水平

现代制造业对生产设备的自动化水平提出了越来越高的要求。使用LabVIEW这一强大的图形化编程环境,可以显著提升生产设备的自动化程度,改善生产效率和产品质量。本文将详细分析如何通过LabVIEW改善生产设备的自动化水平,并提供具体的实施策略与…...

面试题vue+uniapp(个人理解-面试口头答述)未编辑完整....

1.vue2和vue3的区别(vue3与vue2的区别(你不知道细节全在这)_vue2和vue3区别-CSDN博客)参考 Vue3 在组合式(Composition )API,中使用生命周期钩子时需要先引入,而 Vue2 在选项API&am…...

PPP-B2b精密产品使用注意事项及分析

1、因为在使用PPP-B2b进行定轨的时候,发的精密轨道产品是B3频点的,需要改正的卫星质心(Com)与SP3精密星历对比。 2、PPP-B2b产品吸收了电离层误差,因此电离层提取方面与IGS电离层完全无法对其。 3、由于PPP-B2b产品精…...

C语言(结构体)

Hi~!这里是奋斗的小羊,很荣幸各位能阅读我的文章,诚请评论指点,欢迎欢迎~~ 💥个人主页:小羊在奋斗 💥所属专栏:C语言 本系列文章为个人学习笔记,在这里撰写成文一…...

Python filter()用法:深入解析与实战应用

Python filter()用法:深入解析与实战应用 在Python编程中,filter() 函数是一个内置的高阶函数,它用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。该函数在数据处理和筛选时非常有用&#xff0…...

k8s集群的存储卷、pvc和pv

目录 简介 简介 PV 全称叫做 Persistent Volume,持久化存储卷。它是用来描述或者说用来定义一个存储卷的,这个通常都是由运维工程师来定义。 PVC 的全称是 Persistent Volume Claim,是持久化存储的请求。它是用来描述希望使用什么样的或者说…...

<6>-MySQL表的增删查改

目录 一,create(创建表) 二,retrieve(查询表) 1,select列 2,where条件 三,update(更新表) 四,delete(删除表&#xf…...

五年级数学知识边界总结思考-下册

目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...

现代密码学 | 椭圆曲线密码学—附py代码

Elliptic Curve Cryptography 椭圆曲线密码学(ECC)是一种基于有限域上椭圆曲线数学特性的公钥加密技术。其核心原理涉及椭圆曲线的代数性质、离散对数问题以及有限域上的运算。 椭圆曲线密码学是多种数字签名算法的基础,例如椭圆曲线数字签…...

Linux-07 ubuntu 的 chrome 启动不了

文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了,报错如下四、启动不了,解决如下 总结 问题原因 在应用中可以看到chrome,但是打不开(说明:原来的ubuntu系统出问题了,这个是备用的硬盘&a…...

使用LangGraph和LangSmith构建多智能体人工智能系统

现在,通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战,比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。 在这篇博客〔原作者&a…...

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析 前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

基于PHP的连锁酒店管理系统

有需要请加文章底部Q哦 可远程调试 基于PHP的连锁酒店管理系统 一 介绍 连锁酒店管理系统基于原生PHP开发,数据库mysql,前端bootstrap。系统角色分为用户和管理员。 技术栈 phpmysqlbootstrapphpstudyvscode 二 功能 用户 1 注册/登录/注销 2 个人中…...

Unity UGUI Button事件流程

场景结构 测试代码 public class TestBtn : MonoBehaviour {void Start(){var btn GetComponent<Button>();btn.onClick.AddListener(OnClick);}private void OnClick(){Debug.Log("666");}}当添加事件时 // 实例化一个ButtonClickedEvent的事件 [Formerl…...

在树莓派上添加音频输入设备的几种方法

在树莓派上添加音频输入设备可以通过以下步骤完成&#xff0c;具体方法取决于设备类型&#xff08;如USB麦克风、3.5mm接口麦克风或HDMI音频输入&#xff09;。以下是详细指南&#xff1a; 1. 连接音频输入设备 USB麦克风/声卡&#xff1a;直接插入树莓派的USB接口。3.5mm麦克…...

通过MicroSip配置自己的freeswitch服务器进行调试记录

之前用docker安装的freeswitch的&#xff0c;启动是正常的&#xff0c; 但用下面的Microsip连接不上 主要原因有可能一下几个 1、通过下面命令可以看 [rootlocalhost default]# docker exec -it freeswitch fs_cli -x "sofia status profile internal"Name …...