HCIP-AI EI 认证课程大纲
该阶段详细介绍计算机视觉、注意力机制与Transformer、自然语言处理、语音处理等 AI 核心领域技术,并重点介绍华为云 EI 服务使用。
共计48 课时。
第一节:计算机视觉技术概述与图像处理基础 - (3 课时)
- 什么是计算机视觉;计算机视觉技术发展简史;计算机视觉技术的应用领域;计算机视觉技术在人工智能产业中的重要性及作用;
- 什么是图像处理;图像处理常见需求点;图像处理技术分类;图像处理工具介绍;图像的表示与数字化;图像的表示方法;图像数字化过程:采样、量化、编码;基本图处理操作:缩放、旋转、镜像;
- 图像增强:亮度调整、对比度增强;图像滤波:均值滤波、高斯滤波、中值滤波;图像的边缘检测:Sobel、Prewitt、Canny 算子;图像分割:阈值分割、区域分割、边缘分割;
- 图像二值化:全局二值化、自适应二值化;形态学图像处理:腐蚀、膨胀、开操作、闭操作;形态学应用:图像去除噪声、图像分割;
第二节:图像的特征提取与描述 - (3 课时)
- 关键点检测:关键点的概念与特征、角点、边缘点;常见的关键点检测算法:Harris 角点检测、Shi-Tomasi 角点检测;图像的局部特征与全局特征;
- 特征向量的表示与匹配:特征向量的表示方法(向量、直方图、直方图梯度);特征向量的相似度度量方法(欧氏距离、汉明距离、余弦相似度);特征匹配算法(最近邻匹配、RANSAC 算法);
第三节:图像分类与目标(对象)检测 - (3 课时)
- 什么是图像分类;分类任务的定义与实施流程;基本图像分类器介绍:SVM、决策树、神经网络;使用深度学习框架进行图像分类任务;
- 对象检测基础概念;对象检测任务的定义及实施流程;基于滑动窗口的方法;
- 基于深度学习的对象检测方法:RCNN、Fast RCNN 网络论文精读;基于深度学习的对象检测方法:YOLOv8 及其历史版本论文精读;
第四节:图像分割与语义分割 - (3 课时)
- 图像分割基础概念;图像分割任务的定义与流程;基于阈值、区域和边缘的图像分割方法介绍;基于深度学习的图像分割方法:FCN、U-Net、SegNet 论文精读;
- 语义分割基础概念;语义分割任务的定义与实施流程;基于全卷积神经网络的语义分割方法;语义分割应用案例介绍:自动驾驶、医学影像分析;
第五节:目标检测模型构建实战-Kaggle 赛题精讲 - (3 课时)
第六节:注意力机制与 Transformer - (3 课时)
- 什么是注意力机制;什么是 Transformer;
- 注意力机制与 Transformer 的背景及含义;注意力机制和 Transformer 在自然语言处理和其他领域中的重要应用;注意力机制的定义和基本概念;
- 注意力机制的作用和优势;注意力机制的发展简史;注意力机制相关经典论文精读;自注意力机制核心原理;自注意力机制与 Transformer 的关系;
- Encoder 与 Decoder 结构及其组件;编码器结构及组件:多头自注意力层、前馈全连接层;解码器结构和组件:编码器-解码器注意力层、多头自注意力层、前馈全连接层;
第七节:Transformer 的训练及应用 - (3 课时)
- Transformer 模型的训练流程;Transformer 模型的训练数据准备及预处理;
- Transformer 训练的优化器选择;
- Transformer 应用领域;
第八节:自然语言处理概述与文本处理基础 - (3 课时)
- 什么是自然语言处理;自然语言处理的应用领域;自然语言处理技术在人工智能领域的重要性;自然语言处理技术的发展趋势;
- 文本处理技术简介;文本处理的应用领域;文本处理任务的实施流程;什么是文本预处理;文本预处理实施步骤:分词、定义、作用;
- 分词方法:基于空格、标点、词典的分词方法;中英文分词工具介绍;什么是标记化;文本预处理实施步骤:标记化、定义、作用;
- 标记化方法:单词、标点符号、数字标记化方法;中英文标记化工具介绍;什么是停用词;文本预处理实施步骤:停用词、定义、作用;
- 常见的停用词列表和移除方法;什么是词形还原;词形还原定义及作用;词干提取和词形还原的区别;常见词形还原方法和工具介绍;
- 什么是词袋模型;词袋模型的定义及作用;文档-词矩阵表示及基于词频的向量化方法;词袋模型的局限性和改进方法;词频-逆文档频率 TF-IDF;TF-IDF 的定义和作用;TF-IDF 在文本分类和信息检索中的应用;TF-IDF 方法的实现和优化技巧;什么是词嵌入;词嵌入的意义及作用;Word2Vec、GloVe、FastText 等常见词嵌入模型介绍;
第九节:语言理解技术 - (3 课时)
- 什么是词性标注;什么是命名体识别;词性标注及命名体识别的任务及方法;
- 常用词性标注及命名体识别模型和工具介绍;
- 什么是句法分析;什么是语法树;句法分析的概念及目标;常见的句法分析方法:依存句法分析、短语结构句法分析;
- 解析树与语法树的概念和表示方法;
第十节:语言生成技术 - (3 课时)
- 什么是语言模型;语言模型的定义和作用;基于统计方法和神经网络的语言模型实战;什么是文本生成;文本生成模型的定义和作用;
- 文本生成任务的常见模型:循环神经网络 RNN、长短期记忆网络 LSTM、门控循环单元 GRU、基于注意力机制的 Transformer 应用实战;
- 什么是机器翻译;机器翻译的定义和作用;什么是文本摘要;文本摘要的定义和作用;
- 机器翻译和文本摘要常见模型:神经机器翻译、抽取式与生成式文本摘要;
第十一节:语义理解技术 - (3 课时)
- 什么是文本分类;文本分类任务的定义和常见应用;什么是情感分析;情感分析任务的定义和常见应用;
- 基于机器学习和深度学习的文本分类模型与情感分析模型;
- 什么是文本相似度;文本相似度计算的定义和应用场景;基于词向量和深度学习的文本相似度计算方法;
- 语义匹配任务常见模型:Siamese 网络、BERT;
第十二节:常用自然语言处理工具库及综合实战 - (3 课时)
- 常用的自然语言处理工具和库:NLTK、spaCy、Stanford NLP、Gensim;
- 自然语言处理技术综合实战:Kaggle 赛题精讲;
第十三节:语音处理技术概述与语音信号处理基础 - (3 课时)
- 什么是语音处理技术;语音处理技术的应用领域;语音处理技术在人工智能领域的重要性;什么是语音信号;语音信号处理技术概述;什么是声波;声波的定义与基本性质;声波的频率、振幅、相位;
- 人类语音系统的基本结构和功能;声带、嘴唇等器官在语音生成中的作用;
- 语音信号的采样与量化;采样频率和量化位数的概念及影响;声音信号的数字化流程;语音信号的分析与表示:声谱图;声谱图的作用;如何绘制声谱图和读取信息;
- 时域特征与频域特征的概念;时域特征:波形图、能量、过零率;频域特征:频谱图、功率谱密度、梅尔频率倒谱系数;短时傅里叶变换 STFT;声学模型概念;语音信号的声学模型:线性预测 LPC 模型;声道模型和共振峰分析;语音信号的降噪与增强:滤波器、频域处理、谱减法;
第十四节:语音特征提取与表示 - (3 课时)
- 语音特征提取简介;声学特征介绍;提取声学特征的方法和工具;
- 语音表示方法介绍;基于特征向量的表示方法:声学特征向量;深度学习方法中的语音表示:端到端语音识别模型;
第十五节:语音识别与理解技术 - (3 课时)
- 语音识别任务全流程解析;语音识别流程:特征提取、声学模型、语言模型;
- 常见声学模型:隐马尔科夫模型 HMM 的基本原理及应用;
- 深度学习中的声学模型应用;
- 常用的语音识别工具和库:Kaldi、DeepSpeech、PocketSphinx;
第十六节:华为云 EI 服务介绍及 EI 服务 API 调用指南 - (3 课时)
- 华为云 EI 服务简介;EI 服务产品架构;EI 服务功能详解;
- EI 服务 API 调用指南:图像搜索、图像识别、图像标签、名人识别;
- EI 服务 API 调用指南:人脸识别服务、人证合身服务;
- EI 服务 API 调用指南:文字识别 OCR 服务(通用类、证件类、票据类、行业类)
- EI 服务 API 调用指南:图像搜索、图像识别、图像标签、名人识别;
- EI 服务 API 调用指南:自然语言处理服务(语言理解、语言生成、机器翻译、知识图谱);
- EI 服务 API 调用指南:内容审核服务(文本、图像、视频);
- EI 服务 API 调用指南:语音交互服务(实时语音识别、一句话识别、语音合成);
附赠①:Python 基础编程快速入门
该阶段详细介绍机器学习所必须掌握的 Python 编程知识,共计 36 课时。
附赠②:机器学习的数学理论基础
该阶段详细介绍学习数据挖掘算法所必须的数学理论,包含微积分、线性代数、概率论与数理统计及凸优化理论,共计 84 课时。
相关文章:
HCIP-AI EI 认证课程大纲
该阶段详细介绍计算机视觉、注意力机制与Transformer、自然语言处理、语音处理等 AI 核心领域技术,并重点介绍华为云 EI 服务使用。 共计48 课时。第一节:计算机视觉技术概述与图像处理基础 - (3 课时) - 什么是计算机视觉&#x…...
@Test注解方法,方法无法执行
1.背景 写了一个测试方法,执行后如图 2.原因是 该项目是springbootgradle...构建的项目 在build.gradle配置文件中关闭了单元测试: test {useJUnitPlatform()// 是否启用单元测试enabled false } 3.处理方式 开启单元测试 test {useJUnitPlatform()// 是否启用单元测试ena…...
golang函数
【1】函数: 对特定的功能进行提取,形成一个代码片段,这个代码片段就是我们所说的函数 【2】函数的作用:提高代码的复用性 【3】函数和函数是并列的关系,所以我们定义的函数不能写到main函数中 【4】基本语法 func 函…...
ubuntu上存在多个版本python,根据需要选择你想使用的python版本
文章目录 前言一、二、使用步骤总结 前言 参考1 一、 sudo update-alternatives --install /usr/bin/python python /usr/bin/python3.6 1二、使用步骤 总结...
idea 常用插件推荐
文章目录 1、Lombok2、Convert YAML and Properties File3、Grep Console4、MyBatisX5、Free MyBatis Tool6、MyBatis Log EasyPlus (SQL拼接)7、MyBatisPlus8、Eclipse theme9、Eclipse Plus Theme10、Rainbow Brackets Lite - Free and OpenSource&…...
训练大模型自动在RAG和记忆间选择
现如今,检索增强生成(Retrieval-augmented generation,RAG)管道已经能够使得大语言模型(Large Language Models,LLM)在其响应环节中,充分利用外部的信息源了。不过,由于RAG应用会针对发送给LLM的每个请求,都…...
抖店没人做了?不是项目不行了,而是商家们都换思路去玩了
我是王路飞。 有没有发现现在很多抖店新手都在吐槽,抖店不好做了,做不起来,没人做了,太内卷了...... 对这种做不起来还在怪项目本身的,一定要离他远一点,省得被他的负能量给影响到自己的状态。 任何项目…...
Qt5.15.2+VS2019新加类出现无法解析的外部符号
Qt5.15.2VS2019新加类出现无法解析的外部符号: 原因:没有生成对应的moc文件,导致没生成对应的元对象。 解决方案:记事本打开工程vcxproj,把报错的文件ClInclude,改为QtMoc,解决问题 未修改前&…...
启动mysql 3.5时出现 MySql 服务正在启动 . MySql 服务无法启动。
有可能是端口冲突 netstat -ano | findstr :3306运行这段代码出现类似: 可以看到端口 3306 已经被进程 ID 为 6284 的进程占用。为了启动新的 MySQL 服务,我们需要停止这个进程或更改新服务的端口: 1、终止进程 taskkill /PID 6284 /F2、确…...
并发编程理论基础——可见性、原子性和有序性问题(一)
核心问题:分工,同步,互斥 分工:如何高效地拆解任务并分配给线程 生产者-消费者模式、Thread-Per-Message模式、Worker-Thread模式、ComplateableFuture和CompletionServiceJava SDK 并发包里的 Executor、Fork/Join、Future 本质上…...
心理咨询系统源码|心理咨询系统开发|心理咨询系统
心理咨询系统,作为一种集现代化科技与专业心理服务于一体的工具,正逐渐渗透到我们生活的各个角落。它不仅为个人提供了便捷的心理支持,还为企业和组织带来了全新的管理方式。下面,我们将深入探讨心理咨询系统的可应用范围及其带来…...
Vue21-列表排序
一、需求 二、解决方式 <body><div id"root"><h2>人员列表</h2><input type"text" placeholder"请输入" v-model"keyword"><button click"sortType 1">年龄升序</button><b…...
配置 JDK 和 Android SDK
目录 一、配置JDK 1. 安装 JDK 2. JDK 环境配置 3. JDK的配置验证 二、配置 adb 和Android SDK环境 1、下载 2、配置 Android SDK 环境 一、配置JDK 1. 安装 JDK 安装链接:Java Downloads | Oracle 我安装的是 .zip ,直接在指定的文件夹下解压就…...
pyechart 创建柱形图
Pyecharts 是一个基于 Python 的开源数据可视化库,用于创建各种交互式的图表和可视化效果。它是在 Echarts 的基础上进行封装和优化,Echarts 是一个流行的 JavaScript 数据可视化库pyecharts 中文网站 : https://pyecharts.org/# pyecharts 模块 还支持…...
c#引用dll报错cs8370功能“本地函数特性“在c#7.3中不可用
cs8370:功能"本地函数特性"在c#7.3中不可用 解决方法: 代码放在form类里面...
【STM32】输入捕获应用-测量脉宽或者频率(方法1)
图1 脉宽/频率测量示意图 1 测量频率 当捕获通道TIx 上出现上升沿时,发生第一次捕获,计数器CNT 的值会被锁存到捕获寄存器CCR中,而且还会进入捕获中断,在中断服务程序中记录一次捕获(可以用一个标志变量来记录&#…...
C# Task
以下是 Task 类的一些关键特性和用法:以下是一些使用 Task 的示例:创建并启动一个任务使用 await 等待任务完成处理任务异常使用 Task<TResult> 获取结果取消任务 总结 在 C#中, Task 是 System.Threading.Tasks 命名空间中的一个类…...
进口电动蝶阀的工作原理-美国品牌
进口电动蝶阀通过电力驱动,实现阀门的开启、关闭和流量调节功能。其结构简单、操作方便、精确控制的特点使其在多个领域得到广泛应用。 进口电动蝶阀的工作原理可以清晰地分点表示和归纳如下: 一、概述 进口电动蝶阀是由电动执行器和蝶形阀组成的一种…...
Exploring Performance and Cost Optimization with ASIC-Based CXL Memory——论文阅读
EuroSys 2024 Paper CXL论文阅读笔记整理 问题 随着内存密集型应用程序对内存需求的增加,受限于物理限制,如DDR DIMM插槽的可用性和发热问题,以及使用高密度DIMM的成本考虑,现代应用程序的内存需求很容易超过单机的内存容量[2&a…...
计算机网络(4) 最长前缀匹配(路由转发表)
一.路由转发 网络数据包IP段只包含源地址与目的地址,经过数据链路层包装与物理层信号形式转换,最终经由不同的链路节点到达目的地址。这个过程是一步一步(hop by hop)进行的,路过一个路由节点则称为一跳。每个路由节点…...
.Net框架,除了EF还有很多很多......
文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...
CMake基础:构建流程详解
目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...
【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张(Windows/Linux)
要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况,可以通过以下几种方式模拟或触发: 1. 增加CPU负载 运行大量计算密集型任务,例如: 使用多线程循环执行复杂计算(如数学运算、加密解密等)。运行图…...
Reasoning over Uncertain Text by Generative Large Language Models
https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述 文本中的不确定性在许多语境中传达,从日常对话到特定领域的文档(例如医学文档)(Heritage 2013;Landmark、Gulbrandsen 和 Svenevei…...
JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...
scikit-learn机器学习
# 同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可: # Also add the following code, # so that every time the environment (kernel) starts, # just run the following code: import sys sys.path.append(/home/aistudio/external-libraries)机…...
Redis:现代应用开发的高效内存数据存储利器
一、Redis的起源与发展 Redis最初由意大利程序员Salvatore Sanfilippo在2009年开发,其初衷是为了满足他自己的一个项目需求,即需要一个高性能的键值存储系统来解决传统数据库在高并发场景下的性能瓶颈。随着项目的开源,Redis凭借其简单易用、…...
【MATLAB代码】基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),附源代码|订阅专栏后可直接查看
文章所述的代码实现了基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),针对传感器观测数据中存在的脉冲型异常噪声问题,通过非线性加权机制提升滤波器的抗干扰能力。代码通过对比传统KF与MCC-KF在含异常值场景下的表现,验证了后者在状态估计鲁棒性方面的显著优…...
4. TypeScript 类型推断与类型组合
一、类型推断 (一) 什么是类型推断 TypeScript 的类型推断会根据变量、函数返回值、对象和数组的赋值和使用方式,自动确定它们的类型。 这一特性减少了显式类型注解的需要,在保持类型安全的同时简化了代码。通过分析上下文和初始值,TypeSc…...
TSN交换机正在重构工业网络,PROFINET和EtherCAT会被取代吗?
在工业自动化持续演进的今天,通信网络的角色正变得愈发关键。 2025年6月6日,为期三天的华南国际工业博览会在深圳国际会展中心(宝安)圆满落幕。作为国内工业通信领域的技术型企业,光路科技(Fiberroad&…...
