AI基础 -- AI学习路径图
人工智能从数学到大语言模型构建教程
第一部分:AI 基础与数学准备
1. 绪论:人工智能的过去、现在与未来
- 人工智能的定义与发展简史
- 从符号主义到统计学习、再到深度学习与大模型的变迁
- 本书内容概览与学习路径指引
2. 线性代数与矩阵运算
- 向量与矩阵的基本概念
- 矩阵分解(特征值分解、奇异值分解)
- 张量运算简介(为后续深度学习做准备)
- 在机器学习和深度学习中的应用示例
3. 概率论与统计基础
- 随机变量、分布与期望方差
- 贝叶斯理论与最大似然估计
- 信息论(熵、KL 散度等)在机器学习中的应用
- 大数定律与中心极限定理在模型训练与评估中的意义
4. 微积分与优化方法
- 函数、微分、积分回顾
- 梯度与偏导数,链式法则
- 凸优化与非凸优化
- 常用优化算法(梯度下降、牛顿法、随机梯度下降及其变体 Adam、RMSProp 等)
第二部分:传统机器学习与工程基础
5. 机器学习基础算法
- 监督学习:回归(线性回归、岭回归、Lasso)与分类(逻辑回归、SVM、决策树等)
- 无监督学习:聚类(K-Means、层次聚类等)、降维(PCA、t-SNE等)
- 强化学习的初步概念(马尔可夫决策过程、值函数、策略)
- 评估指标与交叉验证
6. 工程实践与数据处理
- 数据采集与预处理:清洗、去噪、特征工程
- 大规模数据存储与处理(分布式计算、Hadoop、Spark 等)
- 特征选择与特征构造
- Pipeline 与自动化训练流程管理
第三部分:深度学习原理与模型
7. 神经网络基础
- 感知机与多层感知机(MLP)
- 前向传播与反向传播
- 激活函数(Sigmoid、ReLU、Tanh、Leaky ReLU 等)
- 正则化与损失函数(L1/L2、Dropout、Batch Normalization 等)
8. 卷积神经网络(CNN)
- 卷积操作与池化操作原理
- 经典 CNN 架构介绍(Lenet、AlexNet、VGG、ResNet、Inception 等)
- 在图像识别、目标检测等方面的应用
- CNN 模型的优化技巧(数据增广、Batch Size、学习率调整等)
9. 循环神经网络(RNN)及其变体
- RNN 的结构与梯度消失/爆炸问题
- LSTM、GRU 等改进结构
- 在时间序列、序列预测、文本数据处理等任务中的应用
- 序列到序列模型(Seq2Seq)、注意力机制的早期引入
10. Transformer 与注意力机制
- 自注意力(Self-Attention)的核心原理
- Transformer 模型结构(Encoder、Decoder)
- 优势与局限(并行化、长程依赖等)
- 在机器翻译和语言理解任务上的应用案例
第四部分:NLP 核心技术与大语言模型
11. 自然语言处理基础
- 词向量(Word2Vec、GloVe)与分词技术
- 语料预处理与常见 NLP 任务(文本分类、情感分析、命名实体识别等)
- 评测指标(BLEU、ROUGE、Perplexity 等)
- 传统 NLP 模型回顾(n-gram、HMM、CRF 等)
12. 预训练模型与微调
- 语言模型的概念(语言模型、Mask Language Model 等)
- 预训练-微调范式的提出与意义
- BERT 系列、GPT 系列、ELMo、T5 等典型预训练模型
- 常见微调方法(全参数微调、Prefix Tuning、Adapter 等)
13. 大规模模型的训练与推理
- 数据准备与大规模数据清洗
- 分布式训练框架与并行策略(数据并行、模型并行、流水线并行)
- 混合精度训练、梯度累积、检查点保存等高效训练技巧
- 超大模型推理优化(Quantization、Knowledge Distillation 等)
14. 构建与部署大型语言模型的完整流程
- 从零开始搭建一个简化版 Transformer 语言模型
- 预训练、微调与评估的端到端示例
- 模型压缩与部署(TensorRT、ONNX 等),服务化与 API 化
- 线上推理性能监控与故障排查
15. 模型评估、对齐与伦理
- 语言模型的评估:准确性、一致性、多样性等指标
- 有害内容、偏见与道德风险
- 对齐技术与价值观(RLHF 等)
- 合规与隐私保护
第五部分:进阶与前沿
16. 多模态与跨领域应用
- 图像与文本的融合(CLIP、ALIGN 等)
- 文本与语音(ASR、TTS 以及语音聊天系统)
- 知识图谱与大型语言模型结合
- AI + IoT、AI + 医疗、AI + 金融等行业实践案例
17. 强化学习与决策智能
- 深度强化学习(DQN、Policy Gradient、PPO 等)
- 大模型 + 强化学习在对话系统与复杂任务中的应用
- AutoML 与 NAS(网络结构搜索)
18. 可解释性与可控性
- 模型可解释性框架(LIME、SHAP 等)
- 大模型的可控文本生成方法
- 对抗攻击与防御
- 安全与可靠性研究前沿
19. MLOps 与企业级 AI 解决方案
- 模型生命周期管理(数据版本控制、模型版本控制)
- 持续训练与持续集成/部署(CI/CD)
- 大规模分布式基础设施(Kubernetes、Kubeflow 等)
- AI 产品化与落地案例
第六部分:未来展望与总结
20. 未来趋势与挑战
- 超大规模模型的演化方向(多任务统一模型、通用人工智能雏形)
- 新型计算架构(类脑计算、光子计算、量子计算)对 AI 的影响
- 法规与社会影响(隐私、版权、伦理审查)
相关文章:
AI基础 -- AI学习路径图
人工智能从数学到大语言模型构建教程 第一部分:AI 基础与数学准备 1. 绪论:人工智能的过去、现在与未来 人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引 2. 线性代数与矩阵运算 向量与矩阵的…...

在 Visual Studio Code 与微信开发者工具中调试使用 emscripten 基于 C 生成的 WASM 代码
最近在尝试将一些 C/C、Lua 项目挪到 Web 上跑, 接触到了 emscripten. 这里会介绍下在 Visual Studio Code 与微信开发者工具中调试使用 emscripten 基于 C 生成的 WASM 代码 (WebAssembly) 的一些方法. Emscripten 与 WebAssebmly WebAssembly 是一种新的编码方式, 可以在现代…...
elasticsearch实战应用从入门到高效使用java集成es快速上手
Elasticsearch 因其出色的性能、可扩展性和易用性,成为了处理大规模数据和构建搜索引擎的首选工具。本文将通过一个实际案例,详细讲解如何在 Spring Boot 项目中集成 Elasticsearch,进行数据索引、搜索、聚合分析等操作。 一、Elasticsearch 简介 Elasticsearch 是一个基于…...
【OneAPI】通过网页预渲染让搜索引擎收录网页
API简介 网页预渲染,适用于动态网页以及单页面的SEO,支持网页缓存。 您无须更改代码即可让搜索引擎收录您的网页。只要将需要预渲染的页面转发的本接口即可。 如果您使用Nginx作为网页服务器,推荐使用以下配置: #您的网站locat…...
【网络安全.渗透测试】Cobalt strike(CS)工具使用说明
目录 前言 一、工具显著优势 二、安装 Java 运行环境 三、实验环境搭建要点 四、核心操作流程详解 (一)环境准备与连接步骤 (二)主机上线与深度渗透流程 五、其他实用功能应用指南 (一)office 宏 payload 应用 (二)Https Payload 应用 (三)信息收集策略 …...

港中文腾讯提出可穿戴3D资产生成方法BAG,可自动生成服装和配饰等3D资产如,并适应特定的人体模型。
今天给大家介绍一种名为BAG(Body-Aligned 3D Wearable Asset Generation)的新方法,可以自动生成可穿戴的3D资产,如服装和配饰,以适应特定的人体模型。BAG方法通过构建一个多视图图像扩散模型,生成与人体对齐…...
【C语言标准库函数】标准输入输出函数详解[4]:二进制文件读写函数
目录 一、fread() 函数 1.1. 函数简介 1.2. fread 使用场景 1.3. 注意事项 1.4. 示例 二、fwrite() 函数 2.1. 函数简介 2.2. fwrite 使用场景 2.3. 注意事项 2.4. 示例 三、总结 在 C 语言中,二进制文件读写函数允许以二进制形式对文件进行读写操作&…...

Python:凯撒密码
题目内容: 凯撒密码是古罗马恺撒大帝用来对军事情报进行加密的算法,它采用了替换方法对信息中的每一个英文字符循环替换为字母表序列该字符后面第三个字符,对应关系如下: 原文:A B C D E F G H I J K L M N O P Q R …...

C++引用深度详解
C引用深度详解 前言1. 引用的本质与核心特性1.1 引用概念1.2 核心特性 2. 常引用与权限控制2.1 权限传递规则2.2 常量引用2.3 临时变量保护1. 样例2. 样例3. 测试 三、引用使用场景分析3.1 函数参数传递输出型参数避免多级指针高效传参 3.2 做函数返回值正确使用危险案例 4. 性…...

C++ Primer 语句作用域
欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…...
github - 使用
注册账户以及创建仓库 要想使用github第一步当然是注册github账号了, github官网地址:https://github.com/。 之后就可以创建仓库了(免费用户只能建公共仓库),Create a New Repository,填好名称后Create,之后会出现一些仓库的配置信息,这也是一个git的简单教程。 Git…...

内网ip网段记录
1.介绍 常见的内网IP段有: A类: 10.0.0.0/8 大型企业内部网络(如 AWS、阿里云) 10.0.0.0 - 10.255.255.255 B类:172.16.0.0/12 中型企业、学校 172.16.0.0 - 172.31.255.255 C类:192.168.0.0/16 家庭…...

k8s部署logstash
1. 编写logstash.yaml配置文件 --- apiVersion: v1 kind: Service metadata:name: logstash spec:type: ClusterIPclusterIP: Noneports:- name: logstash-tcpport: 5000targetPort: 5000- name: logstash-beatsport: 5044targetPort: 5044- name: logstash-apiport: 9600targ…...

EF Core中实现值对象
目录 值对象优点 值对象的需求 值类型的实现 值类型GEO的实现 值类型MultilingualString的实现 案例:构建表达式树,简化值对象的比较 值对象优点 把有紧密关系的属性打包为一个类型把领域知识放到类的定义中 class shangjia {long id;string nam…...

【分布式理论9】分布式协同:分布式系统进程互斥与互斥算法
文章目录 一、互斥问题及分布式系统的特性二、分布式互斥算法1. 集中互斥算法调用流程优缺点 2. 基于许可的互斥算法(Lamport 算法)调用流程优缺点 3. 令牌环互斥算法调用流程优缺点 三、三种算法对比 在分布式系统中,多个应用服务可能会同时…...

木材表面缺陷检测数据集,支持YOLO+COCO JSON+PASICAL VOC XML+DARKNET格式标注信息,平均正确识别率95.0%
数据集说明 木材表面缺陷检测数据集是用于训练和验证人工智能算法,以帮助自动识别和检测木材表面的缺陷,如裂纹、疤痕、孔洞等。这对于木材行业非常重要,可以提高生产过程的效率和质量控制水平。 本文提供的木材表面缺陷检测数据集࿰…...
Leetcodehot 力扣热题100 二叉搜索树中第 K 小的元素
class Solution { public:int res; // 用于存储第 k 小的元素int kthSmallest(TreeNode* root, int k) {inorder(root, k); // 进行中序遍历并找到第 k 小的元素return res; // 返回结果}private:// 中序遍历:遍历树的左子树、根节点和右子树void inorder(TreeNod…...
Awtk 如何添加开机画面
场景 我们知道在工程中,Ui是一个线程,并且需要一直存在,当我们使用的开机画面在这个线程开启就直接展示的时候,因为awtk的界面是window_open入栈的,即首次打开的窗口会记录在top,往后的窗口会依次往后存放&…...

关于多语言商城系统的开发流程
建设多语言商城系统是现在很多传统外贸企业的选择,外贸企业通过多语言电商系统开展海外业务,那么多语言商城系统的开发流程是怎么样的呢?接下来就跟着小来一起来看看吧。 1、页面UI设计 多语言商城系统的原型图经过反复推敲修正后࿰…...

IDEA中常见问题汇总
🍓 简介:java系列技术分享(👉持续更新中…🔥) 🍓 初衷:一起学习、一起进步、坚持不懈 🍓 如果文章内容有误与您的想法不一致,欢迎大家在评论区指正🙏 🍓 希望这篇文章对你有所帮助,欢…...
uniapp 对接腾讯云IM群组成员管理(增删改查)
UniApp 实战:腾讯云IM群组成员管理(增删改查) 一、前言 在社交类App开发中,群组成员管理是核心功能之一。本文将基于UniApp框架,结合腾讯云IM SDK,详细讲解如何实现群组成员的增删改查全流程。 权限校验…...
[2025CVPR]DeepVideo-R1:基于难度感知回归GRPO的视频强化微调框架详解
突破视频大语言模型推理瓶颈,在多个视频基准上实现SOTA性能 一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战 安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度,导致: 梯度抑制:当新旧策略差异过大时梯度消失收敛困难:策略无法充分优化# 传统GRPO的梯…...

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法
树莓派摄像头高级使用方法 配置通过调谐文件来调整相机行为 使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 配置 大多数用例自动工作,无需更改相机配置。但是,一…...

边缘计算医疗风险自查APP开发方案
核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...
java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别
UnsatisfiedLinkError 在对接硬件设备中,我们会遇到使用 java 调用 dll文件 的情况,此时大概率出现UnsatisfiedLinkError链接错误,原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用,结果 dll 未实现 JNI 协…...

iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享
平时用 iPhone 的时候,难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵,或者买了二手 iPhone 却被原来的 iCloud 账号锁住,这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...
将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
Otsu 是一种自动阈值化方法,用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理,能够自动确定一个阈值,将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

ServerTrust 并非唯一
NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角 要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念 点说明authenticationMethodURLAuthenticationChallenge.protectionS…...
Python如何给视频添加音频和字幕
在Python中,给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加,包括必要的代码示例和详细解释。 环境准备 在开始之前,需要安装以下Python库:…...
【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)
升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求ÿ…...