AI基础 -- AI学习路径图
人工智能从数学到大语言模型构建教程
第一部分:AI 基础与数学准备
1. 绪论:人工智能的过去、现在与未来
- 人工智能的定义与发展简史
- 从符号主义到统计学习、再到深度学习与大模型的变迁
- 本书内容概览与学习路径指引
2. 线性代数与矩阵运算
- 向量与矩阵的基本概念
- 矩阵分解(特征值分解、奇异值分解)
- 张量运算简介(为后续深度学习做准备)
- 在机器学习和深度学习中的应用示例
3. 概率论与统计基础
- 随机变量、分布与期望方差
- 贝叶斯理论与最大似然估计
- 信息论(熵、KL 散度等)在机器学习中的应用
- 大数定律与中心极限定理在模型训练与评估中的意义
4. 微积分与优化方法
- 函数、微分、积分回顾
- 梯度与偏导数,链式法则
- 凸优化与非凸优化
- 常用优化算法(梯度下降、牛顿法、随机梯度下降及其变体 Adam、RMSProp 等)
第二部分:传统机器学习与工程基础
5. 机器学习基础算法
- 监督学习:回归(线性回归、岭回归、Lasso)与分类(逻辑回归、SVM、决策树等)
- 无监督学习:聚类(K-Means、层次聚类等)、降维(PCA、t-SNE等)
- 强化学习的初步概念(马尔可夫决策过程、值函数、策略)
- 评估指标与交叉验证
6. 工程实践与数据处理
- 数据采集与预处理:清洗、去噪、特征工程
- 大规模数据存储与处理(分布式计算、Hadoop、Spark 等)
- 特征选择与特征构造
- Pipeline 与自动化训练流程管理
第三部分:深度学习原理与模型
7. 神经网络基础
- 感知机与多层感知机(MLP)
- 前向传播与反向传播
- 激活函数(Sigmoid、ReLU、Tanh、Leaky ReLU 等)
- 正则化与损失函数(L1/L2、Dropout、Batch Normalization 等)
8. 卷积神经网络(CNN)
- 卷积操作与池化操作原理
- 经典 CNN 架构介绍(Lenet、AlexNet、VGG、ResNet、Inception 等)
- 在图像识别、目标检测等方面的应用
- CNN 模型的优化技巧(数据增广、Batch Size、学习率调整等)
9. 循环神经网络(RNN)及其变体
- RNN 的结构与梯度消失/爆炸问题
- LSTM、GRU 等改进结构
- 在时间序列、序列预测、文本数据处理等任务中的应用
- 序列到序列模型(Seq2Seq)、注意力机制的早期引入
10. Transformer 与注意力机制
- 自注意力(Self-Attention)的核心原理
- Transformer 模型结构(Encoder、Decoder)
- 优势与局限(并行化、长程依赖等)
- 在机器翻译和语言理解任务上的应用案例
第四部分:NLP 核心技术与大语言模型
11. 自然语言处理基础
- 词向量(Word2Vec、GloVe)与分词技术
- 语料预处理与常见 NLP 任务(文本分类、情感分析、命名实体识别等)
- 评测指标(BLEU、ROUGE、Perplexity 等)
- 传统 NLP 模型回顾(n-gram、HMM、CRF 等)
12. 预训练模型与微调
- 语言模型的概念(语言模型、Mask Language Model 等)
- 预训练-微调范式的提出与意义
- BERT 系列、GPT 系列、ELMo、T5 等典型预训练模型
- 常见微调方法(全参数微调、Prefix Tuning、Adapter 等)
13. 大规模模型的训练与推理
- 数据准备与大规模数据清洗
- 分布式训练框架与并行策略(数据并行、模型并行、流水线并行)
- 混合精度训练、梯度累积、检查点保存等高效训练技巧
- 超大模型推理优化(Quantization、Knowledge Distillation 等)
14. 构建与部署大型语言模型的完整流程
- 从零开始搭建一个简化版 Transformer 语言模型
- 预训练、微调与评估的端到端示例
- 模型压缩与部署(TensorRT、ONNX 等),服务化与 API 化
- 线上推理性能监控与故障排查
15. 模型评估、对齐与伦理
- 语言模型的评估:准确性、一致性、多样性等指标
- 有害内容、偏见与道德风险
- 对齐技术与价值观(RLHF 等)
- 合规与隐私保护
第五部分:进阶与前沿
16. 多模态与跨领域应用
- 图像与文本的融合(CLIP、ALIGN 等)
- 文本与语音(ASR、TTS 以及语音聊天系统)
- 知识图谱与大型语言模型结合
- AI + IoT、AI + 医疗、AI + 金融等行业实践案例
17. 强化学习与决策智能
- 深度强化学习(DQN、Policy Gradient、PPO 等)
- 大模型 + 强化学习在对话系统与复杂任务中的应用
- AutoML 与 NAS(网络结构搜索)
18. 可解释性与可控性
- 模型可解释性框架(LIME、SHAP 等)
- 大模型的可控文本生成方法
- 对抗攻击与防御
- 安全与可靠性研究前沿
19. MLOps 与企业级 AI 解决方案
- 模型生命周期管理(数据版本控制、模型版本控制)
- 持续训练与持续集成/部署(CI/CD)
- 大规模分布式基础设施(Kubernetes、Kubeflow 等)
- AI 产品化与落地案例
第六部分:未来展望与总结
20. 未来趋势与挑战
- 超大规模模型的演化方向(多任务统一模型、通用人工智能雏形)
- 新型计算架构(类脑计算、光子计算、量子计算)对 AI 的影响
- 法规与社会影响(隐私、版权、伦理审查)
相关文章:
AI基础 -- AI学习路径图
人工智能从数学到大语言模型构建教程 第一部分:AI 基础与数学准备 1. 绪论:人工智能的过去、现在与未来 人工智能的定义与发展简史从符号主义到统计学习、再到深度学习与大模型的变迁本书内容概览与学习路径指引 2. 线性代数与矩阵运算 向量与矩阵的…...
使用 Visual Studio Code (VS Code) 开发 Python 图形界面程序
安装Python、VS Code Documentation for Visual Studio Code Python Releases for Windows | Python.org 更新pip >python.exe -m pip install --upgrade pip Requirement already satisfied: pip in c:\users\xxx\appdata\local\programs\python\python312\lib\site-pa…...
IEEE期刊Word导出PDF注意事项
在系统上提交论文时候一般要求PDF文档,但是word直接转PDF可能存在一些问题: 部分图片不清晰。字体未嵌入PDF。间距发生了变化。字体发生了变化。一张图片显示不完全。 下面介绍word转PDF最稳妥的技巧以及如何实现全部字体的嵌入。 1. 操作流程 ① 另…...
针对Prompt优化的深入分析
一、针对Prompt优化的深入分析 1. 结构化设计 技术原理: 大语言模型(LLMs)本质是基于概率的序列生成器,结构化模板通过显式定义输出框架(如角色、段落数、连接词),利用模型的模式匹配能力&…...
flutter ListView 局部刷新
在 Flutter 中,要仅刷新 ListView 中的某一列(即特定列表项),可以通过以下步骤实现: 核心思路 为每个列表项分配唯一标识(如 Key),帮助 Flutter 识别需要更新的项。 局部状态管理&a…...
如何在 Elasticsearch 中设置向量搜索 - 第二部分
作者:来自 Elastic Valentin Crettaz 了解如何在 Elasticsearch 中设置向量搜索并执行 k-NN 搜索。 本文是三篇系列文章中的第二篇,深入探讨了向量搜索(也称为语义搜索)的复杂性以及它在 Elasticsearch 中的实现方式。 第一部分重…...
DeepSeek的出现会对百度有多大影响?
当DeepSeek与ChatGPT等大模型接管搜索入口,我们正见证百年一遇的信息革命。 01 传统搜索已死?AI助手正在重写游戏规则! 当DeepSeek与ChatGPT等大模型接管搜索入口,我们正见证百年一遇的信息革命。 就像汽车淘汰马车、触屏终结按键…...
【C#】条件运算符
1.逻辑与(&&) Console.WriteLine(true && true);//true Console.WriteLine(true && false);//false Console.WriteLine(false && false);//false2.逻辑或(||) Console.WriteLine(true || true);//true Console.WriteLine(true || false);//t…...
单例模式详解(Java)
单例模式详解(Java) 一、引言 1.1 概述单例模式的基本概念和重要性 单例模式是一种常用的软件设计模式,它确保一个类在整个应用程序中只有一个实例,并提供一个全局访问点来访问这个唯一实例。这种模式在资源管理、配置设置和日志记录等方面非常有用,因为它们通常只需要…...
PyQt学习记录01——加法计算器
目录 PyQt学习记录01——加法计算器 PyQt学习记录02——串口助手 0. 安装配置 0.1 安装相关库 首先打开你的PyCharm程序,然后新建一个目录用于学习,其次在terminal中输入 pip install pyqt5如果你不具有科学上网能力,请改为国内源 pip …...
笔记:蓝桥杯python搜索(3-2)——DFS剪支和记忆化搜索
目录 一、DFS剪支 二、例题 P2942 数字王国之军训军队 P3075 特殊的多边形 三、记忆化搜索 四、例题 例题 P3820 混境之地 P216 地宫取宝 一、DFS剪支 在搜索过程中,如果需要完全遍历所有情况可能需要很多时间在搜索到某种状态时,根据当前状态判断…...
k8s启空容器用于排查问题
如果 Pod 一会儿就销毁了,可能是由于 Pod 配置、节点状态或容器运行时问题导致的。 此时想进容器排查,但是pod一会儿就销毁了,不利于排查。 为了排查问题,可以启动一个空容器来临时保留 Pod,进而进入 Pod 内部进行调…...
jenkins备份还原配置文件
下载ThinBackup插件 方式1 从插件市场直接下载 Manage Jenkins->Manage Plugins->可选插件搜索 注意:有时可能因为网络或者版本问题下载不了,好像是默认下载最新版本,可选择手动安装! 方式二 手动安装插件 点击查看手…...
02.11 数据库
1.思维导图 2.题目 将 epoll 服务器、客户端拿来用客户端:写一个界面,里面有注册登录服务器:处理注册和登录逻辑,注册的话将注册的账号密码写入数据库,登录的话查询数据库中是否存在账号,并验证密码是否正…...
物联网(IoT)如何与人工智能(AI)的结合
物联网(IoT)与人工智能(AI)的结合是当前技术发展的重要趋势,通常被称为 AIoT(人工智能物联网)。这种结合通过将AI的计算能力和数据分析能力与物联网的海量设备连接能力相结合,实现了…...
嵌入式硬件篇---原码、补码、反码
文章目录 前言简介八进制原码、反码、补码1. 原码规则示例问题 2. 反码规则示例问题 3. 补码规则示例优点 4. 补码的运算5. 总结 十六进制原码、反码、补码1. 十六进制的基本概念2. 十六进制的原码规则示例 3. 十六进制的反码规则示例 4. 十六进制的补码规则示例 5. 十六进制补…...
PHP函数fgetc(): 从文件中读取一个字符
在PHP中,有许多用于文件操作的函数,其中之一就是fgetc()函数。fgetc()函数用于从打开的文件中读取一个字符,并将指针移动到下一个字符的位置。本文将介绍fgetc()函数的用法,并提供一些示例来帮助读者更好地理解和使用这个函数。 …...
Spring Boot整合DeepSeek实现AI对话(API调用和本地部署)
本篇文章会分基于DeepSeek开放平台上的API,以及本地私有化部署DeepSeek R1模型两种方式来整合使用。 本地化私有部署可以参考这篇博文 全面认识了解DeepSeek利用ollama在本地部署、使用和体验deepseek-r1大模型 Spring版本选择 根据Spring官网的描述 Spring AI是一…...
苹果转型独立AR眼镜:一场技术与创新的深度探索
在科技日新月异的今天,增强现实(AR)技术正逐渐从科幻电影走进我们的日常生活。作为科技界的领头羊,苹果公司的每一步动向都备受关注。近期,苹果宣布暂停原定的Mac连接式AR眼镜计划,转而全力研发一款独立的AR眼镜。这一战略调整不仅反映了苹果对AR市场的深度洞察,也预示着…...
Java小白入门基础知识(一)
1.初识Java java源程序通过javac 编译生成字节码文件,通过java命令运行java程序 总结: 1)在一个Java文件中,只能有一个public class 2)public class一定要和文件名一致 3)类里面包含方法 4)…...
通过 Docker 安装和部署 KeyDB v6.3.4 的详细步骤
KeyDB 是一种高性能的开源内存数据库,最初是基于 Redis 项目开发的,但在性能、特性和功能上进行了许多增强和改进。它兼容 Redis 的大部分命令和数据结构,因此可以作为 Redis 的替代品使用,尤其是在需要更高性能和多线程支持的场景…...
【JavaEE进阶】依赖注入 DI详解
目录 🌴什么是依赖注入 🎄依赖注入的三种方法 🚩属性注⼊(Field Injection) 🚩Setter注入 🚩构造方法注入 🚩三种注⼊的优缺点 🌳Autowired存在的问题 🌲解决Autowired存在的…...
Avnet RFSoC基于maltab得5G 毫米波 开发工具箱
使用 MATLAB 连接到 AMD Zynq™ RFSoC 评估板。使用 RF 附加卡执行 OTA 测试。使用 HDL Coder 部署算法 版本要求: 大于 2023b 需要以下支持包之一: 适用于 Xilinx 基于 Zynq 的无线电(R2023b 及更早版本)的通信工具箱支持包适…...
掌握 PHP 单例模式:构建更高效的应用
在 PHP 应用开发中,资源的高效管理至关重要。单例模式是一种能够帮助我们实现这一目标的设计模式。本文将深入探讨单例模式的概念、工作原理以及在 PHP 项目中何时应该(或不应该)使用它。 什么是单例模式? 单例模式是一种设计模…...
neo4j-解决导入数据后出现:Database ‘xxxx‘ is unavailable. Run :sysinfo for more info.
目录 问题描述 解决方法 重新导入 问题描述 最近在linux上部署了neo4j,参照之前写的博客:neo4j-数据的导出和导入_neo4j数据导入导出-CSDN博客 进行了数据导出、导入操作。但是在进行导入后,重新登录网页版neo4j,发现对应的数据库状态变…...
卷积神经网络(CNN)池化层的最大池化(Max Pooling)和 平均池化(Average Pooling)
在 卷积神经网络(CNN) 中,池化层(Pooling Layer) 是用来 减少特征图的空间尺寸、减少计算量、控制过拟合 的关键层。池化层通过 窗口操作 将输入特征图中一定区域的信息压缩成一个单一的值,常见的池化方式有 最大池化(Max Pooling) 和 平均池化(Average Pooling)。这…...
Mac(m1)本地部署deepseek-R1模型
1. 下载安装ollama 直接下载软件,下载完成之后,安装即可,安装完成之后,命令行中可出现ollama命令 2. 在ollama官网查看需要下载的模型下载命令 1. 在官网查看deepseek对应的模型 2. 选择使用电脑配置的模型 3. copy 对应模型的安…...
第六届MathorCup高校数学建模挑战赛-A题:淡水养殖池塘水华发生及池水自净化研究
目录 摘要 1 问题的重述 2 问题的分析 2.1 问题一的分析 2.2 问题二的分析 2.3 问题三的分析 2.4 问题四的分析 2.5 问题五的分析 3. 问题的假设 4. 符号说明 5. 模型的建立与求解 5.1 问题一的建模与求解 5.1.1 分析对象与指标的选取 5.1.2 折线图分析 5.1.3 相关性分析 5.1.4…...
【分布式理论9】分布式协同:分布式系统进程互斥与互斥算法
文章目录 一、互斥问题及分布式系统的特性二、分布式互斥算法1. 集中互斥算法调用流程优缺点 2. 基于许可的互斥算法(Lamport 算法)调用流程优缺点 3. 令牌环互斥算法调用流程优缺点 三、三种算法对比 在分布式系统中,多个应用服务可能会同时…...
第一财经对话东土科技 | 探索工业科技新边界
当前以ChatGPT、Sora等为代表的生成式人工智能快速发展,越来越多面向垂直场景的行业大模型涌现出来,并成为推动制造业智能化改造与数字化转型、加快推进新型工业化,进而培育发展新质生产力的新引擎。 在垂类场景的应用落地,是AI发…...
