当前位置: 首页 > article >正文

小白从零开始勇闯人工智能:深度学习汇总(复习大纲篇)

一、神经网络基础1、神经元深度学习的“细胞”输入特征向量比如一张图片的像素值、房价预测中的面积和房间数。权重每个输入的重要程度模型通过训练自动学习。如果所有权重初始化为 0所有神经元对称无法学习。偏置让神经元可以平移决策边界即使输入全为零神经元仍可能被激活。加权和将输入与权重相乘后求和再加上偏置。激活函数引入非线性否则多层网络等效于单层线性模型无法拟合复杂问题。2、激活函数让网络“活”起来Sigmoid输出 (0,1)适合表示概率。缺点是梯度消失导数最大仅 0.25深层网络梯度指数衰减输出非零中心收敛慢。Tanh输出 (-1,1)零中心化比 Sigmoid 稍好但依然存在梯度消失。ReLU计算快正区间梯度恒为 1缓解梯度消失。但会有神经元死亡输入永远为负则不再更新。我们可以通过Leaky ReLU给负数一个微小斜率、PReLU斜率可学习、ELU、Swish来改进这一缺点。CNN 多用 ReLU 及其变种RNN 常用 tanh输出层二分类用 sigmoid多分类用 softmax回归用线性。3、前向传播与反向传播前向传播数据从输入层逐层计算最终得到预测结果。反向传播基于链式法则从输出层反向计算每个参数对损失的梯度并用梯度下降更新参数。这是网络“学习”的核心。二、模型训练与优化1、损失函数衡量预测与真实之间的差距均方误差MSE回归任务常用放大大误差的惩罚。交叉熵损失分类任务首选与 softmax 结合时梯度形式优美误差越大更新越快。为什么分类不用 MSE因为 MSE 配合 sigmoid 时梯度易饱和收敛慢且概率解释不匹配。还有多标签分类用二值交叉熵BCE每个类别独立 sigmoid。2、优化器如何下山SGD每次用一小批数据计算梯度直接更新。容易震荡收敛慢。SGD 动量累积历史梯度加速在平坦区域的移动减少震荡。Adam自适应学习率 动量收敛快超参数鲁棒是目前默认首选。偏差修正初始时刻矩估计有偏需校正。AdamW解耦权重衰减泛化更好。建议先选Adam 系列快速上手SGD 动量在图像分类上有时精度更高。3、学习率学习率太大会损失震荡不收敛。太小会收敛极慢易陷入局部最优。学习率的衰减为初期大步探索后期微调。4、过拟合与正则化过拟合模型死记硬背训练数据泛化能力差。L1/L2 正则化在损失中加权重惩罚。L2 让权重趋近于 0L1 使权重稀疏。Dropout训练时随机丢弃神经元迫使网络学习冗余特征。测试时关闭并缩放权重。数据增强旋转、翻转、裁剪、颜色抖动、MixUp、CutMix 等让模型见到更多样本来提升泛化。早停法验证集损失不再下降时停止训练最简单有效的正则化。标签平滑将硬标签0,1变为软标签0.05,0.95防止模型过于自信。5、归一化Batch Normalization对小批量样本做归一化再学习缩放和平移。加速收敛轻微正则化。缺点小 batch 效果差不适用于 RNN。Layer Normalization对单个样本所有特征归一化适用于 Transformer 和 RNN。Instance Norm每个样本每个通道独立归一化用于风格迁移。Group Norm折中方案在小 batch 下比 Batch Norm 稳定。三、卷积神经网络CNN与 YOLO1、卷积操作卷积核滑动手电筒提取局部模式参数共享平移不变性。步长控制输出尺寸步长为 2 时尺寸减半。填充Same 填充使输出尺寸不变避免边缘信息丢失。空洞卷积扩大感受野而不增参数。2、池化层最大池化保留最强特征。平均池化平滑信息。池化层没有可学习参数只下采样。3、经典 CNN 架构LeNet-5手写数字识别。AlexNetReLU、Dropout、GPU 并行。VGGNet堆叠小卷积核3×3参数少非线性强。ResNet跳跃连接解决退化问题可训练极深网络。残差学习让网络至少不差于浅层。Inception多尺度卷积核并行1×1 降维。DenseNet每层与所有前层连接特征复用显存大。EfficientNet复合缩放深度、宽度、分辨率。4、YOLO实时目标检测1、核心思想You Only Look Once将检测视为回归问题一次前向传播得到所有框。网格划分输入图划分为 S×S 网格每个网格负责预测中心落在此网格的物体。每个网格输出B 个边界框x, y, w, h, confidence C 个类别概率。损失函数坐标误差权重高、置信度误差、类别误差。2、演进YOLOv2引入 BatchNorm、锚点框、多尺度训练、联合训练YOLO9000。YOLOv3Darknet-53 骨干多尺度预测三个尺度用二元交叉熵实现多标签分类。YOLOv4/v5集成各种 trickMish、SPP、PANet、Mosaic 等工程优化。YOLOv8无锚点设计更强骨干支持实例分割。YOLO系列的优点是处理速度极快全局感受野背景误检少但是对小物体检测差密集物体易漏检。四、循环神经网络与序列模型1、RNN循环神经网络RNN通过隐藏状态在时间步之间传递信息形成对过往序列的记忆因此特别适合处理文本、语音等序列数据。然而在长序列训练中梯度消失或梯度爆炸问题会严重削弱模型对远距离依赖关系的捕捉能力使其难以有效关联前后相距较远的信息。2、LSTM长短时记忆网络通过精巧设计的遗忘门、输入门和输出门构建出独立的细胞状态让信息能在长序列中稳定传递有效缓解了传统RNN的长距离依赖问题。门控循环单元则是其简化版本将门结构合并在参数量更少、计算更高效的同时性能与LSTM相当。3、梯度裁剪梯度裁剪是一种常用的优化技巧通过预设一个阈值在反向传播时计算梯度的范数若范数超过该阈值则按比例缩放梯度使其幅度被限制在可控范围内。这种方法能有效防止梯度爆炸避免参数更新步长过大导致训练不稳定从而保障模型在长序列或深层网络中平稳收敛。五、Transformer 与 BERT1、Transformer 基础Transformer的核心是自注意力机制通过将输入映射为查询、键、值三个矩阵计算每对位置的相关性并以缩放点积形式加权聚合实现全局依赖的并行建模。多头注意力让模型从不同表示子空间联合关注信息。为弥补序列顺序的缺失引入正弦位置编码或可学习嵌入。每个位置通过独立的前馈网络增强表达配合残差连接与层归一化有效稳定了深层网络的训练。2、BERT双向编码器表示1、模型输入模型输入由三部分相加构成Token Embeddings通过WordPiece分词将词元映射为向量Segment Embeddings用于区分不同句子Position Embeddings采用可学习方式注入位置信息。此外输入序列中会加入特殊标记——[CLS]用于聚合整体语义以支持分类任务[SEP]用于分隔句子对[MASK]则作为掩码语言建模的预测目标。2、预训练任务掩码语言模型随机选取15%的词元进行预测其中80%替换为[MASK]10%替换为随机词元10%保持不变以此缓解预训练与微调之间的输入不匹配。下一句预测则通过判断两段文本是否为连续片段使模型学习句子间的语义关系。两者共同构成了BERT的预训练任务。3、微调微调阶段通常取[CLS]标记的输出向量作为序列的整体表示在其上方接入分类层并对整个预训练模型进行端到端的参数更新。这种方式能使模型快速适配分类、序列标注、问答等多种下游任务充分利用预训练学到的语言知识。4、BERT vs GPTBERT基于编码器架构实现双向上下文建模通过掩码语言模型与下一句预测进行预训练擅长分类、序列标注等理解类任务而GPT采用解码器架构进行自回归生成仅关注左侧上下文适用于文本生成场景。在面试中常问BERT选择双向而非自回归是因为理解任务更需要全局信息掩码时不全用[MASK]是为了避免预训练与微调间的输入差异受位置嵌入限制模型通常处理512长度以内的文本更长时可借助滑动窗口或分层策略。维度 BERT GPT 架构 编码器双向 解码器单向 预训练 掩码语言模型 NSP 自回归语言模型 适用 理解类任务 生成类任务 上下文 同时看左右 只看左边

相关文章:

小白从零开始勇闯人工智能:深度学习汇总(复习大纲篇)

一、神经网络基础1、神经元:深度学习的“细胞”输入:特征向量,比如一张图片的像素值、房价预测中的面积和房间数。权重:每个输入的重要程度,模型通过训练自动学习。如果所有权重初始化为 0,所有神经元对称&…...

盘点超景深工业显微镜十大品牌,购买要点全详解

引言 在工业生产质检、材料研究、精密制造等领域,超景深工业显微镜的性能直接影响检测精度与工作效率,选择一款适配需求的设备至关重要。超景深技术作为核心竞争力,能解决体视显微镜景深不足的痛点,清晰呈现样品立体细节&#xf…...

23种路径规划算法解决机器人导航核心难题

23种路径规划算法解决机器人导航核心难题 【免费下载链接】PathPlanning Common used path planning algorithms with animations. 项目地址: https://gitcode.com/gh_mirrors/pa/PathPlanning 从理论到代码:机器人路径规划算法实战指南 技术背景&#xff1…...

Lychee模型在金融领域的应用:财报图文智能分析

Lychee模型在金融领域的应用:财报图文智能分析 1. 引言 金融分析师每天都要面对海量的财报文档,其中包含大量的表格、图表和文字说明。传统的人工分析方式不仅效率低下,还容易因为疲劳导致关键信息遗漏。一份典型的上市公司年报可能包含上百…...

3步打造专业流程图:Vue-Flow-Editor新手入门完全指南

3步打造专业流程图:Vue-Flow-Editor新手入门完全指南 【免费下载链接】vue-flow-editor Vue Svg 实现的flow可视化编辑器 项目地址: https://gitcode.com/gh_mirrors/vu/vue-flow-editor 还在为复杂的流程图设计工具而头疼吗?想要一款既轻量又强…...

终结RGB设备控制碎片化:OpenRGB让跨品牌灯光同步成为现实

终结RGB设备控制碎片化:OpenRGB让跨品牌灯光同步成为现实 【免费下载链接】OpenRGB Open source RGB lighting control that doesnt depend on manufacturer software. Supports Windows, Linux, MacOS. Mirror of https://gitlab.com/CalcProgrammer1/OpenRGB. Rel…...

# 发散创新:用 Rust实现高性能光线追踪渲染器——从零构建你的第一个 GPU 加速光追引擎在现代图形学领域,**光线追踪(Ray

发散创新:用 Rust 实现高性能光线追踪渲染器——从零构建你的第一个 GPU 加速光追引擎 在现代图形学领域,光线追踪(Ray Tracing) 已成为高质量实时渲染的核心技术之一。它模拟真实世界中光线传播路径,实现逼真的阴影、…...

终极指南:如何用MobaXterm中文版高效解决远程服务器管理5大痛点

终极指南:如何用MobaXterm中文版高效解决远程服务器管理5大痛点 【免费下载链接】Mobaxterm-Chinese Mobaxterm simplified Chinese version. Mobaxterm 的简体中文版. 项目地址: https://gitcode.com/gh_mirrors/mo/Mobaxterm-Chinese MobaXterm中文版作为专…...

GHelper:华硕笔记本用户的轻量级控制神器

GHelper:华硕笔记本用户的轻量级控制神器 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops. Control tool for ROG Zephyrus G14, G15, G16, M16, Flow X13, Flow X16, TUF, Strix, Scar and other models 项目地址: https://g…...

5个高效工具助你构建企业级Tesseract.js OCR应用

5个高效工具助你构建企业级Tesseract.js OCR应用 【免费下载链接】tesseract.js Pure Javascript OCR for more than 100 Languages 📖🎉🖥 项目地址: https://gitcode.com/gh_mirrors/te/tesseract.js 在数字化转型过程中&#xff0c…...

4步实现Axure本地化:提升原型设计效率的界面汉化指南

4步实现Axure本地化:提升原型设计效率的界面汉化指南 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包,不定期更新。支持 Axure 9、Axure 10。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn Ax…...

纹理压缩效率革命:Intel Texture Works插件如何重塑数字创作流程

纹理压缩效率革命:Intel Texture Works插件如何重塑数字创作流程 【免费下载链接】Intel-Texture-Works-Plugin Intel has extended Photoshop* to take advantage of the latest image compression methods (BCn/DXT) via plugin. The purpose of this plugin is t…...

丹青幻境惊艳效果展示:AI生成敦煌壁画风格飞天形象高清细节图

丹青幻境惊艳效果展示:AI生成敦煌壁画风格飞天形象高清细节图 1. 敦煌飞天艺术与AI技术的完美融合 敦煌飞天作为中国传统艺术的瑰宝,以其飘逸的线条、绚丽的色彩和神秘的意境闻名于世。如今,通过丹青幻境这一AI艺术创作工具,我们…...

【困惑度 计算和可视化】

困惑度(Perplexity)是语言模型评估中一个非常核心的指标,本质上是衡量模型对一段文本“有多不确定”。 一、定义(从概率角度) 给定一个序列 ( w_1, w_2, …, w_N ),语言模型会给出条件概率: P(w1,w2,...,wN)=∏i=1NP(wi∣w1,...,wi−1)P(w_1, w_2, ..., w_N) = \prod_…...

PyEMD:经验模态分解的Python实现与应用指南

PyEMD:经验模态分解的Python实现与应用指南 【免费下载链接】PyEMD Python implementation of Empirical Mode Decompoisition (EMD) method 项目地址: https://gitcode.com/gh_mirrors/py/PyEMD 引言 在非平稳信号处理领域,传统傅里叶变换难以有…...

FLUX 2 Klein加持!BFS换脸:高保真头脸替换新体验

FLUX 2 Klein加持!BFS换脸:高保真头脸替换新体验 【免费下载链接】BFS-Best-Face-Swap 项目地址: https://ai.gitcode.com/hf_mirrors/Alissonerdx/BFS-Best-Face-Swap 导语:基于FLUX 2 Klein架构的BFS换脸模型(Best Face…...

嵌入式硬件第四弹——51单片机(4)

(续接上篇)8. DS18B208.1 传感器参数传感器名称功能量程精度工作电压分辨率DS18B20温度采集-55℃ - 125℃0.5℃3V - 5.5V12位 0.06258.2 操作ROM命令1. 读ROM (0x33)2. 搜索ROM (0xF0)3. 匹配ROM &#xff…...

老款Mac升级:使用OpenCore Legacy Patcher实现系统兼容性扩展

老款Mac升级:使用OpenCore Legacy Patcher实现系统兼容性扩展 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 随着苹果对旧款Mac设备的系统支持逐步终止&#…...

2026天津AI获客服务标杆机构盘点

一、行业现状与榜单筛选标准《2025中国企业数字化获客能力调研报告》指出,国内近七成中小微企业正面临获客成本高、精准度欠佳的难题,其中天津地区的制造业、零售业及本地生活类企业中,72%的受访者反映,线上搜索排名滞后、咨询量不…...

逆向尺寸:在亚马逊“越大越好”的惯性中寻找颠覆性空位

在亚马逊的每一个类目里,都存在着一条无形的“尺寸进化轴”——产品通常朝着功能更多、容量更大、配件更全的方向“进化”。然而,最犀利的破局点往往隐藏在这条主流轴线的反方向:一个被所有人忽视的“尺寸空位”。大众甲壳虫的“Think Small”…...

终极TIDAL音乐下载指南:tidal-dl-ng完整使用教程与源码解析

终极TIDAL音乐下载指南:tidal-dl-ng完整使用教程与源码解析 【免费下载链接】tidal-dl-ng TIDAL Media Downloader Next Generation! Up to HiRes / TIDAL MAX 24-bit, 192 kHz. 项目地址: https://gitcode.com/gh_mirrors/ti/tidal-dl-ng TIDAL音乐下载神器…...

突破ESXi网卡限制:RTL8125驱动部署全方案

突破ESXi网卡限制:RTL8125驱动部署全方案 【免费下载链接】r8125-esxi Realtek RTL8125 driver for ESXi 6.7 项目地址: https://gitcode.com/gh_mirrors/r8/r8125-esxi 在虚拟化环境中,Realtek RTL8125网卡常因缺乏官方ESXi驱动而无法发挥性能&a…...

OpenClaw硬件推荐:Qwen3.5-4B-Claude模型在不同设备上的性价比分析

OpenClaw硬件推荐:Qwen3.5-4B-Claude模型在不同设备上的性价比分析 1. 为什么需要关注硬件选择? 去年我在尝试用OpenClaw自动化处理个人知识库时,发现同样的Qwen3.5-4B-Claude模型在不同设备上的表现差异巨大。我的旧笔记本跑一个简单的文件…...

JVM面试问题总结

一:什么是JVM(1)定义:JVM指的是Java虚拟机。JVM本质上是一个运行在计算机上的程序,他的职责是运行Java字节码文件。(2)作用:为了支持Java中一次编写,到处运行的跨平台特性…...

开源火箭仿真软件OpenRocket全攻略:从环境搭建到飞行模拟

开源火箭仿真软件OpenRocket全攻略:从环境搭建到飞行模拟 【免费下载链接】openrocket Model-rocketry aerodynamics and trajectory simulation software 项目地址: https://gitcode.com/GitHub_Trending/op/openrocket 开源火箭仿真工具OpenRocket为航天爱…...

ESP32 GitHub OTA升级库:语义化版本驱动的安全固件更新

1. 项目概述 esp_ghota 是一款专为 ESP32 系列 SoC 设计的嵌入式 OTA(Over-The-Air)升级库,其核心能力是通过 GitHub Releases API 实现固件与文件系统分区的远程安全更新。该库并非从零构建网络协议栈或 OTA 引擎,而是深度集成…...

嵌入式NTP客户端:轻量级时间同步库设计与实战

1. NTP客户端库技术解析与嵌入式工程实践1.1 协议基础与嵌入式定位网络时间协议(Network Time Protocol, NTP)是IETF标准化的RFC 5905协议,用于在分布式网络中实现毫秒级时间同步。在嵌入式系统中,NTP客户端并非简单地“获取时间”…...

在Linux服务器环境下如何用pywpsrpc实现WPS Office自动化处理

在Linux服务器环境下如何用pywpsrpc实现WPS Office自动化处理 【免费下载链接】pywpsrpc 项目地址: https://gitcode.com/gh_mirrors/py/pywpsrpc 面对Linux服务器上批量处理Office文档的挑战,你是否还在为缺乏原生Office自动化支持而烦恼?pywps…...

突破系统壁垒:zyfun跨平台视频播放器的技术创新与实践

突破系统壁垒:zyfun跨平台视频播放器的技术创新与实践 【免费下载链接】zyfun 跨平台桌面端视频资源播放器,免费高颜值. 项目地址: https://gitcode.com/gh_mirrors/zy/zyfun 在数字化娱乐时代,用户对视频播放体验的需求日益多元化,然…...

华硕笔记本游戏卡顿深度优化指南:开源工具G-Helper解决方案

华硕笔记本游戏卡顿深度优化指南:开源工具G-Helper解决方案 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops. Control tool for ROG Zephyrus G14, G15, G16, M16, Flow X13, Flow X16, TUF, Strix, Scar and other models 项…...