当前位置：首页 > article >正文

【笔记ing】AI大模型-03深度学习基础理论

article 2026/2/8 9:54:18

神经网络：A neural network is a network or circuit of neurons,or in a modern sense,an artificial neural network,composed of artificial neurons or nodes.神经网络是神经元的网络或回路，或者在现在意义上来说，是一个由人工神经元或节点组成的人工神经网络。

人工神经网络Artificial Neural Networks，ANNs，也简称神经网络NNs或连接模型Connection Model。是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。

深度学习：Deep learning(alse known as deep structured learning)is part of a broader family of machine learning methods based on artificial neural nerworks with representation learning.Learnig can be supervised,semi-supervised or unsupervised.深度学习，也即深度结构化学习，是基于具有代表性学习（表征学习）的人工神经网络的更广泛的机器学习方法的重要组成部分。深度学习可以是监督学习，也可以是半监督学习或无监督学习。

深度学习Deep Learning DL是机器学习Machine Learning ML领域中一个新的研究方向，被引入机器学习使其更接近于最初的目标——人工智能Artificial Intelligence AI。

深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够是识别问题、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术，以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动，解决了很多复杂的模式识别难题，使得人工智能相关技术取得了很大进步。

生物神经元：神经元即神经元细胞，是神经系统最基本的结构和功能单位。分为细胞体和突起两部分。细胞体由细胞核、细胞膜、细胞质组成，具有联络和整合输入信息并传出信息的作用。突起有树突和轴突两种。树突短而分枝多，直接由细胞体扩张突出，形成树枝状，其作用是接受其他神经元轴突传来的冲动并传给细胞体。轴突长而分枝少，为粗细均匀的细长突起，常起于轴丘，其作用是接受外来刺激，再由细胞体传出。轴突除分出侧枝外，其末端形成树枝样的神经末梢。末梢分布于某些组织器官内，形成各神经末梢装置。感觉神经末梢形成各种感受器；运动神经末梢分布于骨骼肌肉，形成运动终板

（人工）神经元：也称人工记忆神经元，通常也称处理单元，不是人脑神经系统下生物神经元细胞的真实描述，只是一种抽象模拟；本质上可以将人工神经元理解为一种于人工神经网络中完成结构化构造的单一数据结构；一个人工记忆神经元的功能是求的输入向量与权重向量的内积后，经一个非线性传递函数得到一个标量结果。单个神经元的作用：把一个n维向量空间用一个超平面区分称两部分（称为判断边界），给定一个输入向量，神经元可以判断出这个向量位于超平面的哪一边。

人工神经网络基本结构

人工神经网络本质上是一个数学函数模型，假设以y=f(x)描述该函数模型，那么一个人工神经网络对应于该函数模型之上，就会包含三个重要组成部分：输入层、输出层、隐藏层。

输入层：即Input Layer，负责从外部数据集输入数据信息，由输入单元组成，这些输入单元可接收样本中各种不同的特征信息；输入层就对应人工神经网络数学模型y=f(x)中的x，即某函数的自变量。在神经网络模型中，自变量x由一个n维向量（行或列矩阵）描述。在概率模型中，输入层实则对应一个来自训练集的n维连续或离散型随机变量。

输出层：即Output Layer，负责生成网络输出的最终结果，由输出单元组成，每个输出单元对应某一种特定的类别结果；输出层就对应人工神经网络数学函数模型y=f(x)中的y，即某函数的因变量。在神经网络模型中，因变量y也是由一个n维向量描述。

隐藏层：即Hidden Layer，负责神经网络内部的信息处理及信息变换。

整个输入层、隐藏层、输出层就对应一个完整的数学模型y=f(x)

上述人工神经网络示例图

每一个节点就是一个人工神经元

神经元之间的连接就是轴突，即神经元之间的连接，负责神经元之间的信号传递，实则传递的信号就是一些数值

神经网络之所以一般称为深度神经网络，主要是因为其中隐藏层及其层数，看上去有好多层，所以就是深度神经网络，深度即神经网络的层数。

深度学习之所以称为深度结构化学习，是因为在神经网络模型中，网络的结构都是预先定义好的

表征学习：输入层负责输入向量特征，输出层负责输出最终结果，其中的隐藏层就负责从输入向量中学习数据的特征，对输入层进行特征抽取，特征表达，即将低维的输入逐层的抽取、转换得到高维特征表达。

————————————

仅用于本人学习

来源：网络

【笔记ing】AI大模型-03深度学习基础理论

相关文章：

【笔记ing】AI大模型-03深度学习基础理论

Hutool工具包中`copyProperties`和`toBean`的区别

高德地图 JS-SDK 实现教程

07软件测试需求分析案例-修改用户信息

分层对象模型：PO、DTO、VO、BO定义区别与使用场景

设计模式 --- 状态模式

Java多态课堂练习题

SAP系统中的借货

深入剖析Go Channel：从底层原理到高阶避坑指南｜Go语言进阶（5）

OpenCV 图形API（31）图像滤波-----3x3 腐蚀操作函数erode3x3()

5.5 GitHub数据秒级分析核心揭秘：三层提示工程架构设计解析

【Java学习笔记】Java初级阶段代码规范

AI Agent开发大全第二十八课-MCP实现本地命令调用怎么做的？

macOS 上使用 Homebrew 安装和配置 frp 客户端

为 docker 拉取镜像配置代理

A2A协议实现详解及示例

TDengine 语言连接器（Node.js）

ESP-IDF 开发框架：探索ESP32的强大底层世界

活动图与流程图的区别与联系：深入理解两种建模工具

如何在 Java 中对 PDF 文件进行数字签名（教程）

图片文本识别OCR+DeepSeekapi实现提取图片关键信息

go 通过汇编分析函数传参与返回值机制

解决Ubuntu Desktop 24.04 VMware中安装后不能全屏显示，只能居中的问题

【笔记ing】AI大模型-04逻辑回归模型

分布式ID生成方案的深度解析与Java实现

AF3 ProteinDataModule类解读

如何将一个8s的接口优化到500ms以下

记录学习的第二十五天

linux电源管理(二)，内核的CPUFreq(DVFS)和ARM的SCPI

【LeetCode 热题 100】哈希系列