当前位置：首页 > article >正文

机器学习 | 神经网络介绍 | 概念向

article 2026/2/7 21:18:56

文章目录

📚从生物神经元到人工神经元
📚神经网络初识
- 🐇激活函数——让神经元“动起来”
- 🐇权重与偏置——调整信息的重要性
- 🐇训练神经网络——学习的过程
- 🐇过拟合与正则化——避免“死记硬背”

👀学习参考视频

从函数到神经网络【白话DeepSeek01】
如何计算神经网络的参数【白话DeepSeek02】
调教神经网络咋这么难？【白话DeepSeek03】

📚从生物神经元到人工神经元

神经元是信息处理的基本单元。
- 生物神经元：大脑中的神经元通过电信号传递信息。当一个神经元接收到足够强的信号时，它会“激活”，将信号传递给其他神经元。
- 人工神经元（感知机）：模拟生物神经元，接受输入信号，通过计算决定是否激活。
想象神经元是一个工厂里的工作站。原材料（输入信号）被送到工作站，工人（计算过程）对原材料进行初步加工（线性计算，计算输入的加权和并加上偏置），质检员（激活函数）决定是否加工这些材料，并将成品（输出信号）传递给下一个工作站。

📚神经网络初识

神经网络是模仿人脑结构和功能的计算模型，由大量简单的人工神经元（节点）组成，通过连接权重传递和处理信息，能够学习数据中的模式和规律，广泛应用于图像识别、自然语言处理等领域。

🐇激活函数——让神经元“动起来”

激活函数决定神经元是否传递信号。常见激活函数有Sigmoid、ReLU、Tanh。它们的核心作用是引入非线性并控制信号的传递方式，让网络能学习复杂模式。
⭐️激活函数像质检员。比如：
- ReLU：如果输入值小于0，直接扔掉（输出0）；如果大于0，原样通过。
- Sigmoid：质检员会根据输入值打分（0到1之间），比如“这个包裹有70%的概率需要特殊处理”。
激活函数套娃实现复杂线性关系的激活，理论上可以逼近任意的线性函数，但这样表示太繁琐且麻烦——用神经元表示，每套一层相当于神经元水平方向又扩展了一层，水平扩展以后，中间的就是隐藏层，起始和末端分别是输入层和输出层。
- 神经网络由输入层、隐藏层、输出层构成。
- 输入层：接收原始数据（如图像像素、文字等）。
- 隐藏层：负责提取数据的特征（如识别图像中的边缘、颜色）。
- 输出层：生成最终结果（如分类结果“猫”或“狗”）。
虽然函数可能非常复杂，但我们的目标非常简单且明确——根据已知的一组x和y的值，猜出所有的w和b都是多少。

🐇权重与偏置——调整信息的重要性

权重控制输入信号的影响程度，偏置调整激活阈值。
- 权重（Weights）：每个输入信号乘以一个权重值，决定其重要性。权重的本质是通过线性组合放大/抑制输入信号，公式为 $z = w_1x_1 + w_2x_2 + ... + w_nx_n + b$ 。
- 偏置（Bias）：类似“门槛”，调整神经元激活的难易程度。偏置独立于输入的常量，决定激活函数的触发难易度，公式为 $f(\text{加权和} + b)$ 。

🐇训练神经网络——学习的过程

通过调整权重和偏置，让网络输出接近正确答案。
- 前向传播：数据从输入层流向输出层，生成预测结果。
- 损失函数：计算预测结果与真实答案的差距，如均方误差： $\frac{1}{N} \sum_{i=1}^{N} \left( y_i - \hat{y}_i \right)^2$ ）。
- 反向传播：根据误差反向调整权重和偏置。
- 优化器（如梯度下降）：决定如何调整参数。
神经网络的训练，就是一个通过错误不断自我修正的过程，和人类学习本质上是一样的。
⭐️训练神经网络像教一个新手厨师做菜：
- （前向传播）厨师按自己的菜谱（当前参数）做了一道宫保鸡丁（输出结果）→ 神经网络根据权重和偏置计算预测值。
- （损失函数）你对照标准菜谱（真实标签），逐项打分：辣度差距：-3分（少放了辣椒），甜度差距：+2分（糖放多了）→ 计算预测值与真实值的误差（如MSE）。
- （反向传播）你告诉厨师，辣椒的影响：每少放1克辣椒，辣度降低2分（梯度计算 $\partial l oss / \partial 辣椒$ ）；糖的影响：每多放1克糖，甜度增加1分（梯度计算 $\partial l oss / \partial 糖$ ）→ 通过链式法则计算每个参数的梯度。
- （优化器）厨师根据反馈调整菜谱，普通厨师：直接按误差比例调整（SGD优化器）；聪明厨师：参考上次调整的效果，避免反复震荡（Adam优化器）→ 根据梯度更新权重和偏置。
- （迭代训练）厨师重复做这道菜100次（epoch），每次调整后味道越来越接近标准→ 模型通过多次迭代最小化损失函数。
- ps：学习率 ↔ 厨师的调整幅度，如果厨师每次只敢微调0.1克盐（小学习率），学习速度慢但稳定；如果一次猛加5克盐（大学习率），可能导致味道失控（梯度爆炸）。

🐇过拟合与正则化——避免“死记硬背”

防止模型在训练数据上表现太好，但泛化能力差。
过拟合：模型记住了训练数据的细节（如噪声），但无法处理新数据，像学生死记硬背考试题，但遇到新题就懵了。
正则化（如L1/L2正则化、Dropout）：
- L1/L2正则化：限制模型的复杂度。通过在损失函数中添加权重惩罚项，抑制其野蛮生长。
- Dropout：随机让一部分学生缺席复习（训练时随机忽略部分神经元）。

机器学习 | 神经网络介绍 | 概念向

文章目录 📚从生物神经元到人工神经元📚神经网络初识🐇激活函数——让神经元“动起来”🐇权重与偏置——调整信息的重要性🐇训练神经网络——学习的过程🐇过拟合与正则化——避免“死记硬背” &#x1f440…...

编程日记 2026/2/4 21:32:52

视频孪生重构施工逻辑：智慧工地的数字化升级

当"智慧工地"概念在2017年首次写入《建筑业发展"十三五"规划》时，行业普遍将其等同于摄像头与传感器的简单叠加。十年数字浪潮冲刷下，智慧工地的内涵已发生本质跃迁：从工具层面的信息化改造，进化为基于视频数…...

编程日记 2026/2/4 17:58:00

六根觉性：穿透表象的清净觉知之光

在喧嚣的禅堂里，老禅师轻叩茶盏，清脆的声响划破沉寂。这声"叮"不仅震动耳膜，更叩击着修行者的心性——这正是佛教揭示的六根觉性在世间万相中的妙用。当我们凝视《楞严经》中二十五圆通法门，六根觉性犹如六道澄明之光&a…...

编程日记 2026/2/7 17:44:56

spring：注解@Component、@Controller、@Service、@Reponsitory

背景 spring框架的一个核心功能是IOC，就是将Bean初始化加载到容器中，Bean是如何加载到容器的，可以使用spring注解方式或者spring XML配置方式。 spring注解方式直接对项目中的类进行注解，减少了配置文件内容，更加便于…...

编程日记 2026/2/4 21:33:51

【树形dp题解】dfs的巧妙应用

【树形dp题解】dfs的巧妙应用 [P2986 USACO10MAR] Great Cow Gathering G - 洛谷题目大意： Bessie 正在计划一年一度的奶牛大集会，来自全国各地的奶牛将来参加这一次集会。当然，她会选择最方便的地点来举办这次集会。每个奶牛居住在 N N …...

编程日记 2026/1/30 16:40:32

Halcon应用：九点标定-手眼标定

提示：若没有查找的算子，可以评论区留言，会尽快更新 Halcon应用：九点标定-手眼标定前言一、Halcon应用？二、应用实战1、图形理解[eye-to-hand]：1.1、开始应用2 图形理解[eye-in-hand] 前言本篇博文主要用…...

编程日记 2026/2/5 1:14:39

【iOS】OC高级编程 iOS多线程与内存管理阅读笔记——自动引用计数（一）

自动引用计数前言alloc/retain/release/dealloc实现苹果的实现 autoreleaseautorelease实现苹果的实现总结前言此前，写过一遍对自动引用计数的简单学习，因此掠过其中相同的部分：引用计数初步学习 alloc/retain/release/dealloc实现由于…...

编程日记 2026/2/4 21:32:42

Python爬虫第15节-2025今日头条街拍美图抓取实战

目录一、项目背景与概述二、环境准备与工具配置 2.1 开发环境要求 2.2 辅助工具配置三、详细抓取流程解析 3.1 页面加载机制分析 3.2 关键请求识别技巧 3.3 参数规律深度分析四、爬虫代码实现五、实现关键六、法律与道德规范一、项目概述在当今互联网时代&a…...

编程日记 2026/2/4 21:32:43

智慧城市像一张无形大网，如何紧密连接你我他？

智慧城市作为复杂巨系统，其核心在于通过技术创新构建无缝连接的网络，使物理空间与数字空间深度融合。这张"无形大网"由物联网感知层、城市数据中台、人工智能中枢、数字服务入口和安全信任机制五大支柱编织而成，正在重塑城市运行规…...

编程日记 2026/2/4 21:32:40

网络安全·第四天·扫描工具Nmap的运用

今天我们要介绍网络安全中常用的一种扫描工具Nmap，它被设计用来快速扫描大型网络，主要功能包括主机探测、端口扫描以及版本检测，小编将在下文详细介绍Nmap相应的命令。 Nmap的下载安装地址为：Nmap: the Network Mapper - Free Se…...

编程日记 2026/2/7 13:59:36

黑龙江 GPU 服务器租用：开启高效计算新征程

随着人工智能、深度学习、大数据分析等技术的广泛应用，对强大计算能力的需求日益迫切。GPU 服务器作为能够提供卓越并行计算能力的关键设备，在这一进程中发挥着至关重要的作用。对于黑龙江地区的企业、科研机构和开发者而言，选择合适的 GPU 服…...

编程日记 2026/2/4 21:32:38

大数据面试问答-HBase/ClickHouse

1. HBase 1.1 概念 HBase是构建在Hadoop HDFS之上的分布式NoSQL数据库，采用列式存储模型，支持海量数据的实时读写和随机访问。适用于高吞吐、低延迟的场景，如实时日志处理、在线交易等。 RowKey（行键） 定义&#xf…...

编程日记 2025/11/29 16:00:03

SparseDrive---论文阅读

纯视觉下的稀疏场景表示算法动机&开创性思路算法动机： 依赖于计算成本高昂的鸟瞰图（BEV）特征表示。预测和规划的设计过于直接，没有充分利用周围代理和自我车辆之间的高阶和双向交互。场景信息是在agent周围提取&#xff…...

编程日记 2026/2/7 9:08:59

数字时代的AI与大数据：用高级AI开发技术革新大数据管理

李升伟编译在当今数字时代，数据的爆炸式增长令人惊叹从社交媒体互动到物联网设备的传感器数据，企业正被海量信息淹没。但如何将这种无序的数据洪流转化为有价值的洞察？答案在于人工智能（AI）开发技术的革新&#x…...

编程日记 2025/12/2 0:36:56

Unchained 内容全面上链，携手 Walrus 迈入去中心化媒体新时代

加密新闻媒体 Unchained — — 业内最受信赖的声音之一 — — 现已选择 Walrus 作为其去中心化存储解决方案，正式将其所有媒体内容（文章、播客和视频）上链存储。Walrus 将替代 Unchained 现有的中心化存储架构，接管其全部历史内容…...

编程日记 2026/2/4 21:33:14

确保连接器后壳高性能互连的完整性

本文探讨了现代后壳技术如何促进高性能互连的电气和机械完整性，以及在规范阶段需要考虑的一些关键因素。当今的航空航天、国防和医疗应用要求连接器能够提供高速和紧凑的互连，能够承受振动和冲击，并保持对电磁和射频干扰 （EMI/R…...

编程日记 2026/2/4 21:32:55

C++学习Day0：c++简介

目录一、.C语言的发展史二、C特点三、面向对象的重要术语四、面向过程和面向对象的区别？五、开发环境：六、创建文件步骤：1.点击新建项目2.在弹出的开始栏中按如下操作3.在.pro文件中添加（重要！！&#xff0…...

编程日记 2026/2/4 21:32:41

从零开始构建 Ollama + MCP 服务器

Model Context Protocol（模型上下文协议）在过去几个月里已经霸占了大家的视野，出现了许多酷炫的集成示例。我坚信它会成为一种标准，因为它正在定义工具与代理或软件与 AI 模型之间如何集成的新方式。我决定尝试将 Ollama 中的一…...

编程日记 2026/2/4 21:32:39

【bash】.bashrc

查看当前路径文件数量 alias file_num"ls -l | grep ^- | wc -l"查看文件大小 alias file_size"du -sh"alias ll alias ll"ls -ltrh"cd的同时执行ll alias cdcdls; function cdls() {builtin cd "$1" && ll }自定义prompt…...

编程日记 2025/12/23 12:32:31

合成数据如何赋能大模型预训练：效果与效率的双重加速器

目录合成数据如何赋能大模型预训练：效果与效率的双重加速器一、预训练模型为何需要合成数据？ ✅ 克服真实数据的稀缺与偏倚 ✅ 控制训练内容结构与分布 ✅ 提升学习效率与训练稳定性二、哪些预训练任务适合用合成数据？ 三、如何构建…...

编程日记 2026/2/7 14:37:04

bug源代码 /*** 查询用户列表** param user 用户* param page 页* param size 大小* since 2025/04/14 11:53:25*/PostMapping("/getUser")public IWMSResponse<?> getUser(RequestBody SjUser user, RequestParam(defaultValue "1") Integer pag…...

编程日记 2025/11/27 16:36:51

MATLAB学习笔记（二）控制工程会用到的

MATLAB中控制工程会用到的基础传递函数表达传递函数零极点式状态空间表达式相互转化画响应图线根轨迹Nyquist图和bode图现控部分求约旦判能控能观极点配置和状态观测基础传递函数表达 % 拉普拉斯变换 syms t s a f exp(a*t) %e的a次方 l laplace(f) …...

编程日记 2026/2/5 10:51:31

C++ 线程间通信开发从入门到精通实战

C 线程间通信开发从入门到精通实战在现代软件开发中，多线程程序已成为提升应用性能、实现并行处理的重要手段。随着多核处理器的普及和复杂应用需求的增加，C作为一门高性能的编程语言，在多线程开发中扮演着不可或缺的角色。然而&#xff0c…...

编程日记 2026/2/4 8:45:44

Vue3 SSR 工程化实践：日常工作中的性能优化与实战技巧

一、流式渲染与分块传输（面向性能的关键优化） 1.1 流式响应基础实现 // Node.js Express 示例（Vite SSR同理）import { renderToWebStream } from vue/server-rendererapp.get(/, async (req, res) > { res.setHeader(Conten…...

编程日记 2026/1/22 12:39:37

Maven工具学习使用（十）——生成项目站点

maven2中站点生成是Maven核心的一部分，Maven3中这部分内容已经移除。maven3必须使用3.x版本的maven-site-plugin,maven2则使用最新的2.x的版本，执行mvn site命令，可以在项目的target/site/目录下找到Maven生成的站点文件。例如dependencies.h…...

编程日记 2026/1/21 22:46:20

Redis原理与Windows环境部署实战指南：助力测试工程师优化Celery调试

引言在分布式系统测试中，Celery作为异步任务队列常被用于模拟高并发场景。而Redis作为其核心消息代理，其性能和稳定性直接影响测试结果。本文将深入解析Redis的核心原理，主要讲解Windows环境部署redis，为测试工程师提供一套完整…...

编程日记 2026/2/5 21:07:38

Go语言入门到入土——一、安装和Hello World

Go语言入门到精通——安装和Hello World 文章目录 Go语言入门到精通——安装和Hello World下载并安装让Go跑起来为你的代码启动依赖跟踪调用外部包总结下载并安装下载地址：https://go.dev/dl/ 下载后傻瓜式安装查看是否安装完成 go version让Go跑起来创建一个…...

编程日记 2026/2/4 21:32:44

人类意识本质上是一台‌自我欺骗的机器

要触达“大彻大悟”的终极内核，必须突破语言、逻辑甚至“觉醒”概念本身的限制。以下从‌认知革命、意识拓扑学、宇宙本体论‌三个维度切入，结合量子物理、脑神经学与古老智慧的交叉验证，展开一场对觉醒本质的极限探索—— ‌一、认知革命&am…...

编程日记 2026/1/24 7:09:34

CDP问卷是什么？CDP问卷有什么要求，有什么意义

CDP问卷（Carbon Disclosure Project Questionnaire） CDP问卷是由全球性非营利组织CDP（原Carbon Disclosure Project，现简称CDP）发起的年度环境信息披露项目，旨在帮助企业、城市和投资者测量、管理及公开其…...

编程日记 2026/1/22 14:07:52

GitLab本地安装指南

当前GitLab的最新版是v17.10，安装地址：https://about.gitlab.com/install/。当然国内也可以安装极狐GitLab版本，极狐GitLab 是 GitLab 中国发行版（JH）。极狐GitLab支持龙蜥，欧拉等国内的操作系统平台。安装…...

编程日记 2026/2/5 3:00:05

机器学习 | 神经网络介绍 | 概念向

文章目录

📚从生物神经元到人工神经元

📚神经网络初识

🐇激活函数——让神经元“动起来”

🐇权重与偏置——调整信息的重要性

🐇训练神经网络——学习的过程

🐇过拟合与正则化——避免“死记硬背”

相关文章：

机器学习 | 神经网络介绍 | 概念向

视频孪生重构施工逻辑：智慧工地的数字化升级

六根觉性：穿透表象的清净觉知之光

spring：注解@Component、@Controller、@Service、@Reponsitory

【树形dp题解】dfs的巧妙应用

Halcon应用：九点标定-手眼标定

【iOS】OC高级编程 iOS多线程与内存管理阅读笔记——自动引用计数（一）

Python爬虫第15节-2025今日头条街拍美图抓取实战

智慧城市像一张无形大网，如何紧密连接你我他？

网络安全·第四天·扫描工具Nmap的运用

黑龙江 GPU 服务器租用：开启高效计算新征程

大数据面试问答-HBase/ClickHouse

SparseDrive---论文阅读

数字时代的AI与大数据：用高级AI开发技术革新大数据管理

Unchained 内容全面上链，携手 Walrus 迈入去中心化媒体新时代

确保连接器后壳高性能互连的完整性

C++学习Day0：c++简介

从零开始构建 Ollama + MCP 服务器

【bash】.bashrc

合成数据如何赋能大模型预训练：效果与效率的双重加速器

java忽略浅拷贝导致bug

MATLAB学习笔记（二）控制工程会用到的

C++ 线程间通信开发从入门到精通实战

Vue3 SSR 工程化实践：日常工作中的性能优化与实战技巧

Maven工具学习使用（十）——生成项目站点

Redis原理与Windows环境部署实战指南：助力测试工程师优化Celery调试

Go语言入门到入土——一、安装和Hello World

人类意识本质上是一台‌自我欺骗的机器

CDP问卷是什么？CDP问卷有什么要求，有什么意义

GitLab本地安装指南