当前位置：首页 > news >正文

深度学习入门（二）：神经网络整体架构

news 2026/5/26 7:12:21

一、前向传播

作用于每一层的输入，通过逐层计算得到输出结果

二、反向传播

作用于网络输出，通过计算梯度由深到浅更新网络参数
在这里插入图片描述

三、整体架构

层次结构：逐层变换数据
神经元：数据量、矩阵大小（代表输入特征的数量）

$x ： [1, 3]$
$w_1：[3,4]$
$hi dd e n l a yer 1 ： [1, 4]$
$w_2：[4,4]$
$hi dd e n l a yer 2 ： [1, 4]$
$w_3：[4,1]$
在这里插入图片描述

非线性操作加在每一步矩阵计算之后，增加神经网络的非线性。没有激活函数的每层都相当于矩阵相乘。就算你叠加了若干层之后，无非还是个矩阵相乘罢了。

在这里插入图片描述

四、神经元个数对结果的影响（Stanford例子）

Stanford可视化的神经网络，可以自行调参数试试

1、 num_neurons:1

将神经元设置为1，查看效果

layer_defs = [];
layer_defs.push({type:'input', out_sx:1, out_sy:1, out_depth:2});
layer_defs.push({type:'fc',  num_neurons:1, activation: 'tanh'});
layer_defs.push({type:'fc', num_neurons:1, activation: 'tanh'});
layer_defs.push({type:'softmax', num_classes:2});net = new convnetjs.Net();
net.makeLayers(layer_defs);trainer = new convnetjs.SGDTrainer(net, {learning_rate:0.01, momentum:0.1, batch_size:10, l2_decay:0.001});

查看circle data，可以看出效果不佳，看上去像切了一刀。
在这里插入图片描述

2、 num_neurons:2

将神经元设置为2，查看效果

layer_defs = [];
layer_defs.push({type:'input', out_sx:1, out_sy:1, out_depth:2});
layer_defs.push({type:'fc', num_neurons:2, activation: 'tanh'});
layer_defs.push({type:'fc', num_neurons:2, activation: 'tanh'});
layer_defs.push({type:'softmax', num_classes:2});net = new convnetjs.Net();
net.makeLayers(layer_defs);trainer = new convnetjs.SGDTrainer(net, {learning_rate:0.01, momentum:0.1, batch_size:10, l2_decay:0.001});

查看circle data，可以看出效果一般，看上去像切了两刀，抛物线状。
在这里插入图片描述

3、 num_neurons:3

将神经元设置为3，查看效果

layer_defs = [];
layer_defs.push({type:'input', out_sx:1, out_sy:1, out_depth:2});
layer_defs.push({type:'fc', num_neurons:3, activation: 'tanh'});
layer_defs.push({type:'fc', num_neurons:3, activation: 'tanh'});
layer_defs.push({type:'softmax', num_classes:2});net = new convnetjs.Net();
net.makeLayers(layer_defs);trainer = new convnetjs.SGDTrainer(net, {learning_rate:0.01, momentum:0.1, batch_size:10, l2_decay:0.001});

查看circle data，可以看出效果较好。
在这里插入图片描述

五、正则化

正则化 $R (w)$ 的作用：稳定时出现平滑边界
在这里插入图片描述

六、参数个数对结果的影响

在这里插入图片描述

七、激活函数

$S i g mi o d$ ：数值较大或较小时，梯度约为0，出现梯度消失问题
$R e l u$ ：当前主要使用的激活函数
在这里插入图片描述

八、数据预处理

在这里插入图片描述

九、参数初始化

通常我们都使用随机策略来进行参数初始化

十、DROP-OUT（传说中的七伤拳）

过拟合是神经网络非常头疼的一个问题！
左图是全连接神经网络，右图在神经网络训练过程中，每一层随机杀死部分神经元。DROP-OUT是防止神经网络过于复杂，进行随机杀死神经元的一种方法。
在这里插入图片描述

深度学习入门（二）：神经网络整体架构

一、前向传播作用于每一层的输入，通过逐层计算得到输出结果二、反向传播作用于网络输出，通过计算梯度由深到浅更新网络参数三、整体架构层次结构：逐层变换数据神经元：数据量、矩阵大小（代表输入特征的数量…...

编程日记 2023/7/30 3:15:18

rustup 镜像在 cmd 中输入以下代码，设置环境变量 setx RUSTUP_UPDATE_ROOT https://mirrors.tuna.tsinghua.edu.cn/rustup/rustup setx RUSTUP_DIST_SERVER https://mirrors.tuna.tsinghua.edu.cn/rustupcrates.io 索引镜像在 C:\Users\用户名\.cargo\config 文…...

编程日记 2023/7/30 3:14:17

文心一言 VS 讯飞星火 VS chatgpt （67）-- 算法导论6.5 6题

文心一言 VS 讯飞星火 VS chatgpt （67）-- 算法导论6.5 6题六、在 HEAP-INCREASE-KEY 的第 5 行的交换操作中，一般需要通过三次赋值来完成。想一想如何利用INSERTION-SORT 内循环部分的思想，只用一次赋值就完成这一交换操作? 文…...

编程日记 2023/7/30 3:13:15

6、Kubernetes核心技术 - Pod

目录一、概述二、Pod机制 2.1、共享网络 2.2、共享存储三、Pod资源清单四、 Pod 的分类五、Pod阶段六、Pod 镜像拉取策略 ImagePullBackOff 七、Pod 资源限制八、容器重启策略一、概述 Pod 是可以在 Kubernetes 中创建和管理的、最小的可部署的计算单元。P…...

编程日记 2023/7/30 3:12:14

VlanIf虚拟接口通信技术（二十三课）

一 Vlan技术之间的通信单臂路由（One-Arm Routing）是一种网络架构设计方式，通常用于部署网络设备（如防火墙、负载均衡器等）实现网络流量控制和安全策略。在单臂路由中，网络设备只有一个物理接口与局域网（LAN）或广域网（WAN）相连。 1.2 交换机数据链路层（第二层）…...

编程日记 2023/7/30 3:11:11

图神经网络（GNN）入门学习笔记（直观且简单）

文章目录图的定义和表示可以使用图数据结构的问题将图结构用于机器学习的挑战最基本的图神经网络概述汇聚操作基于信息传递的改进图神经网络全局向量信息的利用本篇文章参考发表于Distill上的图神经网络入门博客： A Gentle Introduction to Graph Neural Network…...

编程日记 2023/7/30 3:10:10

【Java开发】 Mybatis-Flex 01：快速入门

Mybatis 作为头部的 ORM 框架，他的增强工具可谓层出不穷，比如出名的 Mybatis-Plus 和阿里云开源的 Fluent-MyBatis，如今出了一款 Mybatis-Flex ，相比前两款功能更为强大、性能更为强悍，不妨来了解一下。目录 1 Myba…...

编程日记 2023/7/30 3:09:08

企业级业务架构学习笔记＜二＞

一.业务架构基础业务架构的定义以实现企业战略为目标，构建企业整体业务能力规划并将其传导给技术实现端的结构化企业能力分析方法 (业务架构可以从企业战略触发，按照企业战略设计业务及业务过程，业务过程时需要业务能力支撑的&#xff0…...

编程日记 2023/7/30 3:08:08

Minio在windows环境配置https访问

minio启动后，默认访问方式为http，但是有的时候我们的访问场景必须是https，浏览器有的会默认以https进行访问，这个时候就需要我们进行配置上的调整，将minio从http访问升级到https。而查看minio的官方文档，并…...

编程日记 2023/7/30 3:07:06

安装JDK环境(Windows+Linux双教程)

今日一语：今天的事情不去做，到了明天就成了麻烦，到了下个月就成了隐患，到了明年只剩下悔恨和惋惜 Linux 从Oracle网站下载linux的rpm包java -version 查询java环境是否已经安装如果已经安装，可以选择卸载重装或者直接…...

编程日记 2023/7/30 3:06:05

SVG图标，SVG symbols，SVG use标签

SVG图标，SVG symbols 项目中图标的使用，趋势是使用svg作图标的，优点如下兼容现有图片能力前提还支持矢量可读性好，有利于SEO与无障碍在性能和维护性方面也比iconfont要强很多怎么在项目中优雅的使用svg图标，下面…...

编程日记 2023/7/30 3:05:03

常用css 笔记

0、定义变量 :root { --primary-color: #007bff;} .button { background-color: var(--primary-color);} 1、水平垂直居中 div {width: 100px;height: 100px;position: absolute;top: 0;right: 0;bottom: 0;left: 0;margin: auto; }父级控制子集居中 .parent {display: fle…...

编程日记 2023/7/30 3:04:02

git的ssh方式对接码云

一、环境准备： 1、git下载，360管家或是百度。 2、vs2022，百度下载。二、配置git： 1、打开准备存放文件的文件夹，右键，选择“Git Bash here”，弹出命令窗口， 输入：ss…...

编程日记 2023/7/30 3:03:01

Golang之路---02 基础语法——变量

Golang变量变量的声明声明变量的一般形式是使用 var 关键字 Go 语言是静态类型语言，编译时，编译器会检查变量的类型，所以要求所有的变量都要有明确的类型。 1 ：一个变量单行声明语法格式： var name type var是关…...

编程日记 2023/7/30 3:01:59

Webpack5 DefinePlugin的作用

在Webpack 5中，DefinePlugin是一个插件，用于创建全局常量，这些常量可以在编译过程中被引用。它的作用是允许开发人员在代码中定义全局变量，这些变量在构建过程中将被替换为其对应的值。 DefinePlugin并不是必须的，但它…...

编程日记 2023/7/30 3:00:58

Verilog语法学习——LV7_求两个数的差值

LV7_求两个数的差值题目来源于牛客网 [牛客网在线编程_Verilog篇_Verilog快速入门 (nowcoder.com)](https://www.nowcoder.com/exam/oj?page1&tabVerilog篇&topicId301) 题目描述根据输入信号a,b的大小关系，求解两个数的差值：输入信号a,b…...

编程日记 2023/7/30 2:59:57

C#匿名函数，lambda表达式笔记

一.匿名函数匿名函数是一种定义时不起函数名的技术，因此无法直接调用，通常用来赋值给委托后被委托调用。在匿名方法中您不需要指定返回类型，它是从方法主体内的 return 语句推断的它的语法形式为：delegate (input-parameters)…...

编程日记 2023/7/30 2:58:55

【图论】LCA（倍增）

一.LCA介绍 LCA通常指的是“最近共同祖先”（Lowest Common Ancestor）。LCA是一种用于解决树或图结构中两个节点的最低共同祖先的问题的算法。在树结构中，LCA是指两个节点的最近层级的共同祖先节点。例如，考虑一棵树，…...

编程日记 2023/7/30 2:57:53

QT 使用串口

目录 1.1.1 添加库，添加类 1.1.2 定义串口 1.1.3 搜索串口 1.1.4 设置和打开串口 1.1.5 读取数据 1.1.6 发送数据 1.1.7 关闭串口 1.1.1 添加库，添加类首先，QT5 是自带 QSerialPort(Qt5 封装的串口类)这个类的，使用时…...

编程日记 2023/7/30 2:56:53

GitHub上怎么寻找项目？

前言下面由我精心整理的关于github项目资源搜索的一些方法，这些方法可以帮助你更快更精确的搜寻到你需要的符合你要求的项目。写文章不易，如果这一篇问文章对你有帮助，求点赞求收藏~ 好，下面我们直接进入正题——> 首先我…...

编程日记 2023/7/30 2:55:51

无机布防火卷帘门报价透明，包工包料，一次说清所有费用

很多客户在选购无机布防火卷帘门时，最关心实际成交价格，也担心报价不清晰，后期产生各类额外支出。行业内产品定价参差不齐，选材做工不同，最终价位自然存在差距，挑选时不能只看表面低价。 👉 点击…...

编程新知 2026/5/26 4:58:26

四旋翼变形控制：RL与MPC在混合动力学中的对比

1. 四旋翼变形控制的技术挑战与解决方案四旋翼变形控制（Quadrotor Morpho-Transition）是当前机器人领域最具挑战性的前沿技术之一。这项技术使机器人能够在空中完成形态变换，实现从飞行模式到地面模式的平滑切换。想象一下，一架四…...

编程新知 2026/5/26 4:52:25

Allegro等长设置翻车实录：拓扑模板法的3个坑与手工PinPair的救赎

Allegro等长设计避坑指南：从拓扑模板到精准PinPair的实战演进在高速PCB设计中，等长匹配如同精密钟表里的齿轮啮合，差之毫厘便可能导致整个系统时序崩塌。当设计从简单的点对点结构升级到多负载复杂拓扑时，Allegro用户常陷入两种典…...

编程新知 2026/5/26 3:32:09

3步深度解锁：网络设备权限管理工具的实战手册

3步深度解锁：网络设备权限管理工具的实战手册【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 你是否曾面对功能受限的网络设备感到束手无策？当默认配置锁死了硬…...

编程新知 2026/5/26 1:19:05

GEO生成引擎优化：当AI成为信息分发的主角，品牌如何抢占对话窗口？

当用户不再"搜索-浏览"，而是直接"AI提问-获取答案"，传统SEO的逻辑正在被彻底改写。2026年，GEO（Generative Engine Optimization，生成式引擎优化）已经从概念走向规模化落地。本文从技术…...

编程新知 2026/5/25 23:23:01

告别SVN恐惧症：美术策划也能轻松上手的Unity PlasticSCM极简入门（附团队项目拉取实战）

告别SVN恐惧症：美术策划也能轻松上手的Unity PlasticSCM极简入门（附团队项目拉取实战） 在游戏开发团队中，版本控制系统是协作的基石，但传统工具如SVN往往让非技术成员望而生畏。当美术资源频繁更新、策划案不断迭代时&…...

编程新知 2026/5/25 22:12:18

Arcmap实操：如何用‘渔网’给你的地图做一次‘CT扫描’——以韶关市路网密度可视化为例

Arcmap实操：如何用‘渔网’给你的地图做一次‘CT扫描’——以韶关市路网密度可视化为例想象一下，医生通过CT扫描将人体内部结构分层呈现，而GIS中的"渔网"工具同样能对城市路网进行"切片式"分析。这种空间离散化技术&…...

编程新知 2026/5/25 21:39:58

如何用Python脚本榨干百度网盘带宽：pan-baidu-download终极指南

如何用Python脚本榨干百度网盘带宽：pan-baidu-download终极指南【免费下载链接】pan-baidu-download 百度网盘下载脚本项目地址: https://gitcode.com/gh_mirrors/pa/pan-baidu-download 在数字时代，百度网盘已成为我们存储和分享大型文件的默认…...

编程新知 2026/5/25 21:39:56

Ubuntu经常安装软件

1、垃圾清理工具stacer sudo apt updatesudo apt install stacer apt cleanapt autocleanapt autoremove 2、类似与everything的工具Fsearcch 1sudo add-apt-repository ppa:christian-boxdoerfer/fsearch-stable 2sudo apt update 3sudo apt install fsearch (注&#xf…...

编程新知 2026/5/25 21:17:35

PvZ Toolkit终极指南：三步掌握植物大战僵尸最强修改器

PvZ Toolkit终极指南：三步掌握植物大战僵尸最强修改器【免费下载链接】pvztoolkit 植物大战僵尸 PC 版综合修改器项目地址: https://gitcode.com/gh_mirrors/pv/pvztoolkit PvZ Toolkit是一款专为植物大战僵尸PC版设计的综合修改器工具，能够让你…...

编程新知 2026/5/25 20:20:04

一、前向传播

二、反向传播

三、整体架构

四、神经元个数对结果的影响（Stanford例子）

1、 num_neurons:1

2、 num_neurons:2

3、 num_neurons:3

五、正则化

六、参数个数对结果的影响

七、激活函数

八、数据预处理

九、参数初始化

十、DROP-OUT（传说中的七伤拳）

相关文章：