当前位置：首页 > news >正文

神经网络基础-神经网络搭建和参数计算

news 2025/7/12 11:35:40

文章目录

- 1.构建神经网络
- 2. 神经网络的优缺点

1.构建神经网络

在 pytorch 中定义深度神经网络其实就是层堆叠的过程，继承自nn.Module，实现两个方法：

__init__方法中定义网络中的层结构，主要是全连接层，并进行初始化。
forward方法，在实例化模型的时候，底层会自动调用该函数。该函数中可以定义学习率，为初始化定义的layer传入数据等。

我们来构建如下图所示的神经网络模型：
在这里插入图片描述

编码设计如下：

第1个隐藏层：权重初始化采用标准化的xavier初始化激活函数使用sigmoid。
第2个隐藏层：权重初始化采用标准化的He初始化激活函数采用relu。
out输出层线性层假若二分类，采用softmax做数据归一化。

# 创建神经网络
import torch
import torch.nn as nn
# pip install torchsummary
from torchsummary import summary # 计算模型参数，查看模型结构 pip install torchsummary
# 创建神经网络模型类
class Model(nn.Module):# 初始化属性值def __init__(self):# 调用父类的初始化属性值super(Model, self).__init__()# 创建第一个隐藏层模型，3个输入特征，3个输出特征self.linear1 = nn.Linear(3, 3)# 初始化权重 xavier 均匀分布初始化nn.init.xavier_uniform_(self.linear1.weight)# 创建第二个隐藏层，3个输入特征（上一层的输出特征）,2个输出特征self.linear2 = nn.Linear(3, 2)# 初始化权重 kaiming 正太分布初始化nn.init.kaiming_normal_(self.linear2.weight)# 创建输出层模型self.out = nn.Linear(2, 2)# 创建向前传播方法，自动执行 forward()方法def forward(self, x):# 数据经过第一个线性层x = self.linear1(x)# 使用 sigmoid 激活函数x = torch.sigmoid(x)# 数据经过第二个线性层x = self.linear2(x)# 使用 relu 激活函数x = torch.relu(x)# 数据经过输出层x = self.out(x)# 使用 softmax 激活函数# dim=-1：每一维度行数据相机为1x = torch.softmax(x, dim=-1)return xif __name__ == '__main__':# 实例化model对象model = Model()# 随机产生数据data = torch.randn(5,3)print('data.shape',data.shape)# 数据经过神经网络模型训练out = model(data)print('out.shape',out.shape)# 计算模型参数# 计算每层每个神经元的 w 和 b 个数总和summary(model,input_size=(3,),batch_size=5)# 查看模型参数print("======查看模型参数w和b======")for name, param in model.named_parameters():print(name, param)

神经网络的输入数据是为[batch_size, in_features]的张量经过网络处理后获取了[batch_size, out_features]的输出张量。

在上述例子中，batch_size=5, in_features=3,out_features=2,结果如下所示：

data.shape torch.Size([5, 3])
out.shape torch.Size([5, 2])

模型参数输出：

----------------------------------------------------------------Layer (type)               Output Shape         Param #
================================================================Linear-1                     [5, 3]              12Linear-2                     [5, 2]               8Linear-3                     [5, 2]               6
================================================================
Total params: 26
Trainable params: 26
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.00
Estimated Total Size (MB): 0.00
----------------------------------------------------------------
======查看模型参数w和b======
linear1.weight Parameter containing:
tensor([[ 0.3857,  0.4809, -0.0346],[ 0.3645,  0.2803, -0.6291],[ 0.1999, -0.6617,  0.7724]], requires_grad=True)
linear1.bias Parameter containing:
tensor([0.3084, 0.5636, 0.4501], requires_grad=True)
linear2.weight Parameter containing:
tensor([[ 0.1063,  0.7494,  0.4311],[-1.4152,  0.3396, -0.8590]], requires_grad=True)
linear2.bias Parameter containing:
tensor([-0.3771,  0.2937], requires_grad=True)
out.weight Parameter containing:
tensor([[-0.6012,  0.4727],[-0.2953, -0.5854]], requires_grad=True)
out.bias Parameter containing:
tensor([-0.3271,  0.4940], requires_grad=True)

模型参数的计算：

以第一个隐层为例：该隐层有3个神经元，每个神经元的参数为：4个（w1,w2,w3,b1），所以一共用3x4=12个参数。
输入数据和网络权重是两个不同的事儿！对于初学者理解这一点十分重要，要分得清。

2. 神经网络的优缺点

优点
➢ 精度高，性能优于其他的机器学习算法，甚至在某些领域超过了人类。
➢ 可以近似任意的非线性函数。
➢ 近年来在学界和业界受到了热捧，有大量的框架和库可供调。
缺点
➢ 黑箱，很难解释模型是怎么工作的。
➢ 训练时间长，需要大量的计算资源。
➢ 网络结构复杂，需要调整超参数。
➢ 部分数据集上表现不佳，容易发生过拟合。

神经网络基础-神经网络搭建和参数计算

文章目录 1.构建神经网络2. 神经网络的优缺点 1.构建神经网络在 pytorch 中定义深度神经网络其实就是层堆叠的过程，继承自nn.Module，实现两个方法： __init__方法中定义网络中的层结构，主要是全连接层，并进行初始化。…...

编程日记 2024/12/17 21:50:01

Linux入门攻坚——41、Linux集群系统入门-lvs（2）

lvs-dr：GATEWAY Director只负责请求报文，响应报文不经过Director，直接由RS返回给Client。 lvs-dr的报文路线如上图，基本思路就是报文不会回送Director，第①种情况是VIP、DIP、RIP位于同一个网段，这样&…...

编程日记 2024/12/17 21:41:54

音视频入门基础：MPEG2-TS专题（17）——FFmpeg源码中，解析TS program map section的实现

一、引言由《音视频入门基础：MPEG2-TS专题（16）——PMT简介》可以知道，PMT表（Program map table）由一个或多个段（Transport stream program map section，简称TS program map sectio…...

编程日记 2024/12/17 21:38:45

了解https原理，对称加密/非对称加密原理，浏览器与服务器加密的进化过程，https做了些什么

最开始的加密浏览器与服务器之间需要防止传输的数据被黑客破解。因此，浏览器在发送数据时会对数据进行加密，并把加密的密钥（或密钥的某些部分）放在数据的某一个区域中。服务器收到数据后，会提取密钥并用它来解密数据…...

编程日记 2024/12/17 21:36:43

山西省第十八届职业院校技能大赛高职组 5G 组网与运维赛项规程

山西省第十八届职业院校技能大赛高职组 5G 组网与运维赛项规程一、赛项名称赛项编号：GZ035 赛项名称：5G 组网与运维赛项组别：高职学生组、教师组二、竞赛目的 2019 年 6 月 6 日，5G 牌照正式发放，标志着我国全面进…...

编程日记 2024/12/17 21:33:39

https://github.com/westes/flex/releases/download/v2.6.4/flex-2.6.4.tar.gz tar -zxvf flex-2.6.4.tar.gz ./configure CFLAGS-D_GNU_SOURCE make sudo make installwget http://ftp.gnu.org/gnu/bison/bison-3.2.1.tar.gz ./configure make sudo make install以上两个库是…...

编程日记 2024/12/17 21:32:38

Web开发 -前端部分-CSS

CSS CSS（Cascading Style Sheet）:层叠样式表，用于控制页面的样式（表现）。一基础知识 1 标题格式标题格式一： 行内样式 <!DOCTYPE html> <html lang"en"><head><meta…...

编程日记 2024/12/17 21:30:35

用 Python Turtle 绘制流动星空：编程中的璀璨星河

用 Python Turtle 绘制流动星空：编程中的璀璨星河 🐸 前言 🐸🐞往期绘画>>点击进所有绘画🐞🐋 效果图 🐋🐉 代码 🐉 🐸 前言 🐸 夜空中繁星…...

编程日记 2024/12/17 21:29:34

Java从入门到工作2 - IDEA

2.1、项目启动从git获取到项目代码后，用idea打开。安装依赖完成Marven/JDK等配置检查数据库配置启动相关服务安装依赖如果个别依赖从私服下载不了，可以去maven官网下载补充。如果run时提示程序包xx不存在，在项目目录右键Marven->Re…...

编程日记 2024/12/17 21:27:30

fastadmin批量压缩下载远程视频文件

后端代码 // 批量下载并压缩 public function downloadAll(){$ids input(ids);$row $this->model->where(id, in, $ids)->field(id,title,video_url)->select();if (!$row) {$this->error(记录不存在);}$arr [];$tempFiles []; // 用来存储临时下载的视频文…...

编程日记 2024/12/17 21:26:29

【保姆级】Mac如何安装+切换Java环境

本文从如何下载不同版本的JDK，到如何丝滑的切换JDK，以及常见坑坑的处理方法，应有尽有，各位看官走过路过不要错过～～～下载⏬ 首先上官网： https://www.oracle.com/ 打不开的话可以使用下面👇这个中文的 https://www.oracle.com/cn/java/technologies/downloads/a…...

编程日记 2024/12/17 21:22:25

2024首届世界酒中国菜国际地理标志产品美食文化节成功举办篇章

2024首届世界酒中国菜国际地理标志产品美食文化节成功举办，开启美食文化交流新篇章近日，首届世界酒中国菜国际地理标志产品美食文化节在中国国际地理标志大厦成功举办，这场为期三天的美食文化盛会吸引了来自世界各地的美食爱好者、行业专家…...

编程日记 2024/12/17 21:19:23

Springboot静态资源

默认位置静态资源访问目录下的资源可以直接访问，默认的四个位置 classpath:/META-INF/resources/（默认加载，不受自定义配置的影响） classpath:/resources/ classpath:/static/ classpath:/public/ 如果在静态目录下存在favic…...

编程日记 2024/12/17 21:18:21

MTK修改配置更改产品类型ro.build.characteristics

文章目录需求场景实际问题参考资料解决方案MTK 修改方案修改点一：build\core\product_config.mk修改点二：build\make\core\main.mk修改是否成功，adb 验证实战项目中解决案例需求场景更改产品设备属性 table-phone-device，使…...

编程日记 2024/12/17 21:16:19

SQL 查询中的动态字段过滤

这段代码是一个 SQL 查询中的动态字段过滤部分，使用了 MyBatis 的标签和标签。以下是逐步的解释： <if test"parameters ! null and parameters.size() > 0"><foreach collection"parameters&qu…...

编程日记 2024/12/17 21:10:13

数字IC后端零基础入门基础理论（Day1）

数字IC后端设计导入需要用到的input数据如下图所示。数字后端零基础入门系列 | Innovus零基础LAB学习Day9 Netlist: 设计的Gate level（门级）网表。下图所示为一个计数器设计综合后的门级netlist。从这个netlist中我们看到这个设计顶层的名字叫counte…...

编程日记 2024/12/17 21:09:13

【LC】240. 搜索二维矩阵 II

题目描述： 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性： 每行的元素从左到右升序排列。每列的元素从上到下升序排列。示例 1： 输入：matrix [[1,4,7,11,15],[2,5,8,12,19],[3,6,…...

编程日记 2024/12/17 21:07:11

Redis应用—4.在库存里的应用

大纲 1.库存模块设计 2.库存缓存分片和渐进式同步方案 3.基于缓存分片的下单库存扣减方案 4.商品库存设置流程与异步落库的实现 6.库存入库时"缓存分片写入渐进式写入写入失败进行MQ补偿"的实现 7.库存扣减时"基于库存分片依次扣减合并扣减扣不了…...

编程日记 2024/12/17 21:02:06

selenium获取请求头

【原创】Selenium获取请求头、响应头-腾讯云开发者社区-腾讯云 selenium 4.0.0 selenium-wire 5.1.0 python 3.10 from seleniumwire import webdriver import time from selenium.webdriver.common.by import By import re def get_request_headers(driver):"""…...

编程日记 2024/12/17 21:00:04

Rust中自定义Debug调试输出

在 Rust 中，通过为类型实现 fmt::Debug，可以自定义该类型的调试输出。fmt::Debug 是标准库中的一个格式化 trait，用于实现 {:?} 格式的打印。这个 trait 通常通过自动派生（#[derive(Debug)]）来实现，但你也…...

编程日记 2024/12/17 20:58:02

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性，不同版本的Docker对内核版本有不同要求。例如，Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本，Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

编程新知 2025/7/11 3:50:33

逻辑回归：给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告（肿瘤大小、血液指标），你需要做出一个**决定性判断**：恶性还是良性？这种“非黑即白”的抉择，正是**逻辑回归（Logistic Regression）** 的战场&a…...

编程新知 2025/6/20 12:22:50

Leetcode 3577. Count the Number of Computer Unlocking Permutations

Leetcode 3577. Count the Number of Computer Unlocking Permutations 1. 解题思路2. 代码实现题目链接：3577. Count the Number of Computer Unlocking Permutations 1. 解题思路这一题其实就是一个脑筋急转弯，要想要能够将所有的电脑解锁&#x…...

编程新知 2025/7/5 22:29:13