当前位置：首页 > news >正文

神经网络以及简单的神经网络模型实现

news 2025/7/18 13:11:07

神经网络基本概念：

神经元（Neuron）：
神经网络的基本单元，接收输入，应用权重并通过激活函数生成输出。
层（Layer）：
神经网络由多层神经元组成。常见的层包括输入层、隐藏层和输出层。
权重（Weights）和偏置（Biases）：
权重用于调整输入的重要性，偏置用于调整模型的输出。
激活函数（Activation Function）：
在神经元中引入非线性，如ReLU（Rectified Linear Unit）、Sigmoid、Tanh等。
损失函数（Loss Function）：
用于衡量模型预测与实际结果之间的差异，如均方误差（MSE）、交叉熵损失等。
优化器（Optimizer）：
用于调整模型权重以最小化损失函数，如随机梯度下降（SGD）、Adam等。

简单的神经网络示例：

下面是一个使用PyTorch构建简单线性回归的神经网络示例代码。这个示例展示了如何定义一个具有一个隐藏层的前馈神经网络，并训练它来逼近一些随机生成的数据点。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt# 生成一些随机数据
np.random.seed(0)
X = np.linspace(0, 10, 100).reshape(-1, 1).astype(np.float32)
y = np.sin(X) + np.random.normal(0, 0.1, size=X.shape).astype(np.float32)# 转换为PyTorch的张量
X_tensor = torch.tensor(X)
y_tensor = torch.tensor(y)# 定义一个简单的神经网络模型
class NeuralNet(nn.Module):def __init__(self):super(NeuralNet, self).__init__()self.fc1 = nn.Linear(1, 10)  # 输入层到隐藏层self.relu = nn.ReLU()        # 激活函数self.fc2 = nn.Linear(10, 1)  # 隐藏层到输出层def forward(self, x):x = self.fc1(x)x = self.relu(x)x = self.fc2(x)return x# 实例化模型、损失函数和优化器
model = NeuralNet()
criterion = nn.MSELoss()  # 均方误差损失函数
optimizer = optim.Adam(model.parameters(), lr=0.01)  # Adam优化器# 训练模型
epochs = 5000
losses = []
for epoch in range(epochs):optimizer.zero_grad()outputs = model(X_tensor)loss = criterion(outputs, y_tensor)loss.backward()optimizer.step()losses.append(loss.item())if (epoch+1) % 1000 == 0:print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.6f}')# 绘制损失函数变化图
plt.plot(losses, label='Training loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()# 测试模型
model.eval()
with torch.no_grad():test_x = torch.tensor([[5.0]])  # 测试输入predicted = model(test_x)print(f'预测值: {predicted.item()}')

运行结果展示:

代码理解：

下面便是详细分解这段代码进行理解：

生成数据：

使用 numpy 生成一些随机的带有噪声的正弦函数数据。

import numpy as np# 生成带有正态分布噪声的正弦函数数据
def generate_data(n_samples):np.random.seed(0)  # 设置随机种子以确保结果可复现X = np.random.uniform(low=0, high=10, size=n_samples)y = np.sin(X) + np.random.normal(scale=0.3, size=n_samples)return X, y# 生成数据
X_train, y_train = generate_data(100)

定义神经网络模型：

NeuralNet 类继承自 nn.Module，定义了一个具有一个隐藏层的前馈神经网络。使用ReLU作为隐藏层的激活函数。

import torch
import torch.nn as nn
import torch.optim as optim# 定义神经网络模型
class NeuralNet(nn.Module):def __init__(self):super(NeuralNet, self).__init__()self.fc1 = nn.Linear(1, 10)  # 输入大小为1（X），输出大小为10self.fc2 = nn.Linear(10, 1)  # 输入大小为10，输出大小为1self.relu = nn.ReLU()def forward(self, x):x = self.relu(self.fc1(x))x = self.fc2(x)return x# 实例化模型
model = NeuralNet()# 打印模型结构
print(model)

实例化模型、损失函数和优化器：
- model 是我们定义的神经网络模型。
- criterion 是损失函数，这里使用均方误差损失。
- optimizer 是优化器，这里使用Adam优化器来更新模型参数。
```
# 定义损失函数（均方误差损失）
criterion = nn.MSELoss()# 定义优化器（Adam优化器）
optimizer = optim.Adam(model.parameters(), lr=0.01)
```

训练模型：

使用 X_tensor 和 y_tensor 进行训练，优化模型使其逼近 y_tensor。

# 将numpy数组转换为PyTorch张量
X_tensor = torch.tensor(X_train, dtype=torch.float32).view(-1, 1)
y_tensor = torch.tensor(y_train, dtype=torch.float32).view(-1, 1)# 训练模型
def train_model(model, criterion, optimizer, X, y, epochs=1000):model.train()for epoch in range(epochs):optimizer.zero_grad()output = model(X)loss = criterion(output, y)loss.backward()optimizer.step()if (epoch+1) % 100 == 0:print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')train_model(model, criterion, optimizer, X_tensor, y_tensor)

测试模型：

使用 model.eval() 将模型切换到评估模式，使用 torch.no_grad() 关闭梯度计算。

测试输入为 5.0，打印预测结果。

# 测试模型
model.eval()
with torch.no_grad():test_input = torch.tensor([[5.0]], dtype=torch.float32)predicted_output = model(test_input)print(f'预测输入为 5.0 时的输出: {predicted_output.item():.4f}')

神经网络以及简单的神经网络模型实现

神经网络基本概念： 神经元（Neuron）： 神经网络的基本单元，接收输入，应用权重并通过激活函数生成输出。层（Layer）： 神经网络由多层神经元组成。常见的层包括输入层、隐藏层…...

编程日记 2024/7/15 13:22:39

java中压缩文件的解析方式（解析文件）

背景了解：java中存在IO流的方式，支持我们对文件进行读取（Input，从磁盘到内存）或写入（output，从内存到磁盘），那么我们在面对 “zip”格式或者 “rar” 格式的压缩文件&…...

编程日记 2024/7/15 13:18:34

巧用 VScode 网页版 IDE 搭建个人笔记知识库!

[ 知识是人生的灯塔，只有不断学习，才能照亮前行的道路 ] 巧用 VScode 网页版 IDE 搭建个人笔记知识库! 描述：最近自己在腾讯云轻量云服务器中部署了一个使用在线 VScode 搭建部署的个人Markdown在线笔记，考虑到在线 VScode 支持终…...

编程日记 2024/7/15 13:11:27

Jupyter Lab 使用

Jupyter Lab 使用详解 Jupyter Lab 是一个基于 Web 的交互式开发环境，提供了比 Jupyter Notebook 更加灵活和强大的用户界面和功能。以下是使用 Jupyter Lab 的详细指南，包括安装、基本使用、设置根目录和扩展功能等内容。一、Jupyter Lab 安装与启动…...

编程日记 2024/7/15 13:10:25

MyBatis where标签内嵌foreach标签查询报错‘缺失右括号‘或‘命令未正确结束‘

MyBatis <where>标签内嵌<foreach>标签查询报错’缺失右括号’或’命令未正确结束’ <where>标签内嵌<foreach>标签截取一段脱敏xml，写明大概意思 <select id"queryLogByIds" resultMap"BaseResultMap">SELE…...

编程日记 2024/7/15 13:08:23

重生奇迹MU 群战王牌

圣导师是重生奇迹MU游戏中八大职业之一，拥有风度翩翩、潇洒自如的形象和神一样的实力。无论是刷怪、PK、打boss还是混战，圣导师都表现出压制其他职业的强大气势。因此，这个职业在游戏中备受欢迎，人气非常高。实力强大的二代隐藏…...

编程日记 2024/7/15 13:07:22

SpinalHDL之VHDL 和 Verilog 生成

本文作为SpinalHDL学习笔记第十六篇，记录使用SpinalHDL代码生成Verilog/VHDL代码的方法。 SpinalHDL学习笔记总纲链接如下： SpinalHDL 学习笔记_spinalhdl blackbox-CSDN博客目录： 1.从 SpinalHDL 组件生成 VHDL 和 Verilog 2.生成的 VHD…...

编程日记 2024/7/15 13:01:16

c语言中的字符串函数

strstr函数函数介绍 strstr 用于在一个字符串中查找另一个字符串的首次出现。我们来看这个函数的参数名字：haysytack（干草堆）needle（针）,这个其实就是外国的一句谚语：在干草堆中找一根针，就…...

编程日记 2024/7/15 12:59:15

[AI 大模型] 百度文心一言

文章目录 [AI 大模型] 百度文心一言简介模型架构发展新技术和优势API 代码示例 [AI 大模型] 百度文心一言 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0T-1720667576892)(https://i-blog.csdnimg.cn/direct/283919e5d78b4951ba1ade5dcfc…...

编程日记 2024/7/15 12:58:13

机器学习开源分子生成系列(2)-基于三维形状和静电相似性的DeepFMPO v3D安装及使用

前言本文是基于 3D 的分子生成方法DeepFMPO v3D的介绍及安装使用。一、DeepFMPO v3D是什么？ github代码介绍文章在药物发现中，如何寻找具新颖性和结构多样性的候选分子是颇受药物设计科学家关注的问题。通过虚拟筛选的化学空间搜索往往会受限于筛选…...

编程日记 2024/7/15 12:53:07

机器学习-16-分布式梯度提升库XGBoost的应用

参考XGBoost库 1 XGBoost分布式梯度提升库 XGBoost，全称为eXtreme Gradient Boosting，是一个优化的分布式梯度提升库，旨在高效、灵活且便携。它在Gradient Boosting框架下实现了机器学习算法，并广泛用于分类、回归和排序任务。XGBoost之所以受到广泛欢迎，主要归功于它的…...

编程日记 2024/7/15 12:52:06

视觉/AIGC面经-＞多模态

1.ocr检测如何做？qwen的文本检测是否合理？ paligemma： <loc0110><loc0124><loc0224><loc0389> plate ; <loc0244><loc0130><loc0281><loc0430> plate ; <loc0364><loc0820><loc0403><loc0951> pl…...

编程日记 2024/7/15 12:47:57

＜数据集＞钢板缺陷检测数据集＜目标检测＞

数据集格式：VOCYOLO格式图片数量：1986张标注数量(xml文件个数)：1986 标注数量(txt文件个数)：1986 标注类别数：7 标注类别名称：[crescent gap, silk spot, water spot, weld line, oil spot, punchin…...

编程日记 2024/7/15 12:46:57

EdgeOne安全能力开箱测评挑战赛

活动地址：EdgeOne安全能力开箱测评挑战赛-腾讯云开发者社区-腾讯云随着网络攻击日益频繁，企业网站面临着数据泄露、DDoS攻击、CC攻击等多种安全威胁。如何有效保护企业网站安全，成为企业IT部门的重要任务。腾讯云EdgeOne作为一款集成了CDN和…...

编程日记 2024/7/15 12:43:54

神经网络识别数字图像案例

学习资料：从零设计并训练一个神经网络，你就能真正理解它了_哔哩哔哩_bilibili 这个视频讲得相当清楚。本文是学习笔记，不是原创，图都是从视频上截图的。 1. 神经网络 2. 案例说明具体来说，设计一个三层的神经网络。…...

编程日记 2024/7/15 12:42:53

c++包管理器

conan conan search，查看网络库 conan profile detect，生成缓存信息conan new cmake_exe/cmake_lib，创建cmakelists.txtconan install .，执行Conanfile.txt中的配置，生成相关的bat文件项目中配置Conanfile.txt(或者…...

编程日记 2024/7/15 12:39:49

监控易V7.6.6.15升级详解7，日志分析更高效

随着企业IT系统的日益复杂，日志管理成为了保障系统稳定运行、快速定位问题的重要工具。为了满足广大用户对日志管理功能的更高需求，监控易系统近日完成了重要版本升级，对日志管理功能进行了全面优化和新增。一、Syslog日志与SnmpTrap日志统…...

编程日记 2024/7/15 12:38:48

HTML表格、表单标签

目录一、表格 （1）关于表格中标签说明 （2）关于表格中属性说明 （3）简单操作演示 （4）表格小结二、表单 （1）简单操作演示 （2）注…...

编程日记 2024/7/15 12:30:40

（Windows环境）FFMPEG编译，包含编译x264以及x265

本文使用 MSYS2 来编译 ffmpeg 一、安装MSYS2 MSYS2 是 Windows 下的一组编译套件，它可以在 Windows 系统中模拟 Linux 下的编译环境，如使用 shell 运行命令、使用 pacman 安装软件包、使用 gcc (MinGW) 编译代码等。 MSYS2 的安装也非常省心&#x…...

编程日记 2024/7/15 12:29:39

notepad++中文出现异体汉字，怎么改正

notepad显示异体字，如何恢复？ 比如 “门” 和 “直接” 的"直"字，显示成了方法修改字体， 菜单栏选择 Settings(设置），Style Configurator…（语言格式设置…）&#xf…...

编程日记 2024/7/15 12:28:38

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする 1、前言（1）情况说明（2）工程师的信仰2、知识点（1）　にする1，接续：名词＋にする2，接续：疑问词＋にする3，（A）は（B）にする。（2）復習：（1）复习句子（2）ために　＆　ように（３）そう（４）にする3、…...

编程新知 2025/6/17 10:46:36

以下是对华为 HarmonyOS NETX 5属性动画（ArkTS）文档的结构化整理，通过层级标题、表格和代码块提升可读性：

一、属性动画概述NETX 作用：实现组件通用属性的渐变过渡效果，提升用户体验。支持属性：width、height、backgroundColor、opacity、scale、rotate、translate等。注意事项： 布局类属性（如宽高）变化时&#…...

编程新知 2025/7/18 5:33:33

QMC5883L的驱动

简介本篇文章的代码已经上传到了github上面，开源代码作为一个电子罗盘模块，我们可以通过I2C从中获取偏航角yaw，相对于六轴陀螺仪的yaw，qmc5883l几乎不会零飘并且成本较低。参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

编程新知 2025/6/21 13:57:28

【位运算】消失的两个数字（hard）

消失的两个数字（hard） 题⽬描述：解法（位运算）：Java 算法代码：更简便代码题⽬链接：⾯试题 17.19. 消失的两个数字题⽬描述： 给定⼀个数组，包含从 1 到 N 所有…...

编程新知 2025/7/8 4:43:23

解锁数据库简洁之道：FastAPI与SQLModel实战指南

在构建现代Web应用程序时，与数据库的交互无疑是核心环节。虽然传统的数据库操作方式（如直接编写SQL语句与psycopg2交互）赋予了我们精细的控制权，但在面对日益复杂的业务逻辑和快速迭代的需求时，这种方式的开发效率和可…...

编程新知 2025/7/8 21:38:11

使用van-uploader 的UI组件，结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui（适配 Vue2 版本 ）实现截图中照片上传预览、删除功能，并封装成可复用组件的完整代码，包含样式和逻辑实现，可直接在 Vue2 项目中使用： 1. 封装的图片上传组件 ImageUploader.vue <te…...

编程新知 2025/7/15 20:18:27

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面（Target 选项卡）1. IROM1（用于配置 Flash）2. IRAM1（用于配置 RAM）二、链接器设置界面（Linker 选项卡）1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数（如果没有勾选上面…...

编程新知 2025/7/17 9:41:37

CRMEB 框架中 PHP 上传扩展开发：涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展扩展入口文件文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

编程新知 2025/7/9 8:24:54

第 86 场周赛：矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有从 1 到 9 的不同数字的 3 x 3 矩阵，其中每行，每列以及两条对角线上的各数之和都相等。给定一个由整数组成的row x col 的 grid，其中有多少个 3 3 的 “幻方” 子矩阵&am…...

编程新知 2025/7/16 0:31:38

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2025/7/15 23:55:36

神经网络基本概念：

神经元（Neuron）：

层（Layer）：

权重（Weights）和偏置（Biases）：

激活函数（Activation Function）：

损失函数（Loss Function）：

优化器（Optimizer）：