当前位置：首页 > news >正文

numpy实现神经网络

news 2026/5/16 8:48:05

numpy实现神经网络

首先讲述的是神经网络的参数初始化与训练步骤

随机初始化

任何优化算法都需要一些初始的参数。到目前为止我们都是初始所有参数为0，这样的初始方法对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。如果我们令所有的初始参数都为0，这将意味着我们第二层的所有激活单元都会有相同的值。同理，如果我们初始所有的参数都为一个非0的数，结果也是一样的。

我们通常初始参数为正负ε之间的随机值

训练神经网络一般步骤

参数的随机初始化
利用正向传播方法计算所有的 $h_{\theta}(x)$
编写计算代价函数 $J$ 的代码
利用反向传播方法计算所有偏导数
利用数值检验方法检验这些偏导数
使用优化算法来最小化代价函数

激活函数和参数初始化

sigmoid函数
在这里插入图片描述
relu函数：

import numpy as np# sigmoid激活函数
def sigmoid(x):return 1/(1+np.exp(-x))# relu激活函数
def relu(x):return np.maximum(0, x)# sigmoid反向传播函数
def sigmoid_back(x):return x*(1-x)# relu反向传播函数
def relu_back(x):return np.where(x > 0, 1, 0)#初始化参数
def initialize(input_size,hidden_size,output_size):'''input_size 输入层列数hidden_size 隐藏层列数output_size 输出层列数'''np.random.seed(42)input_hidden_weights=np.random.randn(input_size,hidden_size)input_hidden_bias=np.zeros((1,hidden_size))hidden_out_weights=np.random.randn(hidden_size,output_size)hidden_out_bias=np.zeros((1,output_size))return input_hidden_weights,input_hidden_bias,hidden_out_weights,hidden_out_bias

前向传播和反向传播函数

# 前向传播
def forward(inputs,input_hidden_weights,input_hidden_bias,hidden_out_weights,hidden_out_bias):hidden_input=np.dot(inputs,input_hidden_weights)+input_hidden_biashidden_output=relu(hidden_input)final_input=np.dot(hidden_output,hidden_out_weights)+hidden_out_biasfinal_output=sigmoid(final_input)return hidden_output,final_output# 后向传播
def backward(inputs,hidden_output,final_output,target,hidden_out_weights):output_error = target - final_outputoutput_delta = output_error * sigmoid_back(final_output)hidden_error = output_delta.dot(hidden_out_weights.T)hidden_delta = hidden_error * relu_back(hidden_output)return output_delta,hidden_delta

更新参数

# 更新参数
def update(inputs, hidden_output, output_delta, hidden_delta, input_hidden_weights, input_hidden_bias,hidden_output_weights, hidden_output_bias, learning_rate):hidden_output_weights =hidden_output_weights+ hidden_output.T.dot(output_delta) * learning_ratehidden_output_bias = hidden_output_bias+ np.sum(output_delta, axis=0, keepdims=True) * learning_rateinput_hidden_weights = input_hidden_weights+ inputs.T.dot(hidden_delta) * learning_rateinput_hidden_bias = input_hidden_bias+ np.sum(hidden_delta, axis=0, keepdims=True) * learning_ratereturn input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias

训练及预测模型

#训练模型
def train(inputs, target, input_size, hidden_size, output_size, learning_rate, epochs):input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias=initialize(input_size,hidden_size,output_size)# 梯度下降优化模型for epoch in range(epochs):hidden_output,final_output=forward(inputs,input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias)output_delta,hidden_delta=backward(inputs,hidden_output,final_output,target,hidden_output_weights)input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias=update(inputs,hidden_output,output_delta,hidden_delta,input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias,learning_rate)# 计算损失loss = np.mean(np.square(targets - final_output))if epoch % 100 == 0:print(f"Epoch {epoch}: Loss {loss}")return input_hidden_weights,input_hidden_bias,hidden_output_weights,hidden_output_bias# 预测模型
def predict(inputs, input_hidden_weights, input_hidden_bias, hidden_output_weights,hidden_output_bias):_, result = forward(inputs, input_hidden_weights, input_hidden_bias, hidden_output_weights, hidden_output_bias)return [1 if y_hat>0.5 else 0  for y_hat in result]

检验模型

# 定义训练数据和目标
inputs = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
target = np.array([[0], [1], [1], [0]])# 定义神经网络参数
input_size = 2
hidden_size = 4
output_size = 1
learning_rate = 0.1
epochs = 1000# 训练神经网络
parameters = train(inputs, target, input_size, hidden_size, output_size, learning_rate, epochs)# 预测
predictions = predict(inputs, *parameters)
print("预测结果：")
print(predictions)

最终结果

在这里插入图片描述

numpy实现神经网络

numpy实现神经网络首先讲述的是神经网络的参数初始化与训练步骤随机初始化任何优化算法都需要一些初始的参数。到目前为止我们都是初始所有参数为0，这样的初始方法对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。如果我们令所有的初始…...

编程日记 2023/12/3 23:12:35

Bean的加载控制文章目录 Bean的加载控制编程式注解式ConditionalOn*** 编程式 public class MyImportSelector implements ImportSelector {Overridepublic String[] selectImports(AnnotationMetadata annotationMetadata) {try {Class<?> clazz Class.forName("…...

编程日记 2023/12/3 23:11:34

使用 OpenCV 识别和裁剪黑白图像上的白色矩形--含源码

为了仅获取具有特定边框颜色的矩形，我寻求一种替代识别图像中的轮廓和所有矩形的传统方法。如示例图片所示，我有兴趣使用 opencv 仅获取白色边框矩形的坐标。任何这方面的建议将不胜感激。到目前为止，我的代码已产生如下所示的输出。我的下一个目标是将图像裁剪到大的中心框…...

编程日记 2023/12/3 23:08:32

LeetCode 每日一题 Day1

1094. 拼车车上最初有 capacity 个空座位。车只能向一个方向行驶（也就是说，不允许掉头或改变方向） 给定整数 capacity 和一个数组 trips , trip[i] [numPassengersi, fromi, toi] 表示第 i 次旅行有 numPassengersi 乘客，接…...

编程日记 2023/12/3 23:07:31

【hacker送书活动第7期】Python网络爬虫入门到实战

第7期图书推荐内容简介作者简介大咖推荐图书目录概述参与方式内容简介本书介绍了Python3网络爬虫的常见技术。首先介绍了网页的基础知识，然后介绍了urllib、Requests请求库以及XPath、Beautiful Soup等解析库，接着介绍了selenium对动态网站的爬取和S…...

编程日记 2023/12/3 23:05:29

【算法】希尔排序

目录 1. 说明2. 举个例子3. java代码示例4. java示例截图 1. 说明 1.希尔排序是直接插入排序的一种改进，其本质是一种分组插入排序 2.希尔排序采取了分组排序的方式 3.把待排序的数据元素序列按一定间隔进行分组，然后对每个分组进行直接插入排序 4.随着间…...

编程日记 2023/12/3 22:59:23

四、Zookeeper节点类型

目录 1、临时节点 2、永久节点 Znode有两种，分别为临时节点和永久节点。节点的类型在创建时即被确定，并且不能改变。 1、临时节点临时节点的生命周期依赖于创建它们的会话。一旦会话结束，临时节点将被自动删除，...

编程日记 2023/12/3 22:57:22

arcgis导出某个属性的栅格

选中栅格特定属性想要导出时，无法选中“所选图形” 【方法】spatial analyst 工具——提取分析——按属性提取...

编程日记 2023/12/3 22:55:20

计算机网络——传输层

传输层的基本单位是报文； 一、传输层的基本概念传输层提供端到端的服务； 从通信和信息处理的角度看，传输层向上层应用层提供通信服务； （一）端口号协议作用端口号FTP文件传输协议21连接；2…...

编程日记 2023/12/3 22:54:20

策略设计模式

package com.jmj.pattern.strategy;public interface Strategy {void show(); }package com.jmj.pattern.strategy;public class StrategyA implements Strategy{Overridepublic void show() {System.out.println("买一送一");} }package com.jmj.pattern.strategy;p…...

编程日记 2023/12/3 22:48:15

Golang中rune和Byte，字符和字符串有什么不一样

Rune和Byte，字符和字符串有什么不一样 String Go语言中， string 就是只读的采用 utf8 编码的字节切片(slice) 因此用 len 函数获取到的长度并不是字符个数，而是字节个数。 for循环遍历输出的也是各个字节。 Rune rune 是 int32 …...

编程日记 2023/12/3 22:47:14

实施工程师运维工程师面试题

Linux 1.请使用命令行拉取SFTP服务器/data/20221108/123.csv 文件，到本机一/data/20221108目录中。使用命令行拉取SFTP服务器文件到本机指定目录，可以使用sftp命令。假设SFTP服务器的IP地址为192.168.1.100，用户名为username，密…...

编程日记 2023/12/3 22:46:14

6-13连接两个字符串

#include<stdio.h> int main(){int i0,j0;char s1[222],s2[333];printf("请输入第一个字符串：\n");gets(s1);//scanf("%s",s1);printf("请输入第二个字符串：\n");gets(s2);while(s1[i]!\0)i;while(s2[j]!\0)s1[i]s2…...

编程日记 2023/12/3 22:45:13

Linux中的文件IO

文章目录 C语言文件操作系统文件I/O接口介绍 open函数返回值文件描述符fd0 & 1 & 2文件描述符的分配规则重定向使用 dup2 系统调用 FILE理解文件系统理解硬链接软链接acm 动态库和静态库静态库与动态库生成静态库生成动态库： C语言文件操作先来段代码回顾…...

编程日记 2023/12/3 22:40:09

深度学习记录--初识向量化

什么是向量化？ 之前计算logistic回归损失函数时，在代码实现时，讨论了for循环：过多的for循环会拖慢计算的速度(尤其当数据量很大时) 因此，为了加快计算，向量化是一种手段运用python的numpy库&#xff0c…...

编程日记 2023/12/3 22:37:05

树与二叉树堆：经典OJ题集（2）

目录二叉树的性质及其问题： 二叉树的性质问题： 一、对称的二叉树： 题目： 解题思路： 二、另一棵树： 题目： 解题思路： 三、翻转二叉树： 题目：…...

编程日记 2023/12/3 22:35:04

Java面试题（每天10题）-------连载（40）

目录 Mysql篇 1、表中有大字段X（例如：text类型），且字段X不会经常更新，将该字段拆成子表好处是什么？ 2、Mysql中InnoDB引擎的行锁是通过加载什么上完成的？ 3、Mysql中控制内存分配的全局参数…...

编程日记 2023/12/3 22:33:02

2023年【起重机司机(限桥式起重机)】报名考试及起重机司机(限桥式起重机)考试资料

题库来源：安全生产模拟考试一点通公众号小程序 2023年【起重机司机(限桥式起重机)】报名考试及起重机司机(限桥式起重机)考试资料，包含起重机司机(限桥式起重机)报名考试答案和解析及起重机司机(限桥式起重机)考试资料练习。安全生产模拟考试一点通结合…...

编程日记 2023/12/3 22:29:59

Linux的基本指令（3）

目录制作小文件&查看 nano指令 cat指令 tac指令制作大文件&查看一切皆文件 echo指令 > 输出重定向以写"w"的形式打开文件以追加"a"的形式打开文件 cat指令 < 输入重定向创建big.txt more指令 less指令（推…...

编程日记 2023/12/3 22:27:56

C语言memcpy，memmove的介绍及模拟实现

文章目录每日一言memcpy介绍模拟实现 memmove介绍模拟实现思路代码结语每日一言 If you want to lift yourself up, lift up someone else. 如果你想振奋自己， 先振奋周遭的人。 memcpy 介绍函数原型： void *memcpy(void *dest, const void *sr…...

编程日记 2023/12/3 22:26:55

BepInEx 6.0.0插件框架技术架构深度解析：IL2CPP签名耗尽问题的根源与解决方案

BepInEx 6.0.0插件框架技术架构深度解析：IL2CPP签名耗尽问题的根源与解决方案【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx BepInEx作为Unity游戏插件生态系统的核心…...

编程新知 2026/5/16 8:31:59

零基础新手会议记录，选购避坑指南可直接上手

日常工作学习中，不少人会遇到会议纪要整理、访谈录音处理、讲座笔记记录的难题，手动整理耗时费力还易出错。本文评测了市面上主流录音转写工具，整理了新手避坑指南和实用选择建议，零基础也能快速上手。综合实测后，听脑…...

编程新知 2026/5/16 8:29:52

Go语言模板方法模式：算法骨架

Go语言模板方法模式：算法骨架 1. 模板方法实现 type AbstractClass struct{}func (a *AbstractClass) TemplateMethod() {a.Step1()a.Step2()a.Step3() }func (a *AbstractClass) Step1() {} func (a *AbstractClass) Step2() {} func (a *AbstractClass) Step3() {…...

编程新知 2026/5/16 8:21:11

第5章集群初始化

本章说明：集群初始化是 Kubernetes 部署过程中最核心的一步。本章使用 kubeadm 在 master01 节点上初始化高可用集群控制平面。初始化时需要指定 VIP（192.168.3.59:6443）作为控制平面统一入口，这样后续加入的其他 Master 节点和 Worker 节点都通过 VIP 访问 API Server，…...

编程新知 2026/5/16 8:19:10

基于Gemini API构建多模态视觉应用：从原理到部署实践

1. 项目概述与核心价值最近在AI多模态领域，一个名为“gemini-vision-pro”的项目在开发者社区里引起了不小的讨论。这个项目本质上是一个基于Google Gemini API的视觉识别与图像理解应用，但它并非简单的API调用封装，而是提供了一个开箱即用、…...

编程新知 2026/5/16 5:36:12

ARM SCTLR2_EL2寄存器解析与虚拟化安全控制

1. ARM SCTLR2_EL2寄存器架构解析SCTLR2_EL2是ARMv8/v9架构中EL2（Hypervisor）级别的扩展系统控制寄存器，作为标准SCTLR_EL2的补充，它通过掩码位机制实现了对关键系统功能的细粒度控制。这个64位寄存器主要包含两类功能字段&#x…...

编程新知 2026/5/16 5:27:33

Nix-on-Droid测试与部署最佳实践：确保您的移动环境稳定可靠

Nix-on-Droid测试与部署最佳实践：确保您的移动环境稳定可靠【免费下载链接】nix-on-droid Nix-enabled environment for your Android device. [maintainerst184256,Gerschtli] 项目地址: https://gitcode.com/gh_mirrors/ni/nix-on-droid 想要在Android设…...

编程新知 2026/5/16 4:44:16

从 LLM 到 Agent：Harness Engineering 的角色演变

从 LLM 到 Agent：Harness Engineering 的角色演变本文字数：约10200字 | 阅读时间：25分钟 | 适合人群：AI算法工程师、产品经理、技术负责人、AI应用开发者 1. 引入与连接：被忽略的AI落地核心桥梁 1.1 开场：一个真实的AI落地场景 2024年中，某互联网公司运维团队负责人李…...

编程新知 2026/5/16 3:58:25

LSMO薄膜金属-绝缘体相变及其随机性应用研究

1. 理解LSMO薄膜中的随机性现象La0.67Sr0.33MnO3（LSMO）是一种典型的强关联电子体系材料，其独特的金属-绝缘体相变（MIT）特性为开发新型计算范式提供了物理基础。这种材料在相变临界区域表现出的随机性行为，源…...

编程新知 2026/5/16 3:30:01

numpy实现神经网络

随机初始化

训练神经网络一般步骤

激活函数和参数初始化

前向传播和反向传播函数

更新参数

训练及预测模型

检验模型

最终结果

相关文章：