深度学习入门:从零搭建你的第一个神经网络
深度学习入门:从零搭建你的第一个神经网络
系统化学习人工智能网站(收藏)
:https://www.captainbed.cn/flu
文章目录
- 深度学习入门:从零搭建你的第一个神经网络
- 摘要
- 引言
- 第一章:神经网络基础原理
- 1.1 神经元模型
- 1.2 反向传播算法
- 1.3 激活函数对比
- 第二章:开发环境搭建指南
- 2.1 硬件要求
- 2.2 软件环境
- 2.2.1 Anaconda配置
- 2.2.2 PyTorch安装
- 2.2.3 TensorFlow安装
- 2.3 开发工具
- 第三章:从零实现全连接神经网络
- 3.1 MNIST数据集加载
- 3.2 神经网络类定义
- 3.3 训练循环实现
- 3.4 完整训练代码
- 第四章:模型优化与常见问题解决
- 4.1 过拟合解决方案
- 4.2 梯度消失问题
- 4.3 学习率调度策略
- 第五章:框架对比与进阶方向
- 5.1 PyTorch vs TensorFlow
- 5.2 进阶学习资源
- 结论
摘要
随着人工智能技术的快速发展,深度学习已成为解决复杂任务的核心工具。本文面向零基础读者,系统梳理深度学习理论框架与实践流程,从神经网络基础原理、开发环境搭建、代码实现到优化策略展开详细讲解。通过对比PyTorch与TensorFlow两大框架的差异,结合手写数字识别(MNIST)案例,揭示神经网络训练的核心逻辑。同时,针对梯度消失、过拟合等常见问题提供解决方案,并展望未来技术演进方向,为读者构建完整的深度学习知识体系。
引言
深度学习是机器学习的一个分支,通过模拟人脑神经元连接方式构建多层网络结构,实现图像分类、语音识别、自然语言处理等复杂任务。根据IDC预测,2025年全球深度学习市场规模将突破1000亿美元,中国AI开发者数量已达600万。然而,许多初学者因缺乏系统指导,在环境配置、模型调试等环节遇到障碍。
本文以实战为导向,分为以下模块:
- 神经网络基础原理
- 开发环境搭建指南
- 从零实现全连接神经网络
- 模型优化与常见问题解决
- 框架对比与进阶方向
第一章:神经网络基础原理
1.1 神经元模型
人工神经元(Perceptron)是深度学习的基本单元,其数学表达式为:
[ y = f\left(\sum_{i=1}^{n} w_i x_i + b\right) ]
其中:
- (x_i):输入特征
- (w_i):权重参数
- (b):偏置项
- (f):激活函数(如Sigmoid、ReLU)
# Python实现简单神经元
import numpy as npdef neuron(x, w, b, activation='sigmoid'):z = np.dot(w, x) + bif activation == 'sigmoid':return 1 / (1 + np.exp(-z))elif activation == 'relu':return max(0, z)# 示例:3输入神经元
x = np.array([0.5, 0.3, 0.2])
w = np.array([0.4, 0.6, 0.1])
b = 0.1
print(neuron(x, w, b)) # 输出: 0.6225 (Sigmoid)
1.2 反向传播算法
反向传播通过链式法则计算损失函数对各参数的梯度,核心步骤包括:
- 前向传播计算输出
- 计算损失函数(如交叉熵)
- 反向传播计算梯度
- 更新参数((w_{new} = w_{old} - \eta \cdot \nabla w))
1.3 激活函数对比
函数类型 | 表达式 | 优点 | 缺点 |
---|---|---|---|
Sigmoid | (1/(1+e^{-x})) | 输出范围(0,1) | 梯度消失、计算耗时 |
ReLU | (\max(0,x)) | 计算高效、缓解梯度消失 | 神经元死亡(负输入) |
LeakyReLU | (\max(\alpha x,x)) | 修复ReLU负区间问题 | 需要调参(\alpha) |
第二章:开发环境搭建指南
2.1 硬件要求
- CPU:Intel i5以上(建议i7)
- GPU:NVIDIA GTX 1060(6GB显存)以上
- 内存:16GB DDR4(训练大模型建议32GB)
2.2 软件环境
2.2.1 Anaconda配置
# 创建虚拟环境
conda create -n dl_env python=3.9
conda activate dl_env# 安装基础包
conda install numpy pandas matplotlib
2.2.2 PyTorch安装
# 官网命令(CUDA 11.7版本)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117# 验证安装
import torch
print(torch.__version__) # 输出: 2.0.1+cu117
2.2.3 TensorFlow安装
pip install tensorflow-gpu==2.12.0# 验证GPU支持
import tensorflow as tf
print(tf.config.list_physical_devices('GPU')) # 输出GPU设备信息
2.3 开发工具
- Jupyter Notebook:交互式开发
- VS Code:专业代码编辑器
- PyCharm:企业级开发环境
第三章:从零实现全连接神经网络
3.1 MNIST数据集加载
from torchvision import datasets, transforms
import torch# 数据预处理
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))
])# 加载数据集
train_data = datasets.MNIST('./data', train=True, download=True, transform=transform)
test_data = datasets.MNIST('./data', train=False, download=True, transform=transform)# 创建数据加载器
train_loader = torch.utils.data.DataLoader(train_data, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_data, batch_size=1000, shuffle=False)
3.2 神经网络类定义
import torch.nn as nn
import torch.nn.functional as Fclass NeuralNet(nn.Module):def __init__(self):super().__init__()self.fc1 = nn.Linear(28*28, 128) # 输入层→隐藏层self.fc2 = nn.Linear(128, 64) # 隐藏层→隐藏层self.fc3 = nn.Linear(64, 10) # 隐藏层→输出层def forward(self, x):x = x.view(-1, 28*28) # 展平图像x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = F.log_softmax(self.fc3(x), dim=1) # 输出概率return x
3.3 训练循环实现
def train(model, device, train_loader, optimizer, epoch):model.train()for batch_idx, (data, target) in enumerate(train_loader):data, target = data.to(device), target.to(device)optimizer.zero_grad()output = model(data)loss = F.nll_loss(output, target) # 负对数似然损失loss.backward()optimizer.step()if batch_idx % 100 == 0:print(f'Train Epoch: {epoch} [{batch_idx*len(data)}/{len(train_loader.dataset)} 'f'({100.*batch_idx/len(train_loader):.0f}%)]\tLoss: {loss.item():.6f}')
3.4 完整训练代码
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = NeuralNet().to(device)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.5)for epoch in range(1, 11):train(model, device, train_loader, optimizer, epoch)test(model, device, test_loader) # 测试函数实现略
第四章:模型优化与常见问题解决
4.1 过拟合解决方案
- Dropout:随机失活部分神经元
self.dropout = nn.Dropout(p=0.5) # 训练时随机失活50%神经元
- 数据增强:旋转、平移、缩放等
transform = transforms.Compose([transforms.RandomRotation(10),transforms.RandomAffine(0, translate=(0.1, 0.1)),transforms.ToTensor()
])
4.2 梯度消失问题
- Xavier初始化:保持方差稳定
self.fc1 = nn.Linear(784, 128, weight_initializer=nn.init.xavier_uniform_)
- BatchNorm层:加速收敛
self.bn1 = nn.BatchNorm1d(128) # 隐藏层后添加
4.3 学习率调度策略
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.1)
# 每5个epoch学习率乘以0.1
第五章:框架对比与进阶方向
5.1 PyTorch vs TensorFlow
特性 | PyTorch | TensorFlow |
---|---|---|
动态计算图 | ✅(适合研究) | ❌(静态图) |
部署便利性 | ❌(需ONNX转换) | ✅(支持TFLite/TensorRT) |
社区生态 | 学术界主导 | 工业界主导 |
5.2 进阶学习资源
- 论文:AlexNet(2012)、ResNet(2015)、Transformer(2017)
- 竞赛:Kaggle、天池大赛
- 框架:TensorFlow Extended(TFX)、PyTorch Lightning
结论
深度学习入门需要理论与实践结合,本文通过神经网络原理讲解、环境配置指南、代码实现演示和优化策略总结,为读者构建了完整的知识体系。未来技术发展方向包括:
- 自动化机器学习(AutoML)
- 小样本学习(Few-Shot Learning)
- 神经架构搜索(NAS)
随着A100等GPU算力提升和Transformer架构的普及,2025年深度学习将在医疗影像、自动驾驶等领域实现更广泛应用。读者可通过持续实践和参加开源项目,逐步成长为AI工程师。
相关文章:

深度学习入门:从零搭建你的第一个神经网络
深度学习入门:从零搭建你的第一个神经网络 系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu 文章目录 深度学习入门:从零搭建你的第一个神经网络摘要引言第一章:神经网络基础原理1.1 神经元…...
【HTML-13】HTML表格合并技术详解:打造专业数据展示
表格是HTML中展示结构化数据的重要元素,而表格合并则是提升表格表现力的关键技术。本文将全面介绍HTML中的表格合并方法,帮助您创建更专业、更灵活的数据展示界面。 1. 表格合并基础概念 在HTML中,表格合并主要通过两个属性实现:…...
鸿蒙OSUniApp 制作自定义的进度条组件#三方框架 #Uniapp
使用 UniApp 制作自定义的进度条组件 在移动应用开发中,进度条是非常常见的 UI 组件,无论是文件上传、下载、任务进度还是表单填写反馈,进度条都能为用户提供直观的进度提示。虽然 UniApp 提供了一些基础的进度条能力,但在实际项…...

【Python办公】Excel简易透视办公小工具
目录 专栏导读1. 背景介绍2. 功能介绍3. 库的安装4. 界面展示5. 使用方法6. 实际应用场景7. 优化方向完整代码总结专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 🏳️🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注 👍 该系…...
m1 运行renrenfastvue出现的问题和解决方案
1. chromedriver 报错解决:执行 npm install --ignore-scripts。 2. node-sass 报错 "Node Sass does not yet support your current environment: OS X Unsupported ...": - 降低 Node 版本至 14。 - 安装版本控制工具:sudo npm insta…...
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)
一、前言 在AI模型部署效率竞争日益激烈的当下,如何将前沿大模型与高效推理框架结合,成为开发者关注的焦点。Qwen3-8B作为阿里云推出的混合推理模型,凭借80亿参数规模与128K超长上下文支持,展现了“快思考”与“慢思考”的协同能力,而vLLM框架则通过优化内存管理与并行计算…...
【C/C++】记录一次麻烦的Kafka+Json体验
文章目录 麻烦的KafkaJson体验1 目标2 工程搭建2.1 docker配置2.2 代码2.3 工程压缩包 3 执行结果 麻烦的KafkaJson体验 1 目标 初心:结合kafka json docker,验证基本的数据生产/消费。 Kafka 配合 JSON 工具,主要是为了数据的序列化和反…...

Linux系列-2 Shell常用命令收集
背景 本文用于收集Linux常用命令(基于Centos7),是一个持续更新的博客,建议收藏,编写shell时遇到问题可以随时查阅。 1.Shell类型 shell是用C语言编写的程序,作为命令解释器连接着用户和操作系统内核。常见的shell有sh(Bourne She…...

MATLAB使用多个扇形颜色变化表示空间一个点的多种数值
MATLAB使用多个扇形颜色变化表示空间一个点的多种数值 excel中表格中数据格式,多行 lonlatdata1data2data3117380.11100 clear;close all; figure(Position,[100 100 800 800]);num_points 14; [num,txt,raw] xlsread(test.xlsx); x num(:,1); y num(:,2);d…...
mysql:MVCC机制
MVCC机制 MVCC机制主要是mysql的多版本并发控制的一个机制,它主要是允许mysql去保存同一时间对同一份数据的不同历史版本的,从而避免读写之间的锁竞争,从而去提高并发的性能。 像传统的锁机制(读写互斥锁(Read-Write …...
Vue3 + Element Plus 实现树形结构的“单选 + 只选叶子节点 + 默认选中第一个子节点”
在 Vue 项目中,我们常使用树形结构组件来展示层级数据。本文将介绍如何使用 Element Plus 的 <el-tree> 组件,在 Vue3 中实现以下需求: ✅ 只能勾选叶子节点 ✅ 每次只能选中一个节点(单选) ✅ 页面加载时默认…...

CAD精简多段线顶点、优化、删除多余、重复顶点——CAD c#二次开发
附部分代码如下: public static void Pl精简(){Document doc Autodesk.AutoCAD.ApplicationServices.Application.DocumentManager.MdiActiveDocument;Database db doc.Database;Editor ed doc.Editor;var plOrigon db.SelectCurve("\n选择多段线:");…...

输电线路的“智慧之眼”:全天候可视化监测如何赋能电网安全运维
在电力需求持续攀升、电网规模日益庞大的今天,输电线路的安全稳定运行面临着前所未有的挑战。线路跨越地形复杂多变,尤其是在偏远山区、铁路沿线及恶劣天气条件下,传统的人工巡检方式显得力不从心——效率低、风险高、覆盖有限。如何实现更智…...
Spring 核心知识点补充
Spring 核心知识点补充 1. IoC(控制反转) 核心思想:将对象的创建和依赖管理交给容器,而非在代码中直接控制实现方式: XML 配置:<bean> 标签定义对象注解:Component, Service, Repositor…...

两阶段法目标检测发展脉络
模式识别期末展示大作业,做个记录,希望大家喜欢。 R-CNN Fast R-CNN R-FCN 整个过程可以分解为以下几个步骤: 输入图像 (image) 和初步特征提取 (conv, feature maps): 首先,输入一张原始图像,经过一系列…...
Flannel 支持的后端
Flannel 是一个为 Kubernetes 设计的容器网络解决方案,支持多种后端(backend)来处理节点间的数据包转发。根据官方文档和其他可靠来源,以下是 Flannel 支持的后端类型及其说明: VXLAN(推荐) 描述…...

小白的进阶之路系列之六----人工智能从初步到精通pytorch数据集与数据加载器
本文将介绍以下内容: 数据集与数据加载器 数据迁移 如何建立神经网络 数据集与数据加载器 处理数据样本的代码可能会变得混乱且难以维护;理想情况下,我们希望我们的数据集代码与模型训练代码解耦,以获得更好的可读性和模块化。PyTorch提供了两个数据原语:torch.utils…...
SQL进阶之旅 Day 5: 常用函数与表达式
【SQL进阶之旅 Day 5】常用函数与表达式 在SQL的进阶学习中,掌握常用函数和表达式是提升查询效率、解决复杂业务问题的关键。本篇文章将深入探讨聚合函数、日期函数、条件表达式等核心内容,并结合实际案例分析其应用价值。通过理论讲解、代码示例和性能…...

NestJS——重构日志、数据库、配置
个人简介 👀个人主页: 前端杂货铺 🙋♂️学习方向: 主攻前端方向,正逐渐往全干发展 📃个人状态: 研发工程师,现效力于中国工业软件事业 🚀人生格言: 积跬步…...

c++数据结构8——二叉树的性质
一、二叉树的基本性质 示图1: 性质1:层节点数上限 在一棵二叉树中,第i层至多有2^{i-1}个节点(首层是第1层) 这个性质可以通过数学归纳法证明: 第1层:2^{1-1}2^01个节点(根节点&am…...

Window Server 2019--08 网络负载均衡与Web Farm
本章要点 1、了解网络负载均衡技术 2、掌握Web Farm核心原理 3、掌握如何使用Windows NLB搭建Web Farm环境 网络负载均衡技术将外部计算机发送的连接请求均匀的分配到服务器集群中的每台服务器上,接受到请求的服务器独立地响应客户的请求。 网络负载均衡技术还…...
arcgis字段计算器中计算矢量面的每个点坐标
python脚本 函数 def ExportCoordinates(feat):coors = []partnum = 0partcount = feat.partCountwhile partnum < partcount:part = feat.getPart(partnum)pnt = part.next()while pnt:coors.append("({}, {})".format(pnt.X,pnt.Y))pnt = part.next()if not p…...

SpringBoot:统一功能处理、拦截器、适配器模式
文章目录 拦截器什么是拦截器?为什么要使用拦截器?拦截器的使用拦截路径执行流程典型应用场景DispatcherServlet源码分析 适配器模式适配器模式定义适配器模式角色适配器模式的实现适配器模式应用场景 统⼀数据返回格式优点 统一处理异常总结 拦截器 什…...

AI Agent工具全景解析:从Coze到RAGflow,探索智能体自动化未来!
在人工智能技术持续深入行业应用的背景下,越来越多的企业和个人寻求通过自动化技术来提高效率和减少重复性劳动,AI Agent的崛起已经成为了不可忽视的趋势。AI Agent,即人工智能代理,是一种基于先进的人工智能技术,特别…...
GitLab CI流水线权限隔离
方案概述 本方案实现在GitLab CI/CD中根据不同人员的权限级别执行不同的流水线步骤,主要基于GitLab的以下特性: rules 条件判断variables 变量传递only/except 条件限制用户权限API查询 基础权限模型设计 1. 用户角色定义 角色描述对应GitLab权限De…...
xcode卡死问题,无论打开什么程序xcode总是在转菊花,重启电脑,卸载重装都不行
很可能是因为我们上次没有正常关闭Xcode,而Xcode保留了上次错误的一些记录,而这次打开Xcode依然去加载错误的记录,所以必须完全删除这些记录Xcode才能加载正常的项目。 那么也就是说,我们是不是只需要删除这部分错误记录文件就可以…...

Onvif协议:IPC客户端开发-IPC相机控制(c语言版)
前言: 本博文主要是借鉴OceanStar大神的博文,在他的博文的基础之上做了一部分修改与简化。 博文链接: Onvif协议:IPC客户端开发之鉴权_onvif鉴权方式-CSDN博客 Onvif协议:IPC客户端开发之PTZ控制_onvif ptz-CSDN博客…...

如何最简单、通俗地理解Pytorch?神经网络中的“梯度”是怎么自动求出来的?PyTorch的动态计算图是如何实现即时执行的?
PyTorch是一门科学——现代深度学习工程中的一把锋利利器。它的简洁、优雅、强大,正在让越来越多的AI研究者、开发者深度应用。 1. PyTorch到底是什么?为什么它重要? PyTorch是一个开源的深度学习框架,由Facebook AI Research(FAIR)于2016年发布,它的名字由两个部分组成…...

QT+opecv如何更改图片的拍摄路径
如何更改相机拍摄图片的路径 前言:基础夯实:效果展示:实现功能:遇到问题:未解决: 核心代码: 前言: 最近在项目开发中遇到需要让用户更改相机拍摄路径的问题,用户可自己选…...
WebSocket学习总结
WebSocket 是一种基于TCP的网络通信协议,允许浏览器和服务器之间进行全双工、实时、低延迟的双向数据传输。它突破了传统HTTP协议的限制(请求-响应模式),特别适合需要实时通信的场景(如聊天、实时数据推送、游戏等&…...