【人工智能-初级】第15章 TensorFlow 和 PyTorch 的入门:深度学习的利器
文章目录
- 一、引言
- 二、TensorFlow 简介
- 2.1 什么是 TensorFlow?
- 2.2 TensorFlow 安装
- 2.3 TensorFlow 构建简单的神经网络
- 2.4 TensorBoard 可视化
- 三、PyTorch 简介
- 3.1 什么是 PyTorch?
- 3.2 PyTorch 安装
- 3.3 PyTorch 构建简单的神经网络
- 四、TensorFlow 与 PyTorch 的对比
- 4.1 灵活性
- 4.2 易用性
- 4.3 部署能力
- 五、总结
- 5.1 学习要点
- 5.2 练习题
一、引言
在深度学习领域,TensorFlow 和 PyTorch 是最流行的两个框架。它们为构建、训练和部署深度学习模型提供了强大的工具,使得研究人员和开发者能够快速开发复杂的神经网络应用。这两个框架各有优劣,TensorFlow 以其强大的生产部署能力而闻名,而 PyTorch 则以其易用性和灵活性深受研究人员的喜爱。
本篇文章将介绍 TensorFlow 和 PyTorch 的基础概念,通过实例代码展示如何使用这两个框架构建简单的深度学习模型,帮助读者快速上手这两款深度学习利器。
二、TensorFlow 简介
2.1 什么是 TensorFlow?
TensorFlow 是由 Google 开发的一个开源深度学习框架,最初用于大规模机器学习任务的分布式训练。它的主要特点包括:
- 灵活性:支持从机器学习到深度学习的多种任务。
- 易于部署:可以轻松地将模型部署到不同平台(如服务器、移动设备和浏览器)。
- 强大的可视化工具:TensorBoard 是 TensorFlow 内置的可视化工具,用于追踪和监控训练过程。
TensorFlow 使用计算图(Computation Graph)来构建和执行模型,用户通过定义图中的节点和边来描述神经网络的结构。
2.2 TensorFlow 安装
要安装 TensorFlow,只需使用 Python 的 pip 工具:
pip install tensorflow
安装完成后,我们可以在 Python 环境中导入 TensorFlow:
import tensorflow as tf
2.3 TensorFlow 构建简单的神经网络
接下来,我们使用 TensorFlow 来实现一个简单的两层神经网络,用于对 MNIST 数据集进行分类。MNIST 数据集包含手写数字的图片,每个图片是 28x28 像素,分为 10 个类别(0-9)。
import tensorflow as tf
from tensorflow.keras import layers, models# 加载 MNIST 数据集
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()# 数据归一化
x_train, x_test = x_train / 255.0, x_test / 255.0# 构建神经网络模型
model = models.Sequential([layers.Flatten(input_shape=(28, 28)),layers.Dense(128, activation='relu'),layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])# 训练模型
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))
- layers.Flatten:将输入的 28x28 的图像展开为一维数组,作为全连接层的输入。
- layers.Dense:定义全连接层,其中 128 个神经元使用 ReLU 激活函数,10 个输出神经元使用 softmax 激活函数。
- model.compile:定义优化器、损失函数和评估指标。
- model.fit:使用训练数据训练模型,执行 5 个训练周期(epoch)。
2.4 TensorBoard 可视化
TensorBoard 是 TensorFlow 提供的可视化工具,可以帮助我们查看模型训练的过程和参数变化。
使用 TensorBoard 的步骤如下:
- 在编译模型时添加日志记录。
- 启动 TensorBoard 服务器,查看日志。
import datetime# 定义日志目录
log_dir = "logs/fit/" + datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)# 训练模型并记录日志
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test), callbacks=[tensorboard_callback])
接着,可以在命令行中启动 TensorBoard:
tensorboard --logdir=logs/fit
打开浏览器并访问 http://localhost:6006 即可查看训练的可视化结果。
三、PyTorch 简介
3.1 什么是 PyTorch?
PyTorch 是由 Facebook 开发的一个开源深度学习框架,以其动态计算图的特性和高度的灵活性而受到研究人员的广泛喜爱。PyTorch 提供了类似 NumPy 的张量操作,并集成了自动求导功能,使得用户能够更方便地构建和调试神经网络。
PyTorch 的主要特点包括:
- 动态图:在运行时动态构建计算图,使得调试和开发更加灵活。
- 简洁的 API:与 Python 生态系统紧密集成,易于学习和使用。
- 支持 GPU 加速:简单的 API 使得用户能够轻松将模型部署到 GPU 上。
3.2 PyTorch 安装
要安装 PyTorch,也可以使用 pip 工具:
pip install torch torchvision
安装完成后,我们可以在 Python 环境中导入 PyTorch:
import torch
import torch.nn as nn
import torch.optim as optim
3.3 PyTorch 构建简单的神经网络
接下来,我们使用 PyTorch 来实现一个简单的两层神经网络,来完成 MNIST 数据集的分类任务。
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader# 数据加载与预处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
train_data = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_data = datasets.MNIST(root='./data', train=False, download=True, transform=transform)
train_loader = DataLoader(train_data, batch_size=64, shuffle=True)
test_loader = DataLoader(test_data, batch_size=64, shuffle=False)# 定义神经网络模型
class SimpleNN(nn.Module):def __init__(self):super(SimpleNN, self).__init__()self.flatten = nn.Flatten()self.fc1 = nn.Linear(28*28, 128)self.relu = nn.ReLU()self.fc2 = nn.Linear(128, 10)self.softmax = nn.Softmax(dim=1)def forward(self, x):x = self.flatten(x)x = self.fc1(x)x = self.relu(x)x = self.fc2(x)return self.softmax(x)model = SimpleNN()# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练模型
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)num_epochs = 5
for epoch in range(num_epochs):model.train()running_loss = 0.0for images, labels in train_loader:images, labels = images.to(device), labels.to(device)# 前向传播outputs = model(images)loss = criterion(outputs, labels)# 反向传播与优化optimizer.zero_grad()loss.backward()optimizer.step()running_loss += loss.item()print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {running_loss/len(train_loader):.4f}')print('Finished Training')
- transforms.Normalize:对图像进行归一化处理。
- nn.Linear:定义全连接层,包含输入和输出特征数。
- model.train():将模型设置为训练模式。
- optimizer.zero_grad():清除梯度缓存,防止梯度累积。
- loss.backward():计算梯度,进行反向传播。
- optimizer.step():更新模型的参数。
四、TensorFlow 与 PyTorch 的对比
4.1 灵活性
- TensorFlow:TensorFlow 在构建和运行模型时,采用静态计算图的方式,这意味着计算图在执行前就已经构建完成。这种方式有利于优化计算过程,适合在生产环境中部署模型。
- PyTorch:PyTorch 则采用动态图的方式,在运行时动态构建计算图,这使得调试和模型修改更加方便,深受研究人员和开发者的喜爱。
4.2 易用性
- TensorFlow:TensorFlow 的早期版本使用静态图,较为复杂,但自 2.0 版本以来,使用类似 Keras 的接口,变得更加易于上手。
- PyTorch:PyTorch 的设计与 Python 编程语言紧密结合,代码简洁、易于理解,尤其适合新手学习深度学习和进行研究。
4.3 部署能力
- TensorFlow:TensorFlow 提供了强大的生产部署工具,如 TensorFlow Serving,用于在生产环境中部署深度学习模型。
- PyTorch:虽然 PyTorch 的部署能力相对较弱,但最近推出的 TorchServe 也为部署 PyTorch 模型提供了便利。
五、总结
TensorFlow 和 PyTorch 是当前深度学习领域最流行的两个框架,各有其优缺点。TensorFlow 更加适合生产部署,而 PyTorch 则因其灵活性和易用性在研究领域更受欢迎。在本文中,我们介绍了这两个框架的基础知识,并通过实例代码展示了如何使用 TensorFlow 和 PyTorch 构建简单的神经网络模型。希望这篇文章能够帮助您理解并快速上手这两款深度学习工具。
5.1 学习要点
- TensorFlow 的静态图和 PyTorch 的动态图:理解两者的主要区别以及对模型构建的影响。
- 深度学习模型的构建和训练:掌握如何使用 TensorFlow 和 PyTorch 构建和训练简单的神经网络模型。
- 模型部署:了解两者在生产环境中的应用及部署能力。
5.2 练习题
- 使用 TensorFlow 和 PyTorch 分别构建一个三层神经网络模型,比较其代码实现和训练效果。
- 在 PyTorch 中使用不同的优化器(如 SGD、Adam),观察对训练速度和精度的影响。
- 使用 TensorFlow 的 TensorBoard 可视化工具,监控模型的训练过程,并理解各项指标的含义。
希望本文能帮助您
相关文章:
【人工智能-初级】第15章 TensorFlow 和 PyTorch 的入门:深度学习的利器
文章目录 一、引言二、TensorFlow 简介2.1 什么是 TensorFlow?2.2 TensorFlow 安装2.3 TensorFlow 构建简单的神经网络2.4 TensorBoard 可视化 三、PyTorch 简介3.1 什么是 PyTorch?3.2 PyTorch 安装3.3 PyTorch 构建简单的神经网络 四、TensorFlow 与 P…...
git禁用 SSL 证书验证
命令 git config --global http.sslVerify false注意:禁用 SSL 证书验证是不安全的,可能会使你的 Git 操作面临中间人攻击的风险。因此,只有在你确信网络环境是安全的,且了解禁用 SSL 验证的后果时,才应该使用这个配置…...
C++之《剑指offer》学习记录(2):sizeof
笔者最近在找工作时,无意间读到了一本名为《剑指offer》的书,粗略翻阅了一下,感觉这将会是一本能让我不再苦恼于笔试和面试“手搓代码”的书。故笔者写下该系列博客记录自己的学习历程,希望能和这本书的读者朋友们一起交流学习心得…...
linux线程 | 同步与互斥 | 线程池以及知识点补充
前言:本节内容是linux的线程的相关知识。本篇首先会实现一个简易的线程池, 然后再将线程池利用单例的懒汉模式改编一下。 然后再谈一些小的知识点,比如自旋锁, 读者写者问题等等。 那么, 现在开始我们的学习吧。 ps:本…...
ArkTS 如何实现表单,地区选择效果
速览 ArkTS实现表单和地区选择效果,可通过Picker组件实现地区选择下拉列表,结合表单组件如Input等构建完整表单。使用ArkTS提供的UI组件库和状态管理机制,可以方便地构建复杂且交云互动的表单界面。 1. ArkTS 表单基础 在ArkTS中,构建表单通常涉及多个UI组件的组合,如I…...
Vite 项目的核心配置- vite.config.ts 和 tsconfig.json 全解析
一、vite.config.ts 详细说明 vite.config.ts 是 Vite 项目的核心配置文件。它允许你自定义 Vite 的行为,以适应你的项目需求。 让我们来看看其中一些重要的配置选项: import { fileURLToPath, URL } from node:url// 使用 defineConfig 帮手函数,这样不用 jsdoc …...
如何使用JMeter进行性能测试的保姆级教程
性能测试是确保网站在用户访问高峰时保持稳定和快速响应的关键环节。作为初学者,选择合适的工具尤为重要。JMeter 是一个强大的开源性能测试工具,可以帮助我们轻松模拟多用户场景,测试网站的稳定性与性能。本教程将引导你通过一个简单的登录场…...
Qt 实战(11)样式表 | 11.1、样式表简介
文章目录 一、样式表简介1、简介2、样式表语法2.1、样式规则2.2、选择器类型2.3、伪状态2.4、设置子控件状态 3、样式表继承与优先级3.1、样式表继承3.2、样式表优先级3.3、解决冲突3.4、样式表层叠 4、总结 前言: 在开发图形用户界面(GUI)应…...
WebGl 多缓冲区和数据偏移
1.多缓冲区 多缓冲区技术通常涉及到创建多个缓冲区对象,并将它们用于不同的数据集。这种做法可以提高数据处理效率,尤其是在处理大量数据或需要频繁更新数据时。通过预先分配和配置多个缓冲区,可以在不影响渲染性能的情况下,快速…...
基于SSM的甜品店销售管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…...
Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis
Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis 摘要 动态场景的新视角合成一直是一个引人入胜但充满挑战的问题。尽管最近取得了很多进展,但如何同时实现高分辨率的真实感渲染、实时渲染和紧凑的存储,依然是一个巨大的…...
PCL 基于FPFH特征描述子获取点云对应关系
目录 一、概述 1.1原理 1.2实现步骤 1.3应用场景 二、代码实现 2.1关键函数 2.1.1 FPFH特征计算函数 2.1.2 获取点云之间的对应点对函数 2.1.3 可视化函数 2.2完整代码 三、实现效果 PCL点云算法汇总及实战案例汇总的目录地址链接: PCL点云算法与项目实战案例汇总…...
项目实战:Qt+OpenCV仿射变换工具v1.1.0(支持打开图片、输出棋盘角点、调整偏移点、导出变换后的图等等)
若该文为原创文章,转载请注明出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/143105881 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、Op…...
OpenCV坐标系统与图像处理案例
在图像处理中,理解图像的坐标系统是至关重要的。OpenCV,作为一个强大的计算机视觉库,提供了丰富的功能来操作图像。本文将介绍OpenCV中的坐标系统,并提供一个简单的案例来展示如何使用这些坐标来修改图像的特定区域。 OpenCV坐标…...
Unity之如何使用Unity Cloud Build云构建
文章目录 前言什么是 UnityCloudBuild?如何使用Unity云构建Unity 团队中的人员不属于 Unity Team 的人员UnityCloudBuild2.0价格表如何使用Unity云构建配置CloudBuild前言 Unity Cloud Build作为Unity平台的一项强大工具,它允许开发团队通过云端自动构建项目,节省了繁琐的手…...
Halcon开启多线程
并行运算(提升检测时间) 支持主线程中的子线程并行执行程序和调用算子。 一旦启动,子线程由线程 ID 标识,该线程 ID 是一个取决于操作系统的整数进程号。 子线程的执行独立于它们启动的线程。 因此,无法预测子线程执行…...
Echarts 点击事件无法使用 this 或者 this绑定的数据无法获取
这里写自定义目录标题 现象解决方案 现象 给echarts绑定自定义点击事件时,无法使用this,并且无法获取到this绑定的数据。 解决方案 增加:const _this this; 代码块如下: const _this this; let myChart echarts.init(docum…...
PCL 基于距离阈值去除错误对应关系(永久免费版)
目录 一、概述1.1 原理1.2 实现步骤1.3应用场景 二、关键函数2.1 获取初始点对2.2 基于距离的对应关系筛选函数2.3 可视化 三、完整代码四、结果展示 即日起,付费专栏所有内容将以永久免费形式陆续进行发表!!! 一、概述 在3D点云的…...
DirectX 11 和 Direct3D 11 的关系
以下是对两者的详细比较: DirectX 11 DirectX 11是微软的一项技术,为高性能游戏和复杂图形程序制定了标准。它是DirectX系列的一个版本,引入了多项创新功能,如硬件加速的Tessellation(细分曲面技术)、多线…...
什么是SCRM?为什么企业要做SCRM?
很多人都知道CRM是客户关系管理系统,而SCRM又是什么呢? 今天我就给大家用一文讲清SCRM的那些事,本文包括:SCRM 的定义与内涵,与传统 CRM 的区别;通过案例阐述其重要性及作用,如适应消费模式转变…...
wordpress后台更新后 前端没变化的解决方法
使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...
前端导出带有合并单元格的列表
// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...
Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)
引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...
用docker来安装部署freeswitch记录
今天刚才测试一个callcenter的项目,所以尝试安装freeswitch 1、使用轩辕镜像 - 中国开发者首选的专业 Docker 镜像加速服务平台 编辑下面/etc/docker/daemon.json文件为 {"registry-mirrors": ["https://docker.xuanyuan.me"] }同时可以进入轩…...
3-11单元格区域边界定位(End属性)学习笔记
返回一个Range 对象,只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意:它移动的位置必须是相连的有内容的单元格…...
企业如何增强终端安全?
在数字化转型加速的今天,企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机,到工厂里的物联网设备、智能传感器,这些终端构成了企业与外部世界连接的 “神经末梢”。然而,随着远程办公的常态化和设备接入的爆炸式…...
面向无人机海岸带生态系统监测的语义分割基准数据集
描述:海岸带生态系统的监测是维护生态平衡和可持续发展的重要任务。语义分割技术在遥感影像中的应用为海岸带生态系统的精准监测提供了有效手段。然而,目前该领域仍面临一个挑战,即缺乏公开的专门面向海岸带生态系统的语义分割基准数据集。受…...
人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...
MySQL 8.0 事务全面讲解
以下是一个结合两次回答的 MySQL 8.0 事务全面讲解,涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容,并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解 一、事务的核心概念(ACID) 事务是…...
免费数学几何作图web平台
光锐软件免费数学工具,maths,数学制图,数学作图,几何作图,几何,AR开发,AR教育,增强现实,软件公司,XR,MR,VR,虚拟仿真,虚拟现实,混合现实,教育科技产品,职业模拟培训,高保真VR场景,结构互动课件,元宇宙http://xaglare.c…...
