当前位置：首页 > news >正文

深度学习三大框架对比与实战：PyTorch、TensorFlow 和 Keras 全面解析

news 2026/2/8 23:25:47

深度学习框架的对比与实践

引言

在当今深度学习领域，PyTorch、TensorFlow 和 Keras 是三大主流框架。它们各具特色，分别满足从研究到工业部署的多种需求。本文将通过清晰的对比和代码实例，帮助你了解这些框架的核心特点以及实际应用。

1. 深度学习框架简介

PyTorch

PyTorch 是 Facebook 推出的动态计算图框架，以灵活的调试能力和面向对象的设计深受研究人员喜爱。其代码风格与 Python 十分相似，非常直观。

主要特点：

动态计算图：支持即时调整网络结构，调试更加灵活。
社区支持：在学术领域占据主流地位。
简单易用：轻松与其他 Python 库集成，如 Numpy。

TensorFlow

TensorFlow 是谷歌开发的深度学习框架，功能全面，尤其适合生产部署和大规模训练。2.0 版本后，其用户体验大幅提升，同时支持基于 Keras 的高层接口。

主要特点：

工具生态：提供如 TensorBoard 和 TF-Hub 等配套工具，方便开发者分析和复用模型。
强大的部署支持：适合工业应用中的大规模分布式训练。
动态图支持：结合静态图与动态图的优点。

Keras

Keras 是一个高层神经网络 API，设计极简且高效，现已集成到 TensorFlow 中。它是快速原型设计和新手入门的最佳选择。

主要特点：

简单易用：清晰的 API 让模型构建变得直观。
高度模块化：用户专注于高层设计，而不需要深入理解底层细节。
无缝集成：依托 TensorFlow 的强大支持。

2. PyTorch 入门实践

2.1 安装与配置

PyTorch 的安装简单明了：

pip install torch torchvision

2.2 MNIST 分类模型实现

以下代码展示如何用 PyTorch 实现一个简单的三层全连接神经网络，用于 MNIST 手写数字分类：

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms# 数据预处理
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,))
])
trainset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)# 模型定义
class SimpleNN(nn.Module):def __init__(self):super(SimpleNN, self).__init__()self.fc1 = nn.Linear(28 * 28, 128)self.fc2 = nn.Linear(128, 64)self.fc3 = nn.Linear(64, 10)def forward(self, x):x = x.view(x.shape[0], -1)x = torch.relu(self.fc1(x))x = torch.relu(self.fc2(x))x = self.fc3(x)return x# 模型训练
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = SimpleNN().to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)for epoch in range(5):running_loss = 0for images, labels in trainloader:images, labels = images.to(device), labels.to(device)optimizer.zero_grad()output = model(images)loss = criterion(output, labels)loss.backward()optimizer.step()running_loss += loss.item()print(f'Epoch {epoch + 1}, Loss: {running_loss / len(trainloader)}')

PyTorch 的特点总结：

动态计算图：让模型调试和修改异常方便。
支持 GPU：通过简单的代码即可加速训练。

3. TensorFlow 基础应用

3.1 安装

安装 TensorFlow 也非常简单：

pip install tensorflow

3.2 使用 TensorFlow 实现 CNN

以下代码演示如何用 TensorFlow 实现卷积神经网络，对 MNIST 数据集进行分类：

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical# 数据预处理
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)# 模型构建
model = models.Sequential([layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),layers.MaxPooling2D((2, 2)),layers.Conv2D(64, (3, 3), activation='relu'),layers.MaxPooling2D((2, 2)),layers.Flatten(),layers.Dense(64, activation='relu'),layers.Dense(10, activation='softmax')
])# 模型编译与训练
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_data=(test_images, test_labels))

4. Keras 快速上手

4.1 构建一个简单的全连接模型

from tensorflow.keras import models, layers
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical# 数据加载和处理
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28 * 28)).astype('float32') / 255
test_images = test_images.reshape((10000, 28 * 28)).astype('float32') / 255
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)# 构建模型
model = models.Sequential([layers.Dense(512, activation='relu', input_shape=(28 * 28,)),layers.Dense(10, activation='softmax')
])# 模型编译与训练
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=128, validation_data=(test_images, test_labels))

5. 高级功能与优化

5.1 学习率调整

动态调整学习率有助于模型更快收敛：

lr_schedule = tf.keras.callbacks.LearningRateScheduler(lambda epoch: 1e-3 * 10**(epoch / 20))
model.fit(train_images, train_labels, epochs=10, callbacks=[lr_schedule])

5.2 迁移学习

使用预训练模型（如 VGG16）进行迁移学习：

from tensorflow.keras.applications import VGG16
from tensorflow.keras import models, layersbase_model = VGG16(weights='imagenet', include_top=False, input_shape=(150, 150, 3))
base_model.trainable = Falsemodel = models.Sequential([base_model,layers.Flatten(),layers.Dense(256, activation='relu'),layers.Dense(1, activation='sigmoid')
])model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])

6. 总结

PyTorch 以灵活性和动态特性，适合研究人员。
TensorFlow 提供全面的工具链和部署能力，是工业级开发的首选。
Keras 以其简单性和模块化设计，非常适合新手入门和快速原型。

通过对比和实例展示，希望能帮助你更好地选择和掌握适合自己的框架。尝试从实践中学习，进一步深入探索这些工具的强大功能！

深度学习三大框架对比与实战：PyTorch、TensorFlow 和 Keras 全面解析

深度学习框架的对比与实践引言在当今深度学习领域，PyTorch、TensorFlow 和 Keras 是三大主流框架。它们各具特色，分别满足从研究到工业部署的多种需求。本文将通过清晰的对比和代码实例，帮助你了解这些框架的核心特点以及实际应用。 1. 深…...

编程日记 2024/11/21 6:27:16

Leetcode206.反转链表(HOT100)

链接： 我的代码： class Solution { public:ListNode* reverseList(ListNode* head) {ListNode* p head;ListNode*res new ListNode(-1);while(p){ListNode*k res->next;res->next p;p p->next;res->next->next k;}return res->…...

编程日记 2024/11/21 6:26:14

怎么做好白盒测试？

白盒测试一、什么是白盒测试？二、白盒测试特点三、白盒测试的设计方法1、逻辑覆盖法1、测试设计方法—语句覆盖a、用例设计如下：b、语句覆盖的局限性 2、测试设计方法—判定覆盖a、测试用例如下：b、判定覆盖的局限性 3、测试设计方法—条件覆…...

编程日记 2024/11/21 6:25:13

【神经网络基础】

神经网络基础 1.损失函数1.损失函数的概念2.分类任务损失函数-多分类损失:3.分类任务损失函数-二分类损失:4.回归任务损失函数计算-MAE损失5.回归任务损失函数-MSE损失6.回归任务损失函数-Smooth L1损失 2.网络优化方法1.梯度下降算法2.反向传播算法(BP算法)3.梯度下降优化方法…...

编程日记 2024/11/21 6:24:11

实战 | C#中使用YoloV8和OpenCvSharp实现目标检测（步骤 + 源码）

导读本文主要介绍在C#中使用YoloV8实现目标检测，并给详细步骤和代码。详细步骤【1】环境和依赖项。需先安装VS2022最新版，.NetFramework8.0，然后新建项目，nuget安装 YoloSharp，YoloSharp介绍： https://github.com/dme-compunet/YoloSharp 最新版6.0.1，本文…...

编程日记 2024/11/21 6:23:10

debian 如何进入root

debian root默认密码, 在Debian系统中，安装完成后，默认情况下root账户是没有密码的。你可以通过以下步骤来设置或更改root密码： 1.打开终端。 2.输入 sudo passwd root 命令。 3.当提示输入新的root密码时，输入你想要的密码…...

编程日记 2024/11/21 6:22:09

短视频矩阵系统：智能批量剪辑、账号管理新纪元！

在当今快节奏的数字化时代，短视频已经成为人们获取信息和娱乐的主要途径。然而，对于创作者和企业来说，如何高效地管理多个短视频账号并保持内容的质量和一致性，成为了一个令人头疼的问题。短视频矩阵系统就是为了解决这一难题…...

编程日记 2024/11/21 6:21:08

【SpringMVC - 1】基本介绍+快速入门+图文解析SpringMVC执行流程

目录 1.Spring MVC的基本介绍 2.大致分析SpringMVC工作流程 3.SpringMVC的快速入门首先大家先自行配置一个Tomcat 文件的配置配置 WEB-INF/web.xml 创建web/login.jsp 创建com.ygd.web.UserServlet控制类创建src下的applicationContext.xml文件重点的注意事项和说明…...

编程日记 2024/11/21 6:20:06

vitepress博客模板搭建

vitepress博客搭建个人博客技术栈更新，快速搭建一个vitepress自定义博客建议去博客查看文章，观感更佳。原文地址模板仓库： vitepress-blog-template 前言服务器过期快一年了，博客也快一年没更新了，最近重新搭…...

编程日记 2024/11/21 6:18:05

Git入门图文教程 -- 深入浅出 ( 保姆级 )

01、认识一下Git！—简介 Git是当前最先进、最主流的分布式版本控制系统，免费、开源！核心能力就是版本控制。再具体一点，就是面向代码文件的版本控制，代码的任何修改历史都会被记录管理起来，意味着可以恢复…...

编程日记 2024/11/21 6:17:03

Linux编辑器 - vim

目录一、vim 的基本概念 1. 正常/普通/命令模式(Normal mode) 2. 插入模式(Insert mode) 3. 末行模式(last line mode) 二、vim 的基本操作三、vim 正常模式命令集 1. 插入模式 2. 移动光标 3. 删除文字 4. 复制 5. 替换 6. 撤销上一次操作 7. 更改 8. 调至指定…...

编程日记 2024/11/21 6:16:01

Spring Security使用基本认证（Basic Auth）保护REST API

基本认证概述基本认证（Basic Auth）是保护REST API最简单的方式之一。它通过在HTTP请求头中携带Base64编码过的用户名和密码来进行身份验证。由于基本认证不使用cookie，因此没有会话或用户登出的概念，这意味着每次请求都必须包含…...

编程日记 2024/11/21 6:13:59

MySQL —— explain 查看执行计划与 MySQL 优化

文章目录 explain 查看执行计划explain 的作用——查看执行计划explain 查看执行计划返回信息详解表的读取顺序（id）查询类型（select_type）数据库表名（table）联接类型（type）可用的索引…...

编程日记 2024/11/21 6:12:57

出海第一步：搞定业务系统的多区域部署

出海的企业越来越多，他们不约而同开始在全球范围内部署应用程序。这样做的原因有很多，例如降低延迟，改善用户体验；满足一些国家或地区的数据隐私法规与合规要求；通过在全球范围内部署应用程序来提高容灾能力和可用性&a…...

编程日记 2024/11/21 6:11:56

二手手机回收小程序，一键便捷高效回收

随着科技的不断升级，智能手机也在快速进行更新换代，出现了大量的闲置手机，这为二手手机市场提供了巨大的发展空间！ 经过手机回收市场的快速发展，二手手机回收已经成为了消费者的新选择，既能够减少手机的浪…...

编程日记 2024/11/21 6:10:55

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-性能分析（四）

一、前言离线推理能够在模型训练完成后，特别是在处理大规模数据时，利用预先准备好的输入数据进行批量推理，从而显著提高计算效率和响应速度。通过离线推理，可以在不依赖实时计算的情况下，快速生成预测结果，从而优化决策流程和提升用户体验。此外，离线推理还可以降低云计…...

编程日记 2024/11/21 6:09:53

深入解析小程序组件：view 和 scroll-view 的基本用法

深入解析小程序组件：view 和 scroll-view 的基本用法引言在微信小程序的开发中，组件是构建用户界面的基本单元。两个常用的组件是 view 和 scroll-view。这两个组件不仅功能强大，而且使用灵活，是开发者实现复杂布局和交互的基础。本文将深入探讨这两个组件的基本用法，…...

编程日记 2024/11/21 6:08:52

【汇编语言】转移指令的原理（三） —— 汇编跳转指南：jcxz、loop与位移的深度解读

文章目录前言1. jcxz 指令1.1 什么是jcxz指令1.2 如何操作 2. loop 指令2.1 什么是loop指令2.2 如何操作 3. 根据位移进行转移的意义3.1 为什么？3.2 举例说明 4. 编译器对转移位移超界的检测结语前言 📌 汇编语言是很多相关课程（如数据结构…...

编程日记 2024/11/21 6:07:51

opencv-python 分离边缘粘连的物体（距离变换）

import cv2 import numpy as np# 读取图像，这里添加了判断图像是否读取成功的逻辑 img cv2.imread("./640.png") # 灰度图 gray cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 高斯模糊 gray cv2.GaussianBlur(gray, (5, 5), 0) # 二值化 ret, binary cv2…...

编程日记 2024/11/21 6:06:50

机器学习杂笔记1：类型-数据集-效果评估-sklearn-机器学习算法分类

文章目录 1.类型2.数据集3.效果评估4.sklearn5.sklearn机器学习算法七种数据分析方法1.对比分析2.细分分析3.A/B测试 （单一变量分析）4.漏斗分析5.留存分析6.相关分析7.聚类分析 1.类型【1】监督学习：从成对的已经标记好的输入和输出经验数据…...

编程日记 2024/11/21 6:05:49

conda相比python好处

Conda 作为 Python 的环境和包管理工具，相比原生 Python 生态（如 pip 虚拟环境）有许多独特优势，尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处： 一、一站式环境管理&#xff1a…...

编程新知 2025/11/29 6:54:19

手游刚开服就被攻击怎么办？如何防御DDoS？

开服初期是手游最脆弱的阶段，极易成为DDoS攻击的目标。一旦遭遇攻击，可能导致服务器瘫痪、玩家流失，甚至造成巨大经济损失。本文为开发者提供一套简洁有效的应急与防御方案，帮助快速应对并构建长期防护体系。一、遭遇攻击的紧急应…...

编程新知 2026/2/8 4:37:03

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装（Encapsulation） 定义：将数据（属性）和操作数据的方法绑定在一起，通过访问控制符（private、protected、public）隐藏内部实现细节。示例： public …...

编程新知 2025/10/6 4:03:40

视频字幕质量评估的大规模细粒度基准

大家读完觉得有帮助记得关注和点赞！！！ 摘要视频字幕在文本到视频生成任务中起着至关重要的作用，因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型（VLMs）在字幕生成方面…...

编程新知 2026/2/6 9:24:15

相机Camera日志分析之三十一：高通Camx HAL十种流程基础分析关键字汇总（后续持续更新中）

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：有对最普通的场景进行各个日志注释讲解，但相机场景太多，日志差异也巨大。后面将展示各种场景下的日志。通过notepad++打开场景下的日志，通过下列分类关键字搜索，即可清晰的分析不同场景的相机运行流程差异…...

编程新知 2025/11/20 7:13:43

前端开发面试题总结-JavaScript篇(一)

文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包（Closure）？闭包有什么应用场景和潜在问题？2.解释 JavaScript 的作用域链（Scope Chain） 二、原型与继承3.原型链是什么？如何实现继承&a…...

编程新知 2026/2/1 3:12:03

大学生职业发展与就业创业指导教学评价

这里是引用作为软工2203/2204班的学生，我们非常感谢您在《大学生职业发展与就业创业指导》课程中的悉心教导。这门课程对我们即将面临实习和就业的工科学生来说至关重要，而您认真负责的教学态度，让课程的每一部分都充满了实用价值。尤其让我…...

编程新知 2025/11/16 1:39:27

A2A JS SDK 完整教程：快速入门指南

目录什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

编程新知 2025/12/12 8:42:24

【无标题】路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论一、传统路径模型的根本缺陷在经典正方形路径问题中（图1）： mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...

编程新知 2025/10/21 1:07:59

代码规范和架构【立芯理论一】（2025.06.08）

1、代码规范的目标代码简洁精炼、美观，可持续性好高效率高复用，可移植性好高内聚，低耦合没有冗余规范性，代码有规可循，可以看出自己当时的思考过程特殊排版，特殊语法，特殊指令，必须…...

编程新知 2026/1/28 11:47:09

深度学习框架的对比与实践

引言

1. 深度学习框架简介

PyTorch

TensorFlow

Keras

2. PyTorch 入门实践

2.1 安装与配置

2.2 MNIST 分类模型实现

3. TensorFlow 基础应用

3.1 安装

3.2 使用 TensorFlow 实现 CNN

4. Keras 快速上手

4.1 构建一个简单的全连接模型

5. 高级功能与优化

5.1 学习率调整

5.2 迁移学习

6. 总结

相关文章：