当前位置：首页 > news >正文

AI智能体研发之路-模型篇（五）：pytorch vs tensorflow框架DNN网络结构源码级对比

news 2025/12/16 2:59:52

博客导读：

《AI—工程篇》

AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效

AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署

AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama一键部署

AI智能体研发之路-工程篇（四）：大模型推理服务框架Xinference一键部署

AI智能体研发之路-工程篇（五）：大模型推理服务框架LocalAI一键部署

《AI—模型篇》

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

AI智能体研发之路-模型篇（二）：DeepSeek-V2-Chat 训练与推理实战

AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

AI智能体研发之路-模型篇（四）：一文入门pytorch开发

AI智能体研发之路-模型篇（五）：pytorch vs tensorflow框架DNN网络结构源码级对比

一、引言

二、pytorch模型结构定义

三、tensorflow模型结构定义

四、总结

一、引言

本文是上一篇AI智能体研发之路-模型篇（四）：一文入门pytorch开发的番外篇，对上文中pytorch的网络结构和tensorflow的模型结构部分进一步详细对比与说明（水一篇为了得到当天的流量卷哈哈，如果想更详细的了解pytorch，辛苦移步上一篇哈。

二、pytorch模型结构定义

def __init__(self, input_size, hidden_size, output_size):super(ThreeLayerDNN, self).__init__()self.fc1 = nn.Linear(input_size, hidden_size)  # 第一层全连接层self.fc2 = nn.Linear(hidden_size, hidden_size)  # 第二层全连接层self.fc3 = nn.Linear(hidden_size, output_size)  # 输出层self.sigmoid = nn.Sigmoid()

首先定义了一个名为`ThreeLayerDNN`的类，它是基于PyTorch框架的，用于构建一个具有三个全连接层（也称为密集层）的深度神经网络，特别适用于二分类问题。下面是对代码的详细解释：

`__init__`: 这是Python中的构造函数，当创建`ThreeLayerDNN`类的新实例时会被调用。
`super(ThreeLayerDNN, self).__init__()`: 这行代码调用父类的初始化方法。因为`ThreeLayerDNN`继承自PyTorch的`nn.Module`类，这一步确保了`ThreeLayerDNN`具有`nn.Module`的所有基本属性和方法。
`self.fc1 = nn.Linear(input_size, hidden_size)`: 这里定义了神经网络的第一层全连接层（fully connected layer）。`input_size`是输入数据的特征数量，`hidden_size`是这一层的神经元数量。全连接层意味着输入数据的每个特征都将与这一层的每个神经元相连接。
`self.fc2 = nn.Linear(hidden_size, hidden_size)`: 定义了第二层全连接层，结构与第一层相同，保持了相同的隐藏层大小，这在某些架构中用于加深网络而不立即增加模型复杂度。
`self.fc3 = nn.Linear(hidden_size, output_size)`: 这是网络的输出层，其输入大小与隐藏层相同，输出大小为`output_size`，对于二分类问题，通常为1。
`self.sigmoid = nn.Sigmoid()`: 这行代码定义了一个Sigmoid激活函数，它将在网络的输出层之后应用。Sigmoid函数将输出映射到(0, 1)之间，非常适合二分类问题，其中输出可以解释为属于正类的概率。

综上所述，这段代码构建了一个基础的神经网络结构，适合进行二分类任务，通过全连接层提取特征，并使用Sigmoid函数将网络输出转换为概率估计。

三、tensorflow模型结构定义

model = Sequential([Dense(512, input_shape=(X_train.shape[1],)),  # 第一层Activation('relu'),Dense(512),  # 第二层Activation('relu'),Dense(1),  # 输出层Activation('sigmoid')  # 二分类使用sigmoid
])

使用Keras库（现在是TensorFlow的一个部分）定义了一个简单的深度学习模型，具体来说是一个顺序（Sequential）模型，适用于进行二分类任务。下面是对这段代码的详细解释：

Sequential模型: 这是一种线性堆叠层的模型，适合于简单的前向传播神经网络。

Dense层: 也称为全连接层，每个神经元都与前一层的所有神经元相连。

Dense(512, input_shape=(X_train.shape[1],)): 第一层，有512个神经元，input_shape=(X_train.shape[1],)指定了输入数据的形状，这里假设X_train是一个二维数组，其中每一行是一个样本，X_train.shape[1]表示每个样本的特征数量。
Dense(512): 第二层，同样有512个神经元，由于是在Sequential模型中，它自动接收前一层的输出作为输入。
Dense(1): 输出层，只有一个神经元，适用于二分类问题。

Activation层: 激活函数层，为神经网络引入非线性。

Activation('relu'): 使用ReLU（Rectified Linear Unit）作为激活函数，它在输入大于0时输出输入值，小于0时输出0，有助于解决梯度消失问题。
最后一层使用Activation('sigmoid'): 二分类任务中，输出层常用sigmoid激活函数，将输出映射到(0, 1)之间，便于解释为概率。

四、总结

两种框架在定义模型结构时思路基本相同，pytorch基于动态图，更加灵活。tensorflow基于静态图，更加稳定。

如果还有时间，可以看看我的其他文章：

《AI—工程篇》

AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效

AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署

AI智能体研发之路-工程篇（三）：大模型推理服务框架Ollama一键部署

AI智能体研发之路-工程篇（四）：大模型推理服务框架Xinference一键部署

AI智能体研发之路-工程篇（五）：大模型推理服务框架LocalAI一键部署

《AI—模型篇》

AI智能体研发之路-模型篇（一）：大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用

AI智能体研发之路-模型篇（二）：DeepSeek-V2-Chat 训练与推理实战

AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

AI智能体研发之路-模型篇（四）：一文入门pytorch开发

AI智能体研发之路-模型篇（五）：pytorch vs tensorflow框架DNN网络结构源码级对比

博客导读： 《AI—工程篇》 AI智能体研发之路-工程篇（一）：Docker助力AI智能体开发提效 AI智能体研发之路-工程篇（二）：Dify智能体开发平台一键部署 AI智能体研发之路-工程篇（三&am…...

编程日记 2024/5/31 23:50:01

电商物流查询解决方案助力提升消费者体验

截至2023年12月，中国网络购物用户规模达9.15亿人，占网民整体的83.8%。这一庞大的数字不仅展现了电子商务的蓬勃发展，也标志着数字零售企业营销战略的转变——从以产品和流量为核心，到用户为王的新阶段。因此，提升消费者…...

编程日记 2024/5/31 23:49:00

【深度密码】神经网络算法在机器学习中的前沿探索

目录 🚝前言 🚍什么是机器学习 1. 基本概念 2. 类型 3. 关键算法 4. 应用领域 5. 工作流程 🚋什么是神经网络基本结构 🚂神经网络的工作原理前向传播（Forward Propagation）： 损失函…...

编程日记 2024/5/31 23:47:59

搭载算能 BM1684 芯片，面向AI推理计算加速卡

搭载算能 BM1684 芯片，是面向AI推理的算力卡。可集成于服务器、工控机中，高效适配市场上所有AI算法，实现视频结构化、人脸识别、行为分析、状态监测等应用，为智慧城市、智慧交通、智慧能源、智慧金融、智慧电信、智慧工业等领域进…...

编程日记 2024/5/31 23:46:58

Python开发我的世界 Painting-the-World: Minecraft 像素图片生成器

简介 Painting-the-World 是一款创新的工具，专为《我的世界》(Minecraft) 玩家及创作者设计，旨在将数字图片转变为游戏内的像素艺术。通过利用 RCON (Remote Console) 协议，本项目可以直接与《我的世界》服务器对话，根据输入的图…...

编程日记 2024/5/31 23:45:57

【经验分享】盘点“食用“的写文素材

一、构建框架简介 1. 身份擅长领域 2. 博客内容 3. 目前示例： 阿里云专家博主，华为云-云享专家，专注前、后端开发博客内容：前后端实战教学、源码剖析、常见面试知识解析、算法题解与心得、日常考研总结等目前正在备战考研&…...

编程日记 2024/5/31 23:44:55

实习碰到的问题w1

1.vueelementUI在输入框中按回车键会刷新页面当一个 form 元素中只有一个输入框时，在该输入框中按下回车应提交该表单。如果希望阻止这一默认行为，可以在 <el-form> 标签上添加 submit.native.prevent 。参考：element-ui 表单 form …...

编程日记 2024/5/31 23:43:54

c#实现BPM系统网络传输接口，http协议，post

BPM通过http协议实现网络传输，语言使用.net(c#)，在这里只提供一个接口，具体代码如下,请参照： public string MakeRequest(string parameters) { ServicePointManager.ServerCertificateValidationCallback new Syst…...

编程日记 2024/5/31 23:41:51

如何修改开源项目中发现的bug？

如何修改开源项目中发现的bug？ 目录如何修改开源项目中发现的bug？第一步：找到开源项目并建立分支第二步：克隆分支到本地仓库第三步：在本地对项目进行修改第四步：依次使用命令行进行操作注意：Gi…...

编程日记 2024/5/31 23:40:50

结构设计模式 - 代理设计模式 - JAVA

代理设计模式一. 介绍二. 代码示例2.1 定义 CommandExecutor 类2.2 定义 CommandExecutorProxy代理类2.3 模拟客户端2.4 测试结果三. 结论前言这是我在这个网站整理的笔记,有错误的地方请指出，关注我，接下来还会持续更新。作者：神的孩子…...

编程日记 2024/5/31 23:39:49

企业了解这些cad图纸加密方法，再也不怕图纸被盗了！

在竞争激烈的商业环境中，企业的核心技术、设计图纸和创意是维持其市场地位和竞争优势的关键。CAD图纸作为产品设计的重要载体，其安全性自然成为企业关注的焦点。为了确保CAD图纸不被非法获取或盗用，企业需要采取一系列有效的加密方法。本文将…...

编程日记 2024/5/31 23:38:48

# 详解 JS 中的事件循环、宏/微任务、Primise对象、定时器函数，以及其在工作中的应用和注意事项

为什么会突然想到写这么一个大杂烩的博文呢，必须要从笔者几年前的一次面试说起当时的我年轻气盛，在简历上放了自己的博客地址，而面试官应该是翻了我的博客，好几道面试题都是围绕着我的博文来提问其中一个问题，直接…...

编程日记 2024/5/31 23:35:46

神经网络与深度学习——第14章深度强化学习

本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第14章深度强化学习深度强化学习强化学习（Reinforcement Learning，RL），也叫增强学习，是指一类从与环境交互中不断学习的问题以及解决这类问题…...

编程日记 2024/5/31 23:34:44

安装C和C编译器 yum -y install gcc*查看CenterOS系统信息 cat /etc/system-releaseCentOS Linux release 8.2.2004 (Core)查看gcc版本 gcc --versiongcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-4) Copyright (C) 2018 Free Software Foundation, Inc. This is free software…...

编程日记 2024/5/31 23:32:42

java——网络原理初识

T04BF 👋专栏: 算法|JAVA|MySQL|C语言 🫵 小比特大梦想目录 1.网络通信概念初识1.1 IP地址1.2端口号1.3协议1.3.1协议分层协议分层带来的好处主要有两个方面 1.3.2 TCP/IP五层 (或四层模型)1.3.3 协议的层和层之间是怎么配合工作的 1.网络通信概念初识…...

编程日记 2024/5/31 23:28:38

js怎么判断是否为手机号?js格式校验方法

数据格式正确与否是表单填写不可避免的一个流程，现整理一些较为常用的信息格式校验方法。判断是否为手机号码 // 判断是否为手机号码 function isPhoneNumber(phone) {return /^[1]\d{10}$/.test(phone) }判断是否为移动手机号 function isChinaMobilePhone(phon…...

编程日记 2024/5/31 23:27:37

深入理解Java中的方法重载：让代码更灵活的秘籍

关注微信公众号 “程序员小胖” 每日技术干货，第一时间送达！ 引言在Java编程的世界里，重载(Overloading)是一项基础而强大的特性，它让我们的代码更加灵活、可读性强。对于追求高效、优雅编码的开发者而言，掌握方法重…...

编程日记 2024/5/31 23:25:35

鸿蒙ArkTS声明式开发：跨平台支持列表【显隐控制】通用属性

显隐控制控制组件是否可见。说明： 开发前请熟悉鸿蒙开发指导文档： gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。从API Version 7开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本…...

编程日记 2024/5/31 23:23:32

每日一题——Java编程练习题

题目： 键盘录入两个数字number1和number2表示一个范围，求这个范围之内的数字和。我写的代码： public class Test {public static void main(String[] args) {Scanner sc new Scanner(System.in);System.out.print("输入第一个数:&q…...

编程日记 2024/5/31 23:22:31

java编辑器中如何调试程序?

目录如何调试java程序? 待续、更新中如何调试java程序? 1 看错误信息 2 相应位置输入输出信息: System.out.println("测试信息1 "); 以此查看哪条语句未进行输入待续、更新中 1 顿号、: 先使用ctrl. ，再使用一遍切回 2 下标: 21 2~1~ 3 上标: 2…...

编程日记 2024/5/31 23:20:29

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

编程新知 2025/12/13 3:53:51

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2025/12/15 19:26:43

盘古信息PCB行业解决方案：以全域场景重构，激活智造新未来

一、破局：PCB行业的时代之问在数字经济蓬勃发展的浪潮中，PCB（印制电路板）作为 “电子产品之母”，其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透，PCB行业面临着前所未有的挑战与机遇。产品迭代…...

编程新知 2025/12/10 19:13:55

Spring Boot面试题精选汇总

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

编程新知 2025/9/24 23:08:17

IoT/HCIP实验-3/LiteOS操作系统内核实验(任务、内存、信号量、CMSIS..)

文章目录概述HelloWorld 工程C/C配置编译器主配置Makefile脚本烧录器主配置运行结果程序调用栈任务管理实验实验结果osal 系统适配层osal_task_create 其他实验实验源码内存管理实验互斥锁实验信号量实验 CMISIS接口实验还是得JlINKCMSIS 简介LiteOS->CMSIS任务间消息交互…...

编程新知 2025/12/14 23:18:04

docker 部署发现spring.profiles.active 问题

报错： org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

编程新知 2025/9/20 12:14:18

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

前言： 最近在做行为检测相关的模型，用的是时空图卷积网络（STGCN），但原有kinetic-400数据集数据质量较低，需要进行细粒度的标注，同时粗略搜了下已有开源工具基本都集中于图像分割这块&#xff0c…...

编程新知 2025/12/14 18:08:24

JavaScript 数据类型详解

JavaScript 数据类型详解 JavaScript 数据类型分为原始类型（Primitive） 和对象类型（Object） 两大类，共 8 种（ES11）： 一、原始类型（7种） 1. undefined 定…...

编程新知 2025/10/30 21:24:32

uniapp 集成腾讯云 IM 富媒体消息（地理位置/文件）

UniApp 集成腾讯云 IM 富媒体消息全攻略（地理位置/文件） 一、功能实现原理腾讯云 IM 通过消息扩展机制支持富媒体类型，核心实现方式： 标准消息类型：直接使用 SDK 内置类型（文件、图片等）自…...

编程新知 2025/10/25 5:53:05

k8s从入门到放弃之Pod的容器探针检测

k8s从入门到放弃之Pod的容器探针检测在Kubernetes（简称K8s）中，容器探测是指kubelet对容器执行定期诊断的过程，以确保容器中的应用程序处于预期的状态。这些探测是保障应用健康和高可用性的重要机制。Kubernetes提供了两种种类型…...

编程新知 2025/11/5 7:49:23

AI智能体研发之路-模型篇（五）：pytorch vs tensorflow框架DNN网络结构源码级对比

一、引言

二、pytorch模型结构定义

三、tensorflow模型结构定义

四、总结

相关文章：