当前位置：首页 > news >正文

Python从0到100（七十八）：神经网络--从0开始搭建全连接网络和CNN网络

news 2026/3/31 13:50:43

在这里插入图片描述

前言： 零基础学Python：Python从0到100最新最全教程。 想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！
欢迎大家订阅专栏：零基础学Python：Python从0到100最新最全教程！

今天来学习一下如何从0开始搭建全连接网络和CNN网络，并通过实验简单对比一下两种神经网络的不同之处，本文目录较长，可以根据需要自动选取要看的内容~

本文目录：

一、搭建4层全连接神经网络
- 1.调用库函数
- 2.选择模型，构建网络
- 3.编译（使用交叉熵作为loss函数）
- 4.输出
- 5.画出图像
- 6.结论
二、搭建CNN网络
- 1.调用库函数
- 2.调用数据集
- 3.图片归一化
- 4.选择模型，构建网络
- 5.编译
- 6.批量输入的样本个数
- 7.训练
- 8.输出
- 9.画出图像
- 10.结论
三、两种网络对比
- 文末送书
- - **`本期推荐1：`**
  - **`本期推荐2：`**

说明：在此试验下，我们使用的是使用tf2.x版本，在jupyter环境下完成
在本文中，我们将主要完成以下四个任务：

加载keras内置的mnist数据库
自己搭建简单神经网络，并自选损失函数和优化方法
搭建4层全连接神经网络，除输入层以外，各层神经元个数分别为1000，300，64，10，激活函数自选
搭建CNN网络，要求有1个卷积层（32卷积核），1个池化层（2x2），1个卷积层（16卷积核），1个全局池化层（globalMaxPool），一个全连接输出层，激活函数自选

一、搭建4层全连接神经网络

加载keras内置的mnist数据库，搭建4层全连接神经网络，除输入层以外，各层神经元个数分别为1000，300，64，10，激活函数自选

1.调用库函数

import tensorflow as tf
import matplotlib.pyplot as plt
mnist = tf.keras.datasets.mnist
from tensorflow.keras.layers import Flatten,Dense,Dropout

2.选择模型，构建网络

搭建4层全连接神经网络，除输入层以外，各层神经元个数分别为1000，300，64，10

(x_train, y_train),(x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0# 选择模型，构建网络
model = tf.keras.models.Sequential()
model.add(Flatten(input_shape=(28, 28)))
# 各层神经元个数分别为1000，300，64，10
model.add(Dense(1000, activation='relu'))
model.add(Dense(300, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.2))  # 采用20%的dropout
model.add(Dense(10, activation='softmax'))  # 输出结果是10个类别，所以维度是10，最后一层用softmax作为激活函数

3.编译（使用交叉熵作为loss函数）

指明优化器、损失函数、准确率计算函数

# 编译（使用交叉熵作为loss函数）,指明优化器、损失函数、准确率计算函数
model.compile(optimizer=tf.keras.optimizers.Adam(),loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=[tf.keras.metrics.sparse_categorical_accuracy])# 训练（训练10个epoch）
history = model.fit(x_train, y_train, epochs=10)

这里是训练的结果：
在这里插入图片描述

4.输出

输出测试集上的预测准确率

# 输出
scores = model.evaluate(x_test,y_test)
print(scores)
print("The accuracy of the model is %f" % scores[1])  #输出测试集上的预测准确率

这里是输出的结果：
在这里插入图片描述

5.画出图像

使用plt模块进行数据可视化处理

# 画出图像
plt.plot(history.history['loss'], color='red', label='Loss')
plt.legend(loc='best')
plt.title('Training Loss')
plt.show()

在这里插入图片描述

6.结论

第一种神经网络准确率：0.976200

二、搭建CNN网络

要求有1个卷积层，1个池化层，1个全局池化层（globalMaxPool），一个全连接输出层，激活函数自选

1.调用库函数

import matplotlib.pyplot as plt
import tensorflow as tf
import tensorflow_datasets as tfds
import math
from tensorflow.keras.layers import Conv2D,MaxPooling2D,GlobalMaxPooling2D,Flatten,Dense

2.调用数据集

加载keras内置的mnist数据库

# 调用数据集
dataset, metaset = tfds.load('mnist', as_supervised=True, with_info=True)
train_dataset, test_dataset = dataset['train'], dataset['test']

3.图片归一化

# 图片归一化
def normalize(images, labels):images = tf.cast(images, tf.float32)images /= 255return images, labels
train_dataset = train_dataset.map(normalize)
test_dataset = test_dataset.map(normalize)

4.选择模型，构建网络

构建出1个卷积层，1个池化层，1个全局池化层（globalMaxPool），一个全连接输出层

# 选择模型，构建网络
model = tf.keras.Sequential()# 卷积层
model.add(Conv2D(32, (5, 5), padding='same', activation=tf.nn.relu, input_shape=(28, 28, 1))),  # 池化层 
model.add(MaxPooling2D((2, 2), strides=2)), # 全局池化层（globalMaxPool）
model.add(Conv2D(64, (5, 5), padding='same', activation=tf.nn.relu)),  # 卷积层
model.add(GlobalMaxPooling2D()),# 全连接输出层
model.add(Flatten()),#展平
model.add(Dense(512, activation=tf.nn.relu)),
model.add(Dense(10, activation=tf.nn.softmax))# 输出结果是10个类别，所以维度是10，最后一层用softmax作为激活函数

5.编译

指明优化器、损失函数、准确率计算函数

# 编译（使用交叉熵作为loss函数）,指明优化器、损失函数、准确率计算函数
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])
# 展示训练的过程
display(model.summary())

这里是输出的结果：
在这里插入图片描述

6.批量输入的样本个数

# 批量输入的样本个数
BATCH_SIZE = 64
num_train = metaset.splits['train'].num_examples
num_test = metaset.splits['test'].num_examples
train_dataset = train_dataset.repeat().shuffle(num_train).batch(BATCH_SIZE)
test_dataset = test_dataset.repeat().shuffle(num_test).batch(BATCH_SIZE)

7.训练

训练10个epoch

# 训练（训练10个epoch）
history = model.fit(train_dataset, epochs=10, steps_per_epoch=math.ceil(num_train / BATCH_SIZE))

这里是输出的结果：
在这里插入图片描述

8.输出

# 输出
test_loss, test_accuracy = model.evaluate(test_dataset, steps=math.ceil(num_test / BATCH_SIZE))
print(test_loss, test_accuracy)

这里是输出的结果：
在这里插入图片描述

9.画出图像

使用plt模块进行数据可视化处理

# 画出图像
plt.plot(history.history['loss'], color='red', label='Loss')
plt.legend(loc='best')
plt.title('Training Loss')
plt.show()

这里是输出的结果：
在这里插入图片描述

10.结论

第二种神经网络准确率：0.993232

三、两种网络对比

第一种神经网络准确率：0.976200 第二种神经网络准确率：0.993232
总结： 通过对比我们可以发现CNN卷积神经网络相对于传统神经网络NN准确率会高一些，由卷积的操作可知，输出图像中的任何一个单元，只跟输入图像的一部分有关系。而传统神经网络中，由于都是全连接，所以输出的任何一个单元，都要受输入的所有的单元的影响。这样无形中会对图像的识别效果大打折扣，因此CNN在此种方面会更具优势

文末送书

本期推荐1：

《AI智能运营从入门到精通》
巧用AI大模型，带你深度解析用户洞察+精准策略+智能创作+数据模型，构建你的竞争壁垒。
关键点

京东：https://item.jd.com/14809514.html

★站在运营视角解读AI技术：AI 的底层逻辑与应用方法。
★AI构建精细化运营策略：利用AI画像分层用户，积分激励提升价值，基于生命周期理论，个性化推荐促精细化运营。
★AI智能内容创作助手：助您构建创意选题库，策划高质量脚本，降低内容重复率，训练文案打造爆款标题，生成调研问卷洞悉需求，分析文本偏好，以RSM模型规划活动，并自动撰写运营周报。
★AI驱动数据分析决策：AI作为数据分析的强大助手，不仅加速了决策效率，还提供了从基础到进阶的全面运营数据分析能力。
内容简介
本书从多个方面介绍了如何整合AI技术进行运营工作，包括AI与用户运营的融合、精细化运营策略的构建、智能内容创作助手的运用、AI驱动分析决策。
读者可以通过本书学习如何利用AI处理运营工作，从而更好地满足目标受众需求，提高内容质量，做出更准确的决策，并提升工作效率。本书内容丰富实用，旨在帮助读者适应

本期推荐2：

《AI智能运营从入门到精通》
Blender 2D动画制作指南:软件基础+蜡笔应用+动画原理+3D辅助+角色设计+场景设计+渲染导出，全方位展示Blender 2D动画设计制作全流程。

京东：https://item.jd.com/14833184.html

关键点
1.专业保证：Blender 中国社区官方推荐；笔者作为软件中国区大版主，对动画行业的发展有精准把握。
2.跨界融合：集3D动画空间感与2D动画绘画感于一体，打破次元壁，创造全新视觉体验。
3.全流程覆盖：从软件基础到角色设计、场景设计、渲染导出，全方位展示Blender 2D动画设计制作流程。
4.实战教学：图文步骤+视频教学+源文件包+效果展示，助你快速上手，轻松掌握动画制作精髓。
5.进阶提升：夯实基础+进阶修炼+精美案例+商业标准，助你实现从新手到高手的华丽蜕变。
内容简介
Blender 是一款功能强大、免费且开源的图形图像软件，它集成了建模、动画、材质设计、渲染、音频处理及视频剪辑等功能，为动画短片的制作提供了一站式解决方案。本书专注于指导读者利
用 Blender 进行二维动画制作，深入剖析其在蜡笔模式下的各类工具、修改器及视觉特效工具，全面探索该模式下的功能特性。通过综合运用这些工具与多样化的表现形式，读者将学会如何绘制并创作出富有创意的二维动画短片，同时还将探索 Blender 在 2D 动画领域的更多绘制技巧与表现方式。
本书非常适合对 Blender 感兴趣，想要学习新型的动画创作方法的零基础 2D 动画爱好者。此外，它也非常适合动画、动漫、新媒体艺术、数字创意设计等相关专业的师生及从业者作为教学参考书或专业指南。

本文目录：

一、搭建4层全连接神经网络

1.调用库函数

2.选择模型，构建网络

3.编译（使用交叉熵作为loss函数）

4.输出

5.画出图像

6.结论

二、搭建CNN网络

1.调用库函数

2.调用数据集

3.图片归一化

4.选择模型，构建网络

5.编译

6.批量输入的样本个数

7.训练

8.输出

9.画出图像

10.结论

三、两种网络对比

文末送书

本期推荐1：

本期推荐2：

相关文章：

`本期推荐1：`

`本期推荐2：`