当前位置：首页 > article >正文

第T6周：好莱坞明星识别

article 2026/5/2 16:09:48

本文为365天深度学习训练营中的学习记录博客原作者K同学啊一、前期工作1.设置GPUfrom tensorflow import keras from tensorflow.keras import layers,models import os, PIL, pathlib import matplotlib.pyplot as plt import tensorflow as tf import numpy as np gpus tf.config.list_physical_devices(GPU) if gpus: gpu0 gpus[0] #如果有多个GPU仅使用第0个GPU tf.config.experimental.set_memory_growth(gpu0, True) #设置GPU显存用量按需使用 tf.config.set_visible_devices([gpu0],GPU) gpusCPU所以跳过这一步2.导入数据data_dir ./48-data/ data_dir pathlib.Path(data_dir)3.查看数据image_count len(list(data_dir.glob(*/*.jpg))) print(图片总数为,image_count) roses list(data_dir.glob(Jennifer Lawrence/*.jpg)) PIL.Image.open(str(roses[0]))二、数据预处理1.加载数据batch_size 32 img_height 224 img_width 224 关于image_dataset_from_directory()的详细介绍可以参考文章https://mtyjkh.blog.csdn.net/article/details/117018789 train_ds tf.keras.preprocessing.image_dataset_from_directory( data_dir, validation_split0.1, subsettraining, label_mode categorical, seed123, image_size(img_height, img_width), batch_sizebatch_size) 关于image_dataset_from_directory()的详细介绍可以参考文章https://mtyjkh.blog.csdn.net/article/details/117018789 val_ds tf.keras.preprocessing.image_dataset_from_directory( data_dir, validation_split0.1, subsetvalidation, label_mode categorical, seed123, image_size(img_height, img_width), batch_sizebatch_size)class_names train_ds.class_names print(class_names)2.可视化数据plt.figure(figsize(20, 10)) for images, labels in train_ds.take(1): for i in range(20): ax plt.subplot(5, 10, i 1) plt.imshow(images[i].numpy().astype(uint8)) plt.title(class_names[np.argmax(labels[i])]) plt.axis(off)3.再次检查数据for image_batch, labels_batch in train_ds: print(image_batch.shape) print(labels_batch.shape) break4.配置数据集AUTOTUNE tf.data.AUTOTUNE train_ds train_ds.cache().shuffle(1000).prefetch(buffer_sizeAUTOTUNE) val_ds val_ds.cache().prefetch(buffer_sizeAUTOTUNE)三、构建CNN网络关于卷积核的计算不懂的可以参考文章https://blog.csdn.net/qq_38251616/article/details/114278995 layers.Dropout(0.4) 作用是防止过拟合提高模型的泛化能力。关于Dropout层的更多介绍可以参考文章https://mtyjkh.blog.csdn.net/article/details/115826689 model models.Sequential([ layers.experimental.preprocessing.Rescaling(1./255, input_shape(img_height, img_width, 3)), layers.Conv2D(16, (3, 3), activationrelu, input_shape(img_height, img_width, 3)), # 卷积层1卷积核3*3 layers.AveragePooling2D((2, 2)), # 池化层12*2采样 layers.Conv2D(32, (3, 3), activationrelu), # 卷积层2卷积核3*3 layers.AveragePooling2D((2, 2)), # 池化层22*2采样 layers.Dropout(0.5), layers.Conv2D(64, (3, 3), activationrelu), # 卷积层3卷积核3*3 layers.AveragePooling2D((2, 2)), layers.Dropout(0.5), layers.Conv2D(128, (3, 3), activationrelu), # 卷积层3卷积核3*3 layers.Dropout(0.5), layers.Flatten(), # Flatten层连接卷积层与全连接层 layers.Dense(128, activationrelu), # 全连接层特征进一步提取 layers.Dense(len(class_names)) # 输出层输出预期结果 ]) model.summary() # 打印网络结构四、训练模型1.设置动态学习率# 设置初始学习率 initial_learning_rate 1e-4 lr_schedule tf.keras.optimizers.schedules.ExponentialDecay( initial_learning_rate, decay_steps60, # 敲黑板这里是指 steps不是指epochs decay_rate0.96, # lr经过一次衰减就会变成 decay_rate*lr staircaseTrue) # 将指数衰减学习率送入优化器 optimizer tf.keras.optimizers.Adam(learning_ratelr_schedule) model.compile(optimizeroptimizer, losstf.keras.losses.CategoricalCrossentropy(from_logitsTrue), metrics[accuracy])调用方法一model.compile(optimizeradam, losscategorical_crossentropy, metrics[accuracy])调用方法二model.compile(optimizeradam, losstf.keras.losses.CategoricalCrossentropy(), metrics[accuracy])sparse_categorical_crossentropy稀疏性多分类的对数损失函数与softmax相对应的损失函数如果是整数编码则使用sparse_categorical_crossentropy调用方法一model.compile(optimizeradam, losssparse_categorical_crossentropy, metrics[accuracy])调用方法二model.compile(optimizeradam, losstf.keras.losses.SparseCategoricalCrossentropy(), metrics[accuracy])函数原型tf.keras.losses.SparseCategoricalCrossentropy( from_logitsFalse, reductionlosses_utils.ReductionV2.AUTO, namesparse_categorical_crossentropy )2.早停与保存最佳模型参数from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping epochs 100 # 保存最佳模型参数 checkpointer ModelCheckpoint(best_model.h5, monitorval_accuracy, verbose1, save_best_onlyTrue, save_weights_onlyTrue) # 设置早停 earlystopper EarlyStopping(monitorval_accuracy, min_delta0.001, patience20, verbose1)3.模型训练history model.fit(train_ds, validation_dataval_ds, epochsepochs, callbacks[checkpointer, earlystopper])五、模型评估1.Loss与Accuracy图from datetime import datetime current_time datetime.now() # 获取当前时间 acc history.history[accuracy] val_acc history.history[val_accuracy] loss history.history[loss] val_loss history.history[val_loss] epochs_range range(len(loss)) plt.figure(figsize(12, 4)) plt.subplot(1, 2, 1) plt.plot(epochs_range, acc, labelTraining Accuracy) plt.plot(epochs_range, val_acc, labelValidation Accuracy) plt.legend(loclower right) plt.title(Training and Validation Accuracy) plt.xlabel(current_time) # 打卡请带上时间戳否则代码截图无效 plt.subplot(1, 2, 2) plt.plot(epochs_range, loss, labelTraining Loss) plt.plot(epochs_range, val_loss, labelValidation Loss) plt.legend(locupper right) plt.title(Training and Validation Loss) plt.show()2.指定图片进行预测from PIL import Image import numpy as np img Image.open(./48-data/Jennifer Lawrence/003_963a3627.jpg) #这里选择你需要预测的图片 image tf.image.resize(img, [img_height, img_width]) img_array tf.expand_dims(image, 0) # 加载效果最好的模型权重 model.load_weights(best_model.h5) predictions model.predict(img_array) # 这里选用你已经训练好的模型 print(预测结果为,class_names[np.argmax(predictions)])六、个人总结1.每次必备代码import os import pathlib import PIL.Image import numpy as np import matplotlib.pyplot as plt TensorFlow 及 Keras 核心组件 import tensorflow as tf from tensorflow.keras import models, layers2.理论基础测试集 VS 验证集的本质区别验证集Validation Set不直接参与梯度下降和参数更新狭义上不参与训练但用于人工调参。通过观察模型在验证集上的表现来决定是否早停Early Stopping或调整超参数如学习率、Batch Size。它防止了模型对训练集的盲目过拟合。标签编码与加载模式 (label_mode)使用 image_dataset_from_directory 加载数据时标签按文件夹名称字母顺序自动生成。int 模式标签编码为整数如 0, 1, 2...。categorical 模式标签编码为 One-hot 分类向量如 [1,0,0], [0,1,0]...。数据集性能优化shuffle()打乱数据打破数据的顺序相关性提升模型泛化能力。prefetch()预取数据让 CPU 准备数据的过程和 GPU 训练模型的过程并行大幅加速运行。3.损失函数Loss Functions的对应关系选择合适的损失函数是深度学习的核心。分类问题中损失函数必须与标签的编码方式严格对应binary_crossentropy适用场景二分类问题标签编码格式0 或 1通常网络最后一层激活函数配合 Sigmoid 使用。sparse_categorical_crossentropy适用场景多分类问题标签编码格式整数如 1, 2, 3节省内存适合类别极多的情况。categorical_crossentropy适用场景多分类问题标签编码格式One-hot 向量如 [0,1,0]本次任务好莱坞明星识别的核心要求。核心参数 from_logits设为 True 时表示模型的输出没有经过 Softmax 处理输出的是原始得分 logits函数内部会自动将其转换为概率分布再计算 Loss。官方推荐使用 from_logitsTrue因为数值计算上更稳定。4.训练控制学习率与回调函数动态学习率 (ExponentialDecay)前期使用较大学习率加速收敛后期动态减小学习率帮助模型稳定在全局最优解。核心参数initial_learning_rate初始值、decay_steps衰减周期、decay_rate衰减比例、staircaseTrue 为阶梯式骤降False 为平滑连续衰减。早停机制 (EarlyStopping)防止模型过拟合的利器。核心参数monitor监控指标通常为 val_loss 或 val_accuracy、patience容忍多少个 Epoch 指标不改善才停止、restore_best_weights设为 True 可在停止时自动恢复到历史最佳权重而不是最后一步的“烂权重”。模型保存 (ModelCheckpoint)在训练过程中实时保存表现最好的模型参数.h5 文件。5.单张图片预测标准 Pipeline在模型训练完成后对外部单张图片进行预测必须经过与训练集完全相同的预处理加载并调整尺寸使用 PIL 和 tf.image.resize 将图片调整为模型要求的输入尺寸扩展维度模型输入要求带有 Batch 维度需使用 tf.expand_dims(image, 0) 将 (224, 224, 3) 转换为 (1, 224, 224, 3)加载最佳权重model.load_weights(best_model.h5)预测与解码调用 model.predict() 得到概率数组使用 np.argmax() 提取概率最大的索引最后映射回 class_names 得到最终标签。

第T6周：好莱坞明星识别

相关文章：

第T6周：好莱坞明星识别

保姆级教程：在GEE里用PCA给Sentinel-2影像‘瘦身’，5分钟搞定降维与特征提取

2025届毕业生推荐的五大降重复率网站推荐榜单

LightGCN论文与代码对照解读：那些公式在PyTorch里到底是怎么写的？

用ESP32和DengFOC驱动板，5分钟搞定无刷电机FOC控制（附完整代码）

为初创公司 MVP 产品快速集成 AI 功能并控制成本

DoL-Lyra终极整合包：5分钟打造你的专属游戏美化方案

如何构建高性能Markdown渲染架构：浏览器扩展的模块化设计实践

别再只测角度了！用AS5600磁编码器DIY你的桌面小玩意：转速表、舵机闭环控制与无线姿态监测

五分钟完成Nodejs环境下的Taotoken大模型api接入

跨平台游戏模组获取指南：WorkshopDL如何打破Steam创意工坊壁垒

如何快速配置Cyber Engine Tweaks：面向《赛博朋克2077》玩家的完整优化指南

海思Hi35xx芯片开发避坑指南：SVP、MPP、NNIE、ACL四大模块到底怎么用？

LoFT框架：参数高效微调解决长尾数据学习难题

终极指南：5分钟快速上手ChineseSubFinder自动化中文字幕下载

Escrcpy实战指南：高效管理Android设备的智能控制解决方案

百度网盘秒传脚本：告别重复上传，实现永久文件分享的3步解决方案

三步打造你的中国象棋AI智能助手：VinXiangQi完整指南

微信好友关系检测终极指南：3分钟找出谁偷偷删了你

新手首次使用Taotoken调用Codex模型完成代码补全的全流程指南

解密Bebas Neue：一款开源几何字体的设计哲学与工程实践

MCP Server开发与增长实战：让AI助手主动调用你的API服务

从‘弹个窗’到‘拿Cookie’：用Burp插件xssValidator实战演练三种XSS漏洞的完整攻击链

轻量级多模态学习框架LightFusion解析与应用

强化学习在复杂文档解析中的应用与优化

5分钟告别Figma英文界面：设计师的终极汉化解决方案

LoongArch CPU设计实战：手把手教你用数据前递技术优化流水线冲突（附完整Verilog代码）

手把手教你复现百卓Smart S85F文件上传漏洞（CVE-2024-0939），附Yakit实战截图

Linux桌面光标主题定制：从Circularity-Cursor安装到个性化配置全攻略

三步构建个人数字漫画库：零门槛本地化管理方案