当前位置：首页 > article >正文

《高效迁移学习：Keras与EfficientNet花卉分类项目全解析》

article 2026/3/11 6:41:24

从零到精通的迁移学习实战指南：以Keras和EfficientNet为例

一、为什么我们需要迁移学习？

1.1 人类的学习智慧

想象一下：如果一个已经会弹钢琴的人学习吉他，会比完全不懂音乐的人快得多。因为TA已经掌握了乐理知识、节奏感和手指灵活性，这些都可以迁移到新乐器的学习中。这正是迁移学习（Transfer Learning）的核心思想——将已掌握的知识迁移到新任务中。

1.2 深度学习的困境与破局

传统深度学习需要：

大量标注数据
长时间的训练
高昂的计算资源

而迁移学习可以：

在较少的数据上进行训练
快速适应新任务
节省计算资源

二、迁移学习核心技术解析

2.1 核心概念

迁移学习是指将预训练模型在一个任务上学习到的知识迁移到另一个相关任务中。在迁移学习中，我们可以利用已有的模型参数，减少训练时间并提高模型的性能。

2.2 方法论全景图

方法类型	数据量要求	训练策略	适用场景
特征提取	少量	冻结全部预训练层	快速原型开发
部分微调	中等	解冻部分高层	领域适配
端到端微调	大量	解冻全部层，调整学习率	专业领域应用

三、EfficientNet：效率与精度的完美平衡

3.1 模型设计哲学

通过复合缩放（Compound Scaling）统一调整：

网络宽度
深度
分辨率

EfficientNet各版本参数对比

models = {'B0': (224, 0.7),'B3': (300, 1.2),'B7': (600, 2.0)
}

3.2 性能优势

在ImageNet上达到84.4% Top-1准确率，同时：

较小的模型大小
高效的计算性能
适用于多种深度学习任务

四、Keras实战：花卉分类系统开发

4.1 环境准备

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.applications import EfficientNetB0
from tensorflow.keras.preprocessing.image import ImageDataGenerator

4.2 牛津花卉数据集处理

# 数据路径配置
train_dir = 'flower_photos/train'
val_dir = 'flower_photos/validation'# 数据增强配置
train_datagen = ImageDataGenerator(rescale=1./255,rotation_range=40,width_shift_range=0.2,height_shift_range=0.2,shear_range=0.2,zoom_range=0.2,horizontal_flip=True)# 数据流生成
train_generator = train_datagen.flow_from_directory(train_dir,target_size=(224, 224),batch_size=32,class_mode='categorical')val_generator = ImageDataGenerator(rescale=1./255).flow_from_directory(val_dir,target_size=(224, 224),batch_size=32,class_mode='categorical')

ImageDataGenerator 是 Keras 提供的一个类，用于对图片进行实时的数据增强，以提升模型的泛化能力。

这里的配置表示：

rescale=1./255：将像素值归一化为 [0, 1] 之间，因为图像的原始像素值通常是 [0, 255]，这种归一化能够帮助加速训练过程。
rotation_range=40：随机旋转图像，角度范围为 -40 到 +40 度。
width_shift_range=0.2：在水平方向上随机平移图像，平移的范围是原图宽度的 20%。
height_shift_range=0.2：在垂直方向上随机平移图像，平移的范围是原图高度的 20%。
shear_range=0.2：对图像进行错切变换，错切的范围为 20%。
zoom_range=0.2：随机缩放图像，缩放的范围是原图的 80% 到 120%。
horizontal_flip=True：随机水平翻转图像。

4.3 模型构建策略

特征提取模式：

def build_model(num_classes):base_model = EfficientNetB0(include_top=False,weights='imagenet',input_shape=(224, 224, 3))# 冻结基础模型base_model.trainable = Falseinputs = tf.keras.Input(shape=(224, 224, 3))x = base_model(inputs, training=False)x = layers.GlobalAveragePooling2D()(x)x = layers.Dense(256, activation='relu')(x)outputs = layers.Dense(num_classes, activation='softmax')(x)return tf.keras.Model(inputs, outputs)

代码解释：

base_model中是加载预训练模型的代码，include_top=False表示不加载EfficientNetB0原始模型的全连接分类层（顶层），因为我们将自己设计分类器（即添加自定义的全连接层）。
base_model.trainable = False将 base_model 的所有参数设置为不可训练，即冻结了EfficientNetB0模型的所有权重。
x = base_model(inputs, training=False)：将输入传递给冻结的EfficientNetB0模型，提取特征。这里的 training=False 表示在推理（预测）模式下不需要更新模型的权重（即保持冻结状态）。
GlobalAveragePooling2D()(x)：在卷积层输出后应用全局平均池化（Global Average Pooling）。这一层将每个特征图的空间维度（宽度和高度）通过取均值的方式降到 1，使得输出的形状变成 (batch_size, channels)。这种方法减少了参数量，避免了过拟合，并且比全连接层更高效。
接下来就是自定义分类头，activation='softmax'将输出转换为一个概率分布，用于多分类任务。

渐进式微调策略：

def unfreeze_layers(model, unfreeze_percent=0.2):num_layers = len(model.layers)unfreeze_from = int(num_layers * (1 - unfreeze_percent))for layer in model.layers[:unfreeze_from]:layer.trainable = Falsefor layer in model.layers[unfreeze_from:]:layer.trainable = Truereturn model

代码解释：

这段代码定义了一个 unfreeze_layers 函数，目的是解冻（unfreeze）一个深度学习模型中的部分层，使得这些层在训练过程中会更新其权重。
函数 unfreeze_layers 的参数：
model：这是输入的 Keras 模型，通常是经过预训练的模型（例如 EfficientNet、ResNet 等）。
unfreeze_percent：这是一个浮动参数，表示要解冻的层所占模型总层数的百分比。默认值为 0.2，意味着解冻模型的 20% 层。
model.layers 是一个包含模型所有层的列表，len(model.layers) 获取该列表中的层数，即模型的总层数。

4.4 训练配置技巧

model = build_model(5)  # 假设有5类花卉# 自定义学习率调度器
lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(initial_learning_rate=1e-3,decay_steps=1000,decay_rate=0.9)# 优化器配置
optimizer = tf.keras.optimizers.Adam(learning_rate=lr_schedule)model.compile(optimizer=optimizer,loss='categorical_crossentropy',metrics=['accuracy'])# 回调配置
callbacks = [tf.keras.callbacks.EarlyStopping(patience=3),tf.keras.callbacks.ModelCheckpoint('best_model.h5'),tf.keras.callbacks.TensorBoard(log_dir='./logs')
]# 启动训练
history = model.fit(train_generator,epochs=20,validation_data=val_generator,callbacks=callbacks)

代码解释：

模型构建：定义了一个用于分类花卉的模型。
学习率调度：使用指数衰减来动态调整学习率，帮助模型更好地收敛。
优化器：使用 Adam 优化器，并将其与学习率调度器结合。
回调设置：配置了早停、模型保存和 TensorBoard 日志功能，以便监控训练过程和防止过拟合。
训练过程启动：通过 model.fit 启动训练，并进行多次迭代。

4.5 性能可视化分析

import matplotlib.pyplot as pltplt.figure(figsize=(12, 5))# 准确率曲线
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Val Accuracy')
plt.title('Training and Validation Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')# 损失曲线
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Val Loss')
plt.title('Training and Validation Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')plt.tight_layout()
plt.show()

五、性能优化进阶技巧

5.1 混合精度训练

tf.keras.mixed_precision.set_global_policy('mixed_float16')

5.2 动态数据增强

augment = tf.keras.Sequential([layers.RandomRotation(0.3),layers.RandomContrast(0.2),layers.RandomZoom(0.2)
])# 在模型内部集成增强层
inputs = tf.keras.Input(shape=(224, 224, 3))
x = augment(inputs)
x = base_model(x)
...

5.3 知识蒸馏

# 教师模型（大型EfficientNet）
teacher = EfficientNetB4(weights='imagenet')# 学生模型（小型EfficientNet）
student = EfficientNetB0()# 蒸馏损失计算
def distillation_loss(y_true, y_pred):alpha = 0.1return alpha * keras.losses.categorical_crossentropy(y_true, y_pred) + \(1-alpha) * keras.losses.kl_divergence(teacher_outputs, student_outputs)

六、模型部署与生产化

6.1 模型轻量化

converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()with open('flower_model.tflite', 'wb') as f:f.write(tflite_model)

6.2 API服务化

from flask import Flask, request, jsonifyapp = Flask(__name__)
model = tf.keras.models.load_model('best_model.h5')@app.route('/predict', methods=['POST'])
def predict():img = preprocess_image(request.files['image'])prediction = model.predict(img)return jsonify({'class': decode_prediction(prediction)})

可运行的完整代码如下：

大家可以根据这个最基础的代码，一步一步加上数据增强，回调，微调等操作进行练习。

import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras import layers
from tensorflow.keras.applications import EfficientNetB0
import matplotlib.pyplot as plt# 数据路径配置
base_dir = 'flower_photos'  # 包含所有花卉的主文件夹路径# 数据生成器配置（简化）
train_datagen = ImageDataGenerator(rescale=1./255)  # 仅进行归一化# 数据流生成（训练集）
train_generator = train_datagen.flow_from_directory(base_dir,target_size=(224, 224),batch_size=32,class_mode='categorical'
)# 数据流生成（验证集）
val_generator = ImageDataGenerator(rescale=1./255).flow_from_directory(base_dir,target_size=(224, 224),batch_size=32

在这里插入图片描述

《高效迁移学习：Keras与EfficientNet花卉分类项目全解析》

从零到精通的迁移学习实战指南：以Keras和EfficientNet为例一、为什么我们需要迁移学习？ 1.1 人类的学习智慧想象一下：如果一个已经会弹钢琴的人学习吉他，会比完全不懂音乐的人快得多。因为TA已经掌握了乐理知识、节奏感和手指…...

编程日记 2026/3/1 3:54:16

【单片机】嵌入式系统的硬件与软件特性

嵌入式系统的软件结构嵌入式系统的软件结构一般分为不带操作系统（Bare Metal） 和带操作系统（RTOS / Linux） 两种。不同的软件架构适用于不同的应用场景，如简单控制系统、实时控制系统、物联网、工业自动化等。嵌…...

编程日记 2026/3/10 10:31:41

5G核心网实训室搭建方案：轻量化部署与虚拟化实践

5G核心网实训室随着5G技术的广泛应用，行业对于5G核心网人才的需求日益增长。高校、科研机构和企业纷纷建立5G实训室，以促进人才培养、技术创新和行业应用研究。IPLOOK凭借其在5G核心网领域的深厚积累，提供了一套高效、灵活的5G实训室搭建方…...

编程日记 2026/3/6 10:07:00

使用Qt创建悬浮窗口

在Qt中创建悬浮窗口（如无边框、可拖动的浮动面板或提示框）可以通过以下方法实现。以下是几种常见场景的解决方案： 方法1：使用无边框窗口鼠标事件拖动适用于自定义浮动工具窗口（如Photoshop的工具栏）。 …...

编程日记 2026/3/7 3:25:14

蓝耘MaaS平台：阿里QWQ应用拓展与调参实践

摘要：本文深入探讨了蓝耘MaaS平台与阿里QWQ模型的结合，从平台架构、模型特点到应用拓展和调参实践进行了全面分析。蓝耘平台凭借其强大的算力支持、弹性资源调度和全栈服务，为QWQ模型的高效部署提供了理想环境。通过细化语义描述、调整推理参…...

编程日记 2026/3/1 20:30:50

一次Milvus迁移的记录

前言希望把Linux上生产环境中使用docker compose运行的milvus迁移到本地(mac os)的docker compose中操作过程找到了官方有两个相关的项目： https://github.com/zilliztech/milvus-backup https://github.com/zilliztech/vts 但是…我都没用，因为使…...

编程日记 2026/2/14 17:56:59

在线 SQL 转 SQLAlchemy：一键生成 Python 数据模型

一款高效的在线 SQL 转 SQLAlchemy 工具，支持自动解析 SQL 语句并生成 Python SQLAlchemy 模型代码，适用于数据库管理、后端开发和 ORM 结构映射。无需手写 SQLAlchemy 模型，一键转换 SQL 结构，提升开发效率，简化数据库…...

编程日记 2026/2/23 20:25:03

即插即用模块--KANLinear

KAN网络 KAN网络即Kolmogorov-Arnold 网络，是一类基于 Kolmogorov-Arnold 表示定理的神经网络架构，具有强大的非线性表达能力。在相同迭代次数下超越传统MLP，不仅训练速度更快，收敛性更好，而且在拟合复杂函数时的精度…...

编程日记 2026/3/9 3:31:29

LLM本地化部署与管理实用工具实践记录

文章目录前言OllamaQWen模型部署Python调用API AnythingLLM本地基础配置AI知识库检索 CherryStudio访问DeepSeek系统内置AI助手嵌入知识库文档 LLMStudio基础环境安装模型管理应用命令行的管理总结前言发现好久没更新 CSDN 个人博客了，更多的是转移到了个人私有…...

编程日记 2026/3/7 5:03:45

免费高质量贴图（Textures）网站推荐

以下是一些提供免费或高质量贴图（Textures） 的网站，包括 PBR 贴图、HDRI 贴图、材质等，适用于 Three.js、Blender、Unity、Unreal Engine 等软件。 🌍 1. Poly Haven（https://polyhaven.com/）⭐…...

编程日记 2026/3/9 19:23:44

第十次CCF-CSP认证（含C++源码）

第十次CCF-CSP认证分蛋糕满分题解学生排队满分题解 Markdown语法题目解读满分代码结语分蛋糕题目链接满分题解基本思路：我们需要保证除了最后一个小朋友之外的所有人，分得的蛋糕都大于等于给定的K值，为什么是大于等于，是…...

编程日记 2026/3/2 8:19:16

windows 启用linux子系统不必再装双系统

搜索栏搜索：启用或关闭Windows功能，把下面3项勾选上：若没有Hyper-V，则根据以下步骤添加：在桌面新建一个txt文件，将下面的程序复制进去，之后修改文件后缀名为.bat 右键管理员运行即可。 pushd "%~dp0" dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.m…...

编程日记 2026/3/4 15:47:18

lanqiaoOJ 1180：斐波那契数列 ← 矩阵快速幂

【题目来源】 https://www.lanqiao.cn/problems/1180/learning/ 【题目描述】定义斐波那契数列数列为 F11，F21，FnFn-1Fn-2，n＞2。给定一个正整数 n，求 Fn 在模 10^97 的值。【输入格式】第1行为一个整数 T&#x…...

编程日记 2026/3/9 4:02:22

go程序运行Spaitalite踩坑记录

Spatialite参考资料：8.1. 开源地理空间数据库 — Python与开源GIS Ubuntu安装SpaitaLite： apt-get install libspatialite7 libsqlite3-mod-spatialite apt-get install spatialite-bin 命令行打开数据库：spatialite xxx.db 执行一个空间函…...

编程日记 2026/3/5 21:51:51

【react】react中的＜＞＜/＞和React Fragment的用法及区别详解

目录 1、<>是什么 2、为什么要使用<>？ 3、如何使用<>？ 基本用法需要传递属性时（如key） 使用效果注意事项总结 4、React Fragment 与空标签（<>）详解 1. Fragment 的用…...

编程日记 2026/3/2 23:59:41

Everything搜索工具下载使用教程（附安装包），everything搜索工具文件快速查找

文章目录前言一、Everything搜索工具下载二、Everything搜索工具下载使用教程前言 Everything搜索工具能凭借文件名实时精准定位文件，接下来的教程，将详细为你呈现 Everything搜索工具的下载及使用方法，助你开启高效文件搜索的便捷之旅。…...

编程日记 2026/2/27 22:46:50

LeetCode 解题思路 17（Hot 100）

解题思路： 找到链表中点： 使用快慢指针法，快指针每次移动两步，慢指针每次移动一步。当快指针到达末尾时，慢指针指向中点。递归分割与排序： 将链表从中点处分割为左右两个子链表，分别对这两个子…...

编程日记 2026/3/2 8:32:26

Qt程序基于共享内存读写CodeSys的变量

文章目录 1.背景2.结构体从CodeSys导出后导入到C2.1.将结构体从CodeSys中导出2.2.将结构体从m4文件提取翻译成c格式 3.添加RTTR注册信息4.读取PLC变量值5.更改PLC变量值 1.背景在文章【基于RTTR在C中实现结构体数据的多层级动态读写】中，我们实现了通过字符串读写…...

编程日记 2026/3/3 1:25:36

7-12 关于堆的判断

输入样例： 5 4 46 23 26 24 10 24 is the root 26 and 23 are siblings 46 is the parent of 23 23 is a child of 10输出样例： F T F T 这题是建最小堆，数据结构牛老师讲过这个知识点，但是我给忘了，补题搜了一下才解…...

编程日记 2026/3/10 18:37:18

《SQL编程思想》中的 MySQL 建表语句建表语句 -- 创建 4 个示例表和索引 CREATE TABLE department( dept_id INTEGER NOT NULL AUTO_INCREMENT PRIMARY KEY COMMENT 部门编号，自增主键, dept_name VARCHAR(50) NOT NULL COMMENT 部门名称) ENGINEInnoDB COMM…...

编程日记 2026/3/5 20:23:58

STL标准库

感谢哔哩哔哩UP“开发者LaoJ”，以下是学习记录~ 一、容器 1.1、vector 底层实现是动态数组，向尾部插入数据很方便，但是向中间和头部插入数据需要移动其它元素可以实现随机访问如果插入时，当前vector容纳不下，会…...

编程日记 2026/2/20 2:23:19

STM32 HAL库实战：高效整合DMA与ADC开发指南

STM32 HAL库实战：高效整合DMA与ADC开发指南一、DMA与ADC基础介绍 1. DMA：解放CPU的“数据搬运工” DMA（Direct Memory Access） 是STM32中用于在外设与内存之间直接传输数据的硬件模块。其核心优势在于无需CPU干预，…...

编程日记 2026/3/7 19:19:19

什么是机器学习？从零基础到自动驾驶案例全解析

Langchain系列文章目录 01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…...

编程日记 2026/3/2 10:10:32

正点原子[第三期]Arm(iMX6U)Linux移植学习笔记-4 uboot目录分析

前言： 本文是根据哔哩哔哩网站上“Arm(iMX6U)Linux系统移植和根文件系统构键篇”视频的学习笔记，在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。引用： …...

编程日记 2026/3/10 20:45:31

Unity开发——点击事件/射线检测

一、IPointerClickHandler接口通过为 UI 元素添加自定义脚本，实现IPointerClickHandle接口，在点击事件发生时进行处理。这种方式适用于对特定 UI 元素的点击检测。 using UnityEngine; using UnityEngine.EventSystems;public class UIClickHandler…...

编程日记 2026/3/3 14:35:28