当前位置：首页 > news >正文

竞赛选题：题目：基于深度学习的水果识别设计开题技术

news 2025/7/14 19:56:14

1 前言

Hi，大家好，这里是丹成学长，今天做一个基于深度学习的水果识别demo

这是一个较为新颖的竞赛课题方向，学长非常推荐！

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

2 开发简介

深度学习作为机器学习领域内新兴并且蓬勃发展的一门学科，它不仅改变着传统的机器学习方法，也影响着我们对人类感知的理解，
已经在图像识别和语音识别等领域取得广泛的应用。因此，本文在深入研究深度学习理论的基础上，将深度学习应用到水果图像识别中，
以此来提高了水果图像的识别性能。

3 识别原理

3.1 传统图像识别原理

传统的水果图像识别系统的一般过程如下图所示，主要工作集中在图像预处理和特征提取阶段。

在大多数的识别任务中，实验所用图像往往是在严格限定的环境中采集的，消除了外界环境对图像的影响。但是实际环境中图像易受到光照变化、水果反光、
遮挡等因素的影响，这在不同程度上影响着水果图像的识别准确率。

在传统的水果图像识别系统中，通常是对水果的纹理、颜色、形状等特征进行提取和识别。

在这里插入图片描述

3.2 深度学习水果识别

CNN 是一种专门为识别二维特征而设计的多层神经网络，它的结构如下图所示，这种结构对平移、缩放、旋转等变形具有高度的不变性。

在这里插入图片描述

学长本次采用的 CNN 架构如图：
在这里插入图片描述

4 数据集

数据库分为训练集(train)和测试集(test)两部分
训练集包含四类apple,orange,banana,mixed(多种水果混合)四类237张图片；测试集包含每类图片各两张。图片集如下图所示。
图片类别可由图片名称中提取。

训练集图片预览

在这里插入图片描述

测试集预览
在这里插入图片描述

数据集目录结构
在这里插入图片描述

5 部分关键代码

5.1 处理训练集的数据结构

import os
import pandas as pd    train_dir = './Training/'
test_dir = './Test/'
fruits = []
fruits_image = []for i in os.listdir(train_dir):for image_filename in os.listdir(train_dir + i):fruits.append(i) # name of the fruitfruits_image.append(i + '/' + image_filename)
train_fruits = pd.DataFrame(fruits, columns=["Fruits"])
train_fruits["Fruits Image"] = fruits_imageprint(train_fruits)

5.2 模型网络结构

    
    import matplotlib.pyplot as plt
    import seaborn as sns
    from keras.preprocessing.image import ImageDataGenerator, img_to_array, load_img
    from glob import glob
    from keras.models import Sequential
    from keras.layers import Conv2D, MaxPooling2D, Activation, Dropout, Flatten, Dense
    img = load_img(train_dir + "Cantaloupe 1/r_234_100.jpg")
    plt.imshow(img)
    plt.axis("off")
    plt.show()
    array_image = img_to_array(img)# shape (100,100)print("Image Shape --> ", array_image.shape)# 131个类目fruitCountUnique = glob(train_dir + '/*' )numberOfClass = len(fruitCountUnique)print("How many different fruits are there --> ",numberOfClass)# 构建模型model = Sequential()model.add(Conv2D(32,(3,3),input_shape = array_image.shape))model.add(Activation("relu"))model.add(MaxPooling2D())model.add(Conv2D(32,(3,3)))model.add(Activation("relu"))model.add(MaxPooling2D())model.add(Conv2D(64,(3,3)))model.add(Activation("relu"))model.add(MaxPooling2D())model.add(Flatten())model.add(Dense(1024))model.add(Activation("relu"))model.add(Dropout(0.5))# 区分131类model.add(Dense(numberOfClass)) # outputmodel.add(Activation("softmax"))model.compile(loss = "categorical_crossentropy",optimizer = "rmsprop",metrics = ["accuracy"])print("Target Size --> ", array_image.shape[:2])##

5.3 训练模型

    
    train_datagen = ImageDataGenerator(rescale= 1./255,
                                       shear_range = 0.3,
                                       horizontal_flip=True,
                                       zoom_range = 0.3)
    test_datagen = ImageDataGenerator(rescale= 1./255)epochs = 100batch_size = 32train_generator = train_datagen.flow_from_directory(train_dir,target_size= array_image.shape[:2],batch_size = batch_size,color_mode= "rgb",class_mode= "categorical")test_generator = test_datagen.flow_from_directory(test_dir,target_size= array_image.shape[:2],batch_size = batch_size,color_mode= "rgb",class_mode= "categorical")for data_batch, labels_batch in train_generator:print("data_batch shape --> ",data_batch.shape)print("labels_batch shape --> ",labels_batch.shape)breakhist = model.fit_generator(generator = train_generator,steps_per_epoch = 1600 // batch_size,epochs=epochs,validation_data = test_generator,validation_steps = 800 // batch_size)#保存模型 model_fruits.h5model.save('model_fruits.h5')

顺便输出训练曲线

    #展示损失模型结果
    plt.figure()
    plt.plot(hist.history["loss"],label = "Train Loss", color = "black")
    plt.plot(hist.history["val_loss"],label = "Validation Loss", color = "darkred", linestyle="dashed",markeredgecolor = "purple", markeredgewidth = 2)
    plt.title("Model Loss", color = "darkred", size = 13)
    plt.legend()
    plt.show()
    #展示精确模型结果plt.figure()plt.plot(hist.history["accuracy"],label = "Train Accuracy", color = "black")plt.plot(hist.history["val_accuracy"],label = "Validation Accuracy", color = "darkred", linestyle="dashed",markeredgecolor = "purple", markeredgewidth = 2)plt.title("Model Accuracy", color = "darkred", size = 13)plt.legend()plt.show()![在这里插入图片描述](https://img-blog.csdnimg.cn/686ace7db27c4145837ec2e09e8ad917.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBARGFuQ2hlbmctc3R1ZGlv,size_17,color_FFFFFF,t_70,g_se,x_16)

在这里插入图片描述

6 识别效果

from tensorflow.keras.models import load_model
import os
import pandas as pd
from keras.preprocessing.image import ImageDataGenerator,img_to_array, load_img
import cv2,matplotlib.pyplot as plt,numpy as np
from keras.preprocessing import imagetrain_datagen = ImageDataGenerator(rescale= 1./255,shear_range = 0.3,horizontal_flip=True,zoom_range = 0.3)model = load_model('model_fruits.h5')
batch_size = 32
img = load_img("./Test/Apricot/3_100.jpg",target_size=(100,100))
plt.imshow(img)
plt.show()array_image = img_to_array(img)
array_image = array_image * 1./255
x = np.expand_dims(array_image, axis=0)
images = np.vstack([x])
classes = model.predict_classes(images, batch_size=10)
print(classes)
train_dir = './Training/'train_generator = train_datagen.flow_from_directory(train_dir,target_size= array_image.shape[:2],batch_size = batch_size,color_mode= "rgb",class_mode= "categorical”)
print(train_generator.class_indices)

在这里插入图片描述

    fig = plt.figure(figsize=(16, 16))axes = []files = []predictions = []true_labels = []rows = 5cols = 2
# 随机选择几个图片
def getRandomImage(path, img_width, img_height):"""function loads a random image from a random folder in our test path"""folders = list(filter(lambda x: os.path.isdir(os.path.join(path, x)), os.listdir(path)))random_directory = np.random.randint(0, len(folders))path_class = folders[random_directory]file_path = os.path.join(path, path_class)file_names = [f for f in os.listdir(file_path) if os.path.isfile(os.path.join(file_path, f))]random_file_index = np.random.randint(0, len(file_names))image_name = file_names[random_file_index]final_path = os.path.join(file_path, image_name)return image.load_img(final_path, target_size = (img_width, img_height)), final_path, path_classdef draw_test(name, pred, im, true_label):BLACK = [0, 0, 0]expanded_image = cv2.copyMakeBorder(im, 160, 0, 0, 300, cv2.BORDER_CONSTANT, value=BLACK)cv2.putText(expanded_image, "predicted: " + pred, (20, 60), cv2.FONT_HERSHEY_SIMPLEX,0.85, (255, 0, 0), 2)cv2.putText(expanded_image, "true: " + true_label, (20, 120), cv2.FONT_HERSHEY_SIMPLEX,0.85, (0, 255, 0), 2)return expanded_image
IMG_ROWS, IMG_COLS = 100, 100# predicting images
for i in range(0, 10):path = "./Test"img, final_path, true_label = getRandomImage(path, IMG_ROWS, IMG_COLS)files.append(final_path)true_labels.append(true_label)x = image.img_to_array(img)x = x * 1./255x = np.expand_dims(x, axis=0)images = np.vstack([x])classes = model.predict_classes(images, batch_size=10)predictions.append(classes)class_labels = train_generator.class_indices
class_labels = {v: k for k, v in class_labels.items()}
class_list = list(class_labels.values())for i in range(0, len(files)):image = cv2.imread(files[i])image = draw_test("Prediction", class_labels[predictions[i][0]], image, true_labels[i])axes.append(fig.add_subplot(rows, cols, i+1))plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))plt.grid(False)plt.axis('off')
plt.show()

在这里插入图片描述

7 最后

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

竞赛选题：题目：基于深度学习的水果识别设计开题技术

1 前言 Hi，大家好，这里是丹成学长，今天做一个基于深度学习的水果识别demo 这是一个较为新颖的竞赛课题方向，学长非常推荐！ 🧿 更多资料, 项目分享： https://gitee.com/dancheng-senior/pos…...

编程日记 2023/12/3 11:58:40

Linux expect命令详解

在Linux系统中，expect 是一款非常有用的工具，它允许用户自动化与需要用户输入进行交互的程序。本文将深入探讨expect命令的基本语法、使用方法以及一些最佳实践。什么是Expect命令？ expect 是一个用于自动化交互式进程的工具。它的主要功能…...

编程日记 2023/12/3 11:57:39

ubuntu18编译Android8的Failed to contact Jack server问题

环境 ubuntu18.04 Android8.1.0 步骤安装环境 apt install git-core apt install gnupg apt install flex apt install bison apt install gperf apt install build-essential apt install curl apt install libc6-dev apt install libssl-dev apt install libncurses5-dev:…...

编程日记 2023/12/3 11:55:35

FindSecBugs支持的检测规则

很多SAST集成了FindSecBugs这个开源工具，其好处是直接对Class文件进行检测，也就是直接检测二进制问题，可以直接检测war、jar，还是非常方便的。虽然误报率较高，但是这些检测出来的安全漏洞很多是安全从业人员耳熟能详的…...

编程日记 2023/12/3 11:45:26

【WPF.NET开发】WPF.NET桌面应用开发概述

本文内容为何从 .NET Framework 升级使用 WPF 进行编程标记和代码隐藏输入和命令控件布局数据绑定图形和动画文本和版式自定义 WPF 应用 Windows Presentation Foundation (WPF) 是一个与分辨率无关的 UI 框架，使用基于矢量的呈现引擎，构建用于利用现…...

编程日记 2023/12/3 11:43:24

态势感知是什么

在当今高度信息化的时代，信息安全风险已经成为企业、政府和个人的重要关注点。为了有效应对这些风险，态势感知成为了一种日益重要的能力。态势感知是一种基于环境的、动态、整体地洞悉安全风险的能力，是以安全大数据为基础，从全局…...

编程日记 2023/12/3 11:41:23

Spring MVC常用的注解, Controller注解的作用,RequestMapping注解的作用 @ResponseBody注解的作用

文章目录 Spring MVC常用的注解和注解的相关作用Controller注解的作用RequestMapping注解的作用ResponseBody注解的作用PathVariable和RequestParam的区别 Spring MVC常用的注解和注解的相关作用 RequestMapping：用于处理请求 url 映射的注解，可用于类或…...

编程日记 2023/12/3 11:37:19

「Verilog学习笔记」自动贩售机1

专栏前言本专栏的内容主要是记录本人学习Verilog过程中的一些知识点，刷题网站用的是牛客网自动贩售机中可能存在的几种金额：0，0.5，1，1.5，2，2.5，3。然后直接将其作为状态机的几种状…...

编程日记 2023/12/3 11:36:18

【大模型】更强的 ChatGLM3-6B 来了，开源可商用

【大模型】更强的 ChatGLM3-6B 来了，开源可商用简介ChatGLM3-6B 环境配置环境搭建安装依赖代码及模型权重拉取拉取 ChatGLM3-6B拉取 ChatGLM3-6B 模型权重及代码终端测试网页测试安装 gradio加载模型并启动服务参考简介 ChatGLM3-6B ChatGLM3-6B 是 ChatGLM …...

编程日记 2023/12/3 11:35:17

Maxscript到Python转换工具教程

Maxscript到Python转换器教程 Maxscript到Python转换器采用MAXScript程序，将其解析为语法树，然后从语法树中生成等效的Python代码。通过提供python的自动翻译，帮助python程序员理解maxscript示例。【项目状况】将正确解析最正确的maxcript…...

编程日记 2023/12/3 11:34:16

Spark_日期参数解析参数-spark.sql.legacy.timeParserPolicy

在Apache Spark中，spark.sql.legacy.timeParserPolicy是一个配置选项，它控制着时间和日期解析策略。此选项主要影响如何解析日期和时间字符串。在Spark 3.0之前的版本中，日期和时间解析使用java.text.SimpleDateFormat，它在解析…...

编程日记 2023/12/3 11:32:14

C语言之结构体

一.前言引入. 我们知道在C语言中有内置类型，如：整型，浮点型等。但是只有这些内置类型还是不够的，假设我想描述学⽣，描述⼀本书，这时单⼀的内置类型是不⾏的。描述⼀个学⽣需要名字、年龄、学号、⾝⾼、体…...

编程日记 2023/12/3 11:31:13

【蓝桥杯软件赛零基础备赛20周】第5周——高精度大数运算与队列

文章目录 1. 数组的应用–高精度大数运算1.1 Java和Python计算大数1.2 C/C高精度计算大数1.2.1 高精度加法1.2.2 高精度减法 2. 队列2.1 手写队列2.1.1 C/C手写队列2.1.2 Java手写队列2.1.3 Python手写队列 2.2 C STL队列queue2.3 Java队列Queue2.4 Python队列Queue和deque2.5 …...

编程日记 2023/12/3 11:30:13

C#:程序发布的大小控制

.net不讨喜有个大原因就是.net平台本身太大了，不同版本没有兼容性，程序依赖哪个版本用户就要安装哪个版本，除非你恰好用的是操作系统默认安装的版本——问题是不同版本操作系统默认安装的不一样。所以打包程序就很头疼，不打包平台…...

编程日记 2023/12/3 11:29:12

Python中的split()、rsplit()、splitlines()的区别

split、rsplit、splitlines的区别 1、split()2、rsplit()3、splitlines() Python提供了三种字符串分割的方法：split()、rsplit()和splitlines()；本文主要通过案例介绍这三种字符串分割函数的区别 1、split() split()主要用于从左向右匹配分割符进行分割…...

编程日记 2023/12/3 11:28:11

上位机开发框架：QT与winform/wpf对比

QT QT 是一个跨平台的 C 应用程序框架，它提供了丰富的 UI 组件和功能强大的网络通信、数据库操作等模块。QT 的优势在于其良好的跨平台性能，可以方便地部署在 Windows、Linux、macOS 等不同操作系统上。此外，QT 还具有强大的 UI 设计能力&am…...

编程日记 2023/12/3 11:27:10

Halcon tiff 点云读取以及平面矫正

一、读取tiff 图 dev_close_window () dev_open_window (0, 0, 512, 512, black, WindowHandle)xResolution:0.0025 yResolution:0.0025 zResolution:0.001 read_image (IntputImage, C:/Users/alber/Desktop/2023-08-15_16-38-24-982_/Sta5_002.tif) zoom_image_factor (Intpu…...

编程日记 2023/12/3 11:25:08

1 前言

2 开发简介

3 识别原理

3.1 传统图像识别原理

3.2 深度学习水果识别

4 数据集

5 部分关键代码

5.1 处理训练集的数据结构

5.2 模型网络结构

5.3 训练模型

6 识别效果

7 最后

相关文章：