当前位置：首页 > news >正文

基于图像掩膜和深度学习的花生豆分拣（附源码）

news 2026/2/8 16:55:48

项目介绍

图像分类网络构建

处理花生豆图片完成预测

项目介绍

这是一个使用图像掩膜技术和深度学习技术实现的一个花生豆分拣系统

我们有大量的花生豆图片，并以及打好了标签，可以看一下目录结构和几张具体的图片

同时我们也有几张大的图片，里面有若干花生豆，我们要做的任务就是将花生豆框住并且实现分类，可以看一下这些图片

图像分类网络构建

这部分的内容和我上一篇博客几乎大同小异，就是把最后的分类个数和类别映射换了换，掌握了上一个项目，这部分相信也会理解的很快，这里附上网址并做简单的回顾

kaggle实战图像分类-Intel Image Classification（附源码）-CSDN博客https://blog.csdn.net/weixin_62428212/article/details/136059443?spm=1001.2014.3001.5501

1，数据集加载

2，构建网络

3，定义超参数训练网络

这里小编使用的是resnet18这个网络，因为花生豆数据集的训练，一不小心就会过拟合，用一些更深更强的网络很容易导致过拟合，resnet18好像也有点过拟合，这里附上训练结果图片

处理花生豆图片完成预测

我们训练好网络后，并不能直接将网络用于预测整个花生豆的大图，因为里面有很多的花生豆，所以我们可以取出并预测，那么怎么单独取出来呢，这里用到了掩膜用以分割花生豆（一些注释写在了代码里）

首先导入相应的库和定义一下参数

# -*- coding: GB2312 -*-
import os
import cv2
import numpy as np
import torch
from PIL import Image
from utils.model import ResNet18
from torchvision import transformspath = 'data/pic'
image_path = os.listdir(path)classify = {0: 'baiban', 1: 'bandian', 2: 'famei', 3: 'faya', 4: 'hongpi', 5: 'qipao', 6: 'youwu', 7: 'zhengchang'}transform = transforms.Compose([transforms.Resize((64, 64)),transforms.ToTensor()])net = ResNet18(8)
net.load_state_dict(torch.load('model_weights/ResNet18.pth'))min_size = 30
max_size = 400

然后我们加载整个大图的文件夹并遍历处理每张图片

for i in image_path:img = cv2.imread(os.path.join(path,i))hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)  # 转HSV色彩空间# 定义背景颜色区间（蓝色区间）lower_blue = np.array([100, 100, 8])upper_blue = np.array([255, 255, 255])mask = cv2.inRange(hsv, lower_blue, upper_blue)  # 创建掩膜（在上述颜色范围内（背景）为白色，不在（花生豆）则为黑色）result = cv2.bitwise_and(img, img, mask=mask)  # 根据掩膜提取图像，会将花生豆的部分变为黑色，然后提取出背景部分result = result.astype(np.uint8)_, binary_image = cv2.threshold(result, 1, 255, cv2.THRESH_BINARY)  # 三通道二值化。背景会全为白色，花生豆部分为黑色# 到这里我们就得到了经过掩膜过滤的图片，其中白色的为背景，黑色的为花生豆，我们可以看一下cv2.namedWindow('HSV_Result', cv2.WINDOW_NORMAL)cv2.resizeWindow('HSV_Result', 2840, 1000)cv2.imshow('HSV_Result', binary_image)cv2.waitKey(0)cv2.destroyAllWindows()

我们发现这些花生豆的背景是蓝色的，所以我们创建了一个用以区分背景和花生豆的掩膜用来分割二者，其分割完后的图片为

通过掩膜处理完后，我们可以清晰的观察到图片里的花生豆，后面我们就可以在这幅图片上画出轮廓并分割出花生豆部分依次放入网络预测

# 过滤边框
def delet_contours(contours, delete_list):delta = 0for i in range(len(delete_list)):del contours[delete_list[i] - delta]delta = delta + 1return contoursinverted_image = cv2.cvtColor(binary_image, cv2.COLOR_BGR2GRAY)  # 转灰度图_, binary_image = cv2.threshold(inverted_image, 1, 255, cv2.THRESH_BINARY)  # 单通道二值化contours, hierarchy = cv2.findContours(binary_image, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)contours = list(contours)delete_list = []for i in range(len(contours)):# 通过框的周长去过滤边框if (cv2.arcLength(contours[i], True) < min_size) or (cv2.arcLength(contours[i], True) > max_size):delete_list.append(i)contours = delet_contours(contours, delete_list)# 遍历每一个框（取出每一个单独的花生豆进行预测）for i in range(len(contours)):x, y, w, h = cv2.boundingRect(contours[i])img_pred = img[y:y+h, x:x+w, :]img_pred = Image.fromarray(img_pred)  # 将numpy数组转为PIL图像对象img_pred = transform(img_pred)  # 调整图像尺寸和转tensor格式img_pred = torch.unsqueeze(img_pred, dim=0)  # 升一个维度pred = torch.argmax(net(img_pred), dim=1)  # 拿到概率最大的分类preds = classify[int(pred)]  # 数字映射为字符串cv2.putText(img, preds, (x, y), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 1, cv2.LINE_AA)  # 写类别标签cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2)  # 画矩形框cv2.namedWindow('Result', cv2.WINDOW_NORMAL)cv2.resizeWindow('Result',2840,1000)cv2.imshow('Result', img)cv2.waitKey(0)cv2.destroyAllWindows()

展示一下预测结果

小编这里发现这个方法可以预测成功中间大多数的花生豆，但是边缘处的花生豆因不会被画出轮廓故不会被放入网络预测，大体预测的效果还算可以。

源码及数据集请查看：https://github.com/jvyou/Peanut-and-bean-sorting

视频讲解请查看：https://www.bilibili.com/video/BV13F4m1g7Wp/?spm_id_from=333.999.0.0

基于图像掩膜和深度学习的花生豆分拣（附源码）

目录项目介绍图像分类网络构建处理花生豆图片完成预测项目介绍这是一个使用图像掩膜技术和深度学习技术实现的一个花生豆分拣系统我们有大量的花生豆图片，并以及打好了标签，可以看一下目录结构和几张具体的图片同时我们也有几张大的图片&…...

编程日记 2024/2/13 10:22:07

【网络】：序列化和反序列化

序列化和反序列化一.json库二.简单使用json库前面已经讲过TCP和UDP，也写过代码能够进行双方的通信了，那么有没有可能这种通信是不安全的呢？如果直接通信，可能会被底层捕捉；可能由于网络问题，一方只接收到…...

编程日记 2024/2/13 10:21:04

AJ-Report 【开源的一个BI平台】

AJ-Report是全开源的一个BI平台，酷炫大屏展示，能随时随地掌控业务动态，让每个决策都有数据支撑。多数据源支持，内置mysql、elasticsearch、kudu驱动，支持自定义数据集省去数据接口开发，目前已支持30…...

编程日记 2024/2/13 10:20:03

Matplotlib核心：掌握Figure与Axes

详细介绍Figure和Axes（基于Matplotlib） 🌵文章目录🌵 🌳引言🌳🌳 一、Figure（图形）🌳🍁1. 创建Figure🍁🍁2. 添加Axes&am…...

编程日记 2024/2/13 10:16:45

问题：A注册会计师必须在期中实施实质性程序的情形是（）。 #学习方法#其他

问题：A注册会计师必须在期中实施实质性程序的情形是（）。 A．甲公司整体控制环境不佳 B．将期中实质性程序所获证据与期末数据进行比较 C．评估的认定层次重大错报风险很高 D．没有把握通过在期中…...

编程日记 2024/2/13 10:14:42

C#系列-C#EF框架返回单行记录（24）

在C#中，使用Entity Framework (EF)框架时，如果你想要执行一个查询并返回单行记录，你可以使用SingleOrDefault、FirstOrDefault、Single或First方法。这些方法适用于DbSet<T>对象，它们可以执行查询并返回单个实体或默认值&am…...

编程日记 2024/2/13 10:13:41

【PyTorch】张量(Tensor)的生成

PyTorch深度学习总结第一章 Pytorch中张量(Tensor)的生成文章目录 PyTorch深度学习总结一、什么是PyTorch？二、张量(Tensor)1、张量的数据类型2、张量生成和信息获取总结一、什么是PyTorch？ PyTorch是一个开源的深度学习框架，基于Python…...

编程日记 2024/2/13 10:12:39

【5G NR】【一文读懂系列】移动通讯中使用的信道编解码技术-Viterbi译码原理

目录一、引言二、Viterbi译码的基本原理 2.1 卷积码与网格图 2.2 Viterbi算法的核心思想 2.3 路径度量与状态转移三、Viterbi译码算法工作原理详解 3.1 算法流程 3.2 关键步骤 3.3 译码算法举例 3.4 性能特点四、Viterbi译码的应用场景 4.1 移动通信系统 4.2 卫…...

编程日记 2024/2/13 10:11:38

矩阵在计算机图像处理中的应用

矩阵在计算机图像处理中是非常核心的概念，因为它们为表示和操作图像数据提供了一种非常方便和强大的方式。以下是矩阵在计算机图像处理中的一些关键作用： 图像表示：在计算机中，图像通常被表示为像素矩阵，也就是二维数组…...

编程日记 2024/2/13 10:10:37

Java实现教学资源共享平台 JAVA+Vue+SpringBoot+MySQL

目录一、摘要1.1 项目介绍1.2 项目录屏二、功能模块2.1 数据中心模块2.2 课程档案模块2.3 课程资源模块2.4 课程作业模块2.5 课程评价模块三、系统设计3.1 用例设计3.2 类图设计3.3 数据库设计3.3.1 课程档案表3.3.2 课程资源表3.3.3 课程作业表3.3.4 课程评价表四、系统展…...

编程日记 2024/2/13 10:09:36

Spring Boot(六十五)：使用 ant.jar 执行 SQL 脚本文件

ant用处，主要用在编译java文件，打包，部署。打包：jar，war，ear包等。ant在项目中有很重要的作用。今天我们讲解它的另一个作用：执行 SQL 脚本文件。 1 引入依赖 <dependency><groupId>org.apache.ant</groupId><artifactId>ant</artifactId&g…...

编程日记 2024/2/13 10:07:34

161基于matlab的快速谱峭度方法

基于matlab的快速谱峭度方法，选择信号峭度最大的频段进行滤波，对滤波好信号进行包络谱分析。输出快速谱峭度及包络谱结果。程序已调通，可直接运行。 161 信号处理快速谱峭度包络谱分析 (xiaohongshu.com)...

编程日记 2024/2/13 10:05:31

CTFshow-WEB入门-信息搜集

web1（查看注释1） wp 右键查看源代码即可找到flag web2（查看注释2） wp 【CtrlU】快捷键查看源代码即可找到flag web3（抓包与重发包） wp 抓包后重新发包，在响应包中找到flag web4（robo…...

编程日记 2024/2/13 10:04:30

django密码管理器(创建项目)

目录创建项目安装django 创建项目(django-admin) 创建管理员用户创建数据库创建项目新建一个项目文件夹，如"密码管理器" 安装django 要先安装pip,pip安装地址:pypi.org、pypi.python.org、cheeseshop.python.org pip install django 创建项…...

编程日记 2024/2/13 10:01:26

Centos7之Oracle12c安装与远程连接配置文章目录 Centos7之Oracle12c安装与远程连接配置1.Oracle官网2. Centos7中安装Oracle12c(12.2.0.1.0)2.1 Introduction (介绍)2.2 Prerequisites(先决条件)2.3 Installation Steps(安装步骤)2.4 Oracle Installer Screens(Oracle安装程序…...

编程日记 2024/2/13 10:00:25

CVE-2022-25578 漏洞复现

CVE-2022-25578 路由/admin/admin.php是后台，登录账号和密码默认是admin、tao，选择文件管理。是否还记得文件上传中的.htaccess配置文件绕过发，在这个文件中加入一句AddType application/x-httpd-php .jpg，将所有jpg文件当作php…...

编程日记 2024/2/13 9:54:18

Ubuntu22.04安装黑屏（进入U盘安装引导时和安装完成后）

一：进入U盘安转引导时黑屏问题描述：选择’try or install ubuntu’，开始安装，出现黑屏。解决方法：（可行） 安装时，先选择" try or install ubuntu", 此时不要按enter&a…...

编程日记 2024/2/13 9:50:14

一、DataX简介

DataX简介一、什么是DataX二、DataX设计三、支持的数据源四、框架设计五、运行原理六、DataX和Sqoop对比一、什么是DataX DataX是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库（MySQL、Oracle等）、HDFS、Hive、OD…...

编程日记 2024/2/13 9:48:12

直播app开发，技术驱动的实时互动新纪元

随着互联网技术的快速发展，直播已成为我们日常生活的重要组成部分。从娱乐、教育到商业活动，直播的广泛应用正在改变着我们的生活和工作方式。在这一变革中，直播开发扮演着至关重要的角色。本文将探讨直播开发的核心理念、技术挑战以及未来的…...

编程日记 2024/2/13 9:47:10

Apache POI的介绍以及使用示例

Apache POI 是一套开源的 Java 库，用于读取和写入 Microsoft Office 文档格式，如 Excel、Word 和 PowerPoint。Spring Boot 是一个流行的 Java 应用程序框架，用于简化 Spring 应用的开发和部署。将 Apache POI 与 Spring Boot 结合使用&#…...

编程日记 2024/2/13 9:43:07

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周，有很多同学在写期末Java web作业时，运行tomcat出现乱码问题，经过多次解决与研究，我做了如下整理： 原因： IDEA本身编码与tomcat的编码与Windows编码不同导致，Windows 系统控制台…...

编程新知 2026/2/8 4:37:39

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

Go 语言接口详解

Go 语言接口详解核心概念接口定义在 Go 语言中，接口是一种抽象类型，它定义了一组方法的集合： // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的： // 矩形结构体…...

编程新知 2026/1/4 5:19:25

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一，概述 1. 目的将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本：2014.07； Kernel版本：Linux-3.10； 二，Uboot 1. sys_config.fex改动使能uart3(TX:PH00 RX:PH01)，并让boo…...

编程新知 2026/2/5 6:28:09

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA

浪潮交换机track配置项目背景高速网络拓扑网络情况分析通信线路收费网络路由收费汇聚交换机相应配置收费汇聚track配置项目背景在实施省内一条高速公路时遇到的需求，本次涉及的主要是收费汇聚交换机的配置，浪潮网络设备在高速项目很少，通…...

编程新知 2026/2/6 13:10:51

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

说明：这是一个机器学习实战项目（附带数据代码文档），如需数据代码文档可以直接到文章最后关注获取。 1.项目背景在金融市场日益复杂和波动加剧的背景下，风险管理成为金融机构和个人投资者关注的核心议题之一。VaR&…...

编程新知 2026/1/25 4:19:49

C++ 设计模式《小明的奶茶加料风波》

👨‍🎓 模式名称：装饰器模式（Decorator Pattern） 👦 小明最近上线了校园奶茶配送功能，业务火爆，大家都在加料： 有的同学要加波霸 🟤，有的要加椰果…...

编程新知 2026/1/31 8:45:21

PostgreSQL——环境搭建

一、Linux # 安装 PostgreSQL 15 仓库 sudo dnf install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-$(rpm -E %{rhel})-x86_64/pgdg-redhat-repo-latest.noarch.rpm# 安装之前先确认是否已经存在PostgreSQL rpm -qa | grep postgres# 如果存在&#xff0…...

编程新知 2025/11/26 20:46:42

Python的call 方法

在 Python 中，__call__ 是一个特殊的魔术方法（magic method），它允许一个类的实例像函数一样被调用。当你在一个对象后面加上 () 并执行时（例如 obj()），Python 会自动调用该对象的 __call__ 方法…...

编程新知 2026/1/16 9:01:18

第22节 Node.js JXcore 打包

Node.js是一个开放源代码、跨平台的、用于服务器端和网络应用的运行环境。 JXcore是一个支持多线程的 Node.js 发行版本，基本不需要对你现有的代码做任何改动就可以直接线程安全地以多线程运行。本文主要介绍JXcore的打包功能。 JXcore 安装下载JXcore安装包&a…...

编程新知 2025/12/18 2:20:04

项目介绍

图像分类网络构建

处理花生豆图片完成预测

相关文章：