当前位置: 首页 > news >正文

自定义数据集图像分类实现

模型训练
要使用自己的图片分类数据集进行训练,这意味着数据集应该包含一个目录,其中每个子目录代表一个类别,子目录中包含该类别的所有图片。以下是一个使用Keras和TensorFlow加载自定义图片数据集进行分类训练的例子。
我们自己创建的数据集结构如下:

data/train/class1/img1.jpgimg2.jpg...class2/imga.jpgimgb.jpg......validation/class1/img3.jpgimg4.jpg...class2/imgc.jpgimgd.jpg......

以下是训练模型的代码:

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.preprocessing.image import ImageDataGenerator
# 定义数据集的路径
train_data_path = 'data/train'
validation_data_path = 'data/validation'
# 设置图片大小
img_height = 150
img_width = 150
# 创建ImageDataGenerator实例
train_datagen = ImageDataGenerator(rescale=1./255,rotation_range=40,width_shift_range=0.2,height_shift_range=0.2,shear_range=0.2,zoom_range=0.2,horizontal_flip=True,fill_mode='nearest')
validation_datagen = ImageDataGenerator(rescale=1./255)
# 使用ImageDataGenerator读取数据
train_generator = train_datagen.flow_from_directory(train_data_path,target_size=(img_height, img_width),batch_size=32,class_mode='categorical'
)
validation_generator = validation_datagen.flow_from_directory(validation_data_path,target_size=(img_height, img_width),batch_size=32,class_mode='categorical'
)
# 创建CNN模型
model = Sequential([Conv2D(32, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)),MaxPooling2D(2, 2),Conv2D(64, (3, 3), activation='relu'),MaxPooling2D(2, 2),Conv2D(128, (3, 3), activation='relu'),MaxPooling2D(2, 2),Flatten(),Dense(512, activation='relu'),Dropout(0.5),Dense(train_generator.num_classes, activation='softmax')
])
# 编译模型
model.compile(optimizer='adam',loss='categorical_crossentropy',metrics=['accuracy'])
# 训练模型
history = model.fit(train_generator,steps_per_epoch=train_generator.samples // train_generator.batch_size,epochs=50,validation_data=validation_generator,validation_steps=validation_generator.samples // validation_generator.batch_size
)
# 保存模型
model.save('my_model.h5')

在这个例子中,我们首先定义了训练和验证数据的路径,然后创建了ImageDataGenerator实例来处理图片增强和归一化。接着,我们使用flow_from_directory方法从目录中读取图片数据,并生成批量数据供模型训练使用。然后,我们创建了一个简单的CNN模型,并使用训练和验证数据进行了训练。最后,我们将训练好的模型保存为my_model.h5文件。

模型使用

import tensorflow as tf
from tensorflow.keras.preprocessing import image
import numpy as np
import os
# 加载训练好的模型
model = tf.keras.models.load_model('my_model.h5')
# 定义包含图片的目录
img_directory = 'path_to_directory_with_images'
# 创建ImageDataGenerator实例来获取类别的顺序
datagen = ImageDataGenerator()
generator = datagen.flow_from_directory('path_to_training_data_directory',  # 训练数据所在的目录target_size=(150, 150),batch_size=32,class_mode='categorical'
)
# 获取类别到索引的映射
class_indices = generator.class_indices
# 反转映射,从索引到类别名称
inverse_map = {v: k for k, v in class_indices.items()}
# 加载所有图片并进行预处理
img_paths = [os.path.join(img_directory, f) for f in os.listdir(img_directory) if f.endswith(('.png', '.jpg', '.jpeg'))]
img_arrays = [image.load_img(img_path, target_size=(150, 150)) for img_path in img_paths]  # 确保这个尺寸与训练时使用的尺寸一致
img_arrays = [image.img_to_array(img) for img in img_arrays]
img_arrays = [img / 255.0 for img in img_arrays]  # 归一化
img_array = np.array(img_arrays)
# 使用模型进行预测
predictions = model.predict(img_array)
# 将预测结果转换为类别索引
predicted_classes = np.argmax(predictions, axis=-1)
# 打印预测结果
for i, img_path in enumerate(img_paths):class_index = predicted_classes[i]class_name = inverse_map[class_index]print(f"Image: {img_path}, Predicted class: {class_name}")

我们首先创建了ImageDataGenerator实例并使用了flow_from_directory方法来获取类别到索引的映射。然后,我们将这个映射反转,以便可以从索引得到类别名称。在预测完成后,我们使用predicted_classes中的索引通过inverse_map来获取每个图片对应的类别名称,并打印出来。
请确保path_to_training_data_directory是训练数据所在的目录,这样类别顺序才是正确的。如果训练数据和测试数据不在同一个目录下,你需要确保测试数据的类别顺序与训练数据相同。

相关文章:

自定义数据集图像分类实现

模型训练 要使用自己的图片分类数据集进行训练,这意味着数据集应该包含一个目录,其中每个子目录代表一个类别,子目录中包含该类别的所有图片。以下是一个使用Keras和TensorFlow加载自定义图片数据集进行分类训练的例子。 我们自己创建的数据集…...

【C++】手搓读写ini文件源码

【C】手搓读写ini文件源码 思路需求:ini.hini.cppconfig.confmian.cpp 思路 ini文件是一种系统配置文件,它有特定的格式组成。通常做法,我们读取ini文件并按照ini格式进行解析即可。在c语言中,提供了模板类的功能,所以…...

undolog

undolog回滚段 undolog执行的时间:在执行器操作bufferpool之前。 undolog页...

项目文档分享

Hello , 我是小恒。提前祝福妈妈母亲节快乐 。 本文写一篇初成的项目文档 (不是README.md哈),仅供参考 项目名称 脚本存储网页 项目简介 本项目旨在创建一个网页,用于存储和展示各种命令,用户可以通过粘贴复制命令到…...

【深耕 Python】Quantum Computing 量子计算机(5)量子物理概念(二)

写在前面 往期量子计算机博客: 【深耕 Python】Quantum Computing 量子计算机(1)图像绘制基础 【深耕 Python】Quantum Computing 量子计算机(2)绘制电子运动平面波 【深耕 Python】Quantum Computing 量子计算机&…...

手写Spring5【笔记】

Spring5【笔记】 前言前言推荐Spring5【笔记】1介绍2手写 最后 前言 这是陈旧已久的草稿2022-12-01 23:32:59 这个是刷B站的时候,看到一个手写Spring的课程。 最后我自己好像运行不了,就没写。 现在2024-5-12 22:22:46,发布到[笔记]专栏中…...

2024中国(重庆)机器人展览会8月举办

2024中国(重庆)机器人展览会8月举办 邀请函 主办单位: 中国航空学会 重庆市南岸区人民政府 招商执行单位: 重庆港华展览有限公司 2024中国重庆机器人展会将汇聚机器人全产业链知名企业,世界科技领先的生产制造企业与来自多个国家和地区…...

Apache 开源项目文档中心 (英文 + 中文)

进度:持续更新中。。。 Apache Ambari 2.7.5 Apache Ambari Installation 2.7.5.0 (latest)Apache Ambari Installation 2.7.5.0 中文版 (latest) Apache DolphinScheduler Apache DolphinScheduler 1.2.0 中文版Apache DolphinScheduler 1.2.1 中文版...

蓝桥杯 算法提高 ADV-1164 和谐宿舍 python AC

贪心&#xff0c;二分 同类型题&#xff1a;蓝桥杯 算法提高 ADV-1175 打包 def judge(x):wood 0max_val 0ans_len 0for i in ll:if i > x:return Falseelif max(max_val, i) * (ans_len 1) < x:max_val max(max_val, i)ans_len 1else:wood 1max_val ians_len …...

Dragonfly 拓扑的路由算法

Dragonfly 拓扑的路由算法 1. Dragonfly 上的路由 (1)最小路由(2)非最小路由 2. 评估3. 存在问题 (1)吞吐量限制(2)较高的中间延迟 references Dragonfly 拓扑的路由算法 John Kim, William J. Dally 等人在 2008 年的 ISCA 中提出技术驱动、高度可扩展的 Dragonfly 拓扑。而…...

android基础-服务

同样使用intent来传递服务 oncreate是服务第一次启动调用&#xff0c;onStartCommand是服务每次启动的时候调用&#xff0c;也就是说服务只要启动后就不会调用oncreate方法了。可以在myservice中的任何位置调用stopself方法让服务停止下来。 服务生命周期 前台服务类似于通知会…...

mysql 事物

MySQL中的事务&#xff08;Transaction&#xff09;是一个确保数据完整性和一致性的重要概念。它将一组SQL操作捆绑在一起&#xff0c;当作一个单一的工作单元来执行。事务具备以下四个关键特性&#xff0c;即ACID特性&#xff1a; 原子性&#xff08;Atomicity&#xff09;&am…...

Unity Shader中获取像素点深度信息

1.顶点着色器中对深度进行计算 v2f vert(appdata v) {v2f o;o.pos UnityObjectToClipPos(v.vertex);o.uv TRANSFORM_TEX(v.uv, _MainTex);o.depth (o.pos.z / o.pos.w 1.0) * 0.5; // Normalize depth to [0, 1]return o; }但是达不到预期&#xff0c;最后返回的值一直大于…...

ROS——Action学习

文章目录 ROS Action概念自定义Action类型参考ROS Action概念 ROS Service会阻塞程序流,程序无法进行其它的工作,有时我们需要同时进行多个任务。 ROS Action可以满足要求,ROS Action提供程序的非阻塞执行。 Action是ROS Node的通信方式之一 Action server 向ROS系统广…...

基于C语言中的类型转换,C++标准创造出了更加可视化的类型转换

目录 前言 一、 C语言中的类型转换 二、为什么C需要四种类型转换 三、C中新增的四种强制类型转换操作符以及它们的应用场景 1.static_cast 2.reinterpret_cast 3.const_cast 4.dynamic_cast 前言 在C语言中&#xff0c;如果赋值运算符左右两侧的类型不同&#xff0c;或者…...

如何创建族表

https://jingyan.baidu.com/article/c275f6bafa5714a23c756768.html...

【UnityRPG游戏制作】Unity_RPG项目_PureMVC框架应用

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;就业…...

并行计算的一些知识点分享--并行系统,并行程序, 并发,并行,分布式

并行计算 核是个啥&#xff1f; 在并行计算中&#xff0c;“核”通常指的是处理器的核心&#xff08;CPU核心&#xff09;。每个核心都是一个独立的处理单元&#xff0c;能够执行计算任务。多核处理器指的是拥有多个这样核心的单一物理处理器&#xff0c;这样的设计可以允许多…...

设计模式:访问者模式

访问者模式&#xff08;Visitor Pattern&#xff09;是行为设计模式的一种&#xff0c;它使你能够在不修改对象结构的情况下&#xff0c;给对象结构中的每个元素添加新的功能。访问者模式将数据结构和作用于结构上的操作解耦&#xff0c;使得操作集合可相对自由地演化。 核心概…...

vivado Virtex-7 配置存储器器件

Virtex-7 配置存储器器件 下表所示闪存器件支持通过 Vivado 软件对 Virtex -7 器件执行擦除、空白检查、编程和验证等配置操作。 本附录中的表格所列赛灵思系列非易失性存储器将不断保持更新 &#xff0c; 并支持通过 Vivado 软件对其中所列非易失性存储器 进行擦除、…...

【NotebookLM因子分析实战指南】:3步解锁AI驱动的维度降维与业务洞察力

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;NotebookLM因子分析辅助的底层逻辑与价值定位 NotebookLM 是 Google 推出的面向研究者的 AI 助手&#xff0c;其核心能力并非泛化式问答&#xff0c;而是基于用户上传文档进行“可信引用驱动”的深度推…...

【.NET新特性·第1篇】.NET 8:统一平台的成熟之作

三年磨一剑&#xff0c;.NET 8 是微软统一平台战略的首个 LTS 里程碑版本 版本定位 适用版本&#xff1a;.NET 8 | LTS&#xff08;长期支持&#xff09; 支持周期&#xff1a;3 年&#xff08;2023.11 - 2026.11&#xff09; 前置知识&#xff1a;.NET 6/7 或其他版本的 C# 开…...

为 OpenClaw 智能体工作流配置 Taotoken 作为其大模型供应商

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 为 OpenClaw 智能体工作流配置 Taotoken 作为其大模型供应商 在构建基于 OpenClaw 框架的 AI 智能体工作流时&#xff0c;开发者通…...

2026年便利店成交金额究竟要达到多少,才能摆脱亏损困境?

在便利店行业竞争日益激烈的当下&#xff0c;众多便利店品牌都在为实现盈利而努力。美喜福作为便利店行业的一员&#xff0c;在这一背景下有着独特的发展路径和潜力。那么&#xff0c;2026年便利店成交金额究竟要达到多少才能摆脱亏损困境呢&#xff1f;让我们结合美喜福的实际…...

【人工智能】某公司AI落地实践总结

某公司AI落地实践总结 一、AI落地的整体路径框架 某公司的AI落地遵循"认知 → 工具使用 → 流程自动化 → 高阶能力构建 → 场景化落地 → 持续迭代 → 激励驱动"的闭环路径,具体分为四个阶段: 初阶入门(认知筑基):AI基础概念与常用工具,零基础扫盲,掌握提示…...

运算放大器:从虚短虚断到负反馈,掌握模拟电路核心设计

1. 从“石头”与“水库”到“运算放大器”&#xff1a;一个电子世界的演化故事如果你拆开过任何一台现代电子设备&#xff0c;从手机到汽车&#xff0c;从血糖仪到工业机器人&#xff0c;你大概率会找到一个或多个不起眼的八脚或十四脚黑色小方块——运算放大器。它不像CPU那样…...

从零到一:用Air724UG 4G模块和Python,手把手搭建一个物联网数据上报系统(含完整代码)

从零构建基于Air724UG的物联网数据中台&#xff1a;Python全栈开发实战 当你拿起一块Air724UG 4G模块时&#xff0c;握在手中的不仅是通讯硬件&#xff0c;更是连接物理世界与数字世界的桥梁。这个火柴盒大小的模块能够将田间地头的土壤数据、工厂车间的设备状态、城市角落的环…...

安全测试入门指南:Web应用常见漏洞及测试方法

在Web应用蓬勃发展的当下&#xff0c;其安全性愈发成为软件测试领域的核心关注点。对于软件测试从业者而言&#xff0c;精准识别Web应用中的常见漏洞&#xff0c;并掌握科学有效的测试方法&#xff0c;是保障应用安全、维护用户信任的关键。本文将从专业角度&#xff0c;深入剖…...

如何用Element React构建企业级React应用:完整组件库实战指南

如何用Element React构建企业级React应用&#xff1a;完整组件库实战指南 【免费下载链接】element-react Element UI 项目地址: https://gitcode.com/gh_mirrors/el/element-react Element React作为一套基于React框架的企业级UI组件库&#xff0c;为开发者提供了50余种…...

ADI CodeFusion Studio:图形化系统规划与数据溯源重塑嵌入式开发

1. 项目概述&#xff1a;当嵌入式开发遇上“系统规划”与“数据信任”在智能边缘设备爆炸式增长的今天&#xff0c;嵌入式开发者正面临着一个前所未有的“甜蜜的烦恼”。一方面&#xff0c;芯片性能越来越强&#xff0c;多核异构架构成为主流&#xff0c;这让我们能在更小的空间…...