当前位置: 首页 > article >正文

从零构建垃圾分类识别系统:基于8万张图片与TensorFlow的实战指南

1. 项目背景与数据集介绍垃圾分类识别系统听起来高大上但其实离我们日常生活特别近。去年我帮小区物业做了一套这样的系统从零开始折腾了两个月踩了不少坑也积累了不少实战经验。这次就用8万张图片的数据集为例带大家走完全流程。这个数据集是我从多个开源渠道整理来的包含245类常见垃圾比如厨余垃圾_鸡蛋壳、可回收物_矿泉水瓶这样的细分类别。原始数据质量参差不齐有些图片模糊不清有些甚至根本不是垃圾图片。我花了整整一周时间清洗数据最终得到80012张可用图片全部统一转换成jpg格式按文件夹分类存放。比如trash_jpg/厨余垃圾_香蕉皮这个路径下就全是香蕉皮的照片。数据集有四个大类可回收物塑料瓶、纸箱等厨余垃圾果皮、剩饭等有害垃圾电池、药品等其他垃圾卫生纸、塑料袋等每个大类下又有几十到上百个小类比如可回收物下面还分可回收物_玻璃瓶、可回收物_易拉罐等。这种层级结构特别适合用TensorFlow的image_dataset_from_directory方法直接读取省去了手动标注的麻烦。2. 开发环境搭建工欲善其事必先利其器。我推荐用Anaconda创建独立的Python环境避免包版本冲突。这是我的环境配置清单conda create -n trash_classify python3.8 conda activate trash_classify pip install tensorflow2.3.0 pillow matplotlib opencv-python pyqt5这里有个坑要注意TensorFlow 2.3虽然不算最新版但经过实测发现它对MobileNet的支持最稳定。我试过用2.6版本训练时会出现莫名其妙的NaN loss问题。硬件方面最好有块NVIDIA显卡。我用的是GTX 1660 Ti 6GB显存训练MobileNet大约需要4小时。如果没有显卡可以用Google Colab的免费GPU资源记得选择运行时类型为GPU就行。3. 数据预处理实战拿到8万张图片后千万别直接扔给模型训练。我总结了一套预处理组合拳3.1 数据增强策略在tf.keras里可以很方便地实现数据增强from tensorflow.keras.preprocessing.image import ImageDataGenerator train_datagen ImageDataGenerator( rescale1./255, rotation_range20, width_shift_range0.2, height_shift_range0.2, shear_range0.2, zoom_range0.2, horizontal_flipTrue, validation_split0.2 # 直接划分20%数据做验证集 )这里有个技巧rotation_range不要设太大否则可回收物_易拉罐旋转后可能被误认为其他垃圾_罐头。我一开始设了40度准确率直接掉了5%。3.2 数据集加载用TF的API加载数据简直不要太方便train_ds train_datagen.flow_from_directory( trash_jpg, target_size(224, 224), batch_size32, class_modecategorical, subsettraining ) val_ds train_datagen.flow_from_directory( trash_jpg, target_size(224, 224), batch_size32, class_modecategorical, subsetvalidation )注意target_size要和模型输入尺寸一致。MobileNet默认是224x224如果你用EfficientNet就要调整。4. 模型训练与调优4.1 MobileNet迁移学习直接上代码base_model tf.keras.applications.MobileNetV2( input_shape(224, 224, 3), include_topFalse, weightsimagenet ) # 冻结基础模型 base_model.trainable False # 添加自定义分类头 model tf.keras.Sequential([ base_model, tf.keras.layers.GlobalAveragePooling2D(), tf.keras.layers.Dense(256, activationrelu), tf.keras.layers.Dropout(0.5), tf.keras.layers.Dense(245, activationsoftmax) ])这里有几个关键点先用include_topFalse去掉原模型的分类头开始训练时要冻结基础模型(trainableFalse)中间加了个Dropout层防止过拟合这个参数我调了十几次才确定0.5最合适4.2 训练技巧我的训练配置是这样的model.compile( optimizertf.keras.optimizers.Adam(learning_rate0.0001), losscategorical_crossentropy, metrics[accuracy] ) history model.fit( train_ds, validation_dataval_ds, epochs30, callbacks[ tf.keras.callbacks.EarlyStopping(patience3), tf.keras.callbacks.ModelCheckpoint(best_model.h5) ] )重点来了学习率一定要小0.0001起步用了EarlyStopping防止过拟合ModelCheckpoint会保存验证集上表现最好的模型在我的机器上30个epoch大概要4小时。最终验证集准确率能达到82%左右对于245个类别来说已经很不错了。5. 模型部署与应用开发5.1 PyQt5界面开发训练好的模型要落地应用我选择了PyQt5做图形界面。核心代码结构class MainWindow(QMainWindow): def __init__(self): super().__init__() self.model tf.keras.models.load_model(best_model.h5) self.class_names [...] # 245个类别的名称 def classify_image(self): img Image.open(self.file_path) img img.resize((224, 224)) img_array tf.keras.preprocessing.image.img_to_array(img) img_array tf.expand_dims(img_array, 0) predictions self.model.predict(img_array) score tf.nn.softmax(predictions[0]) result f分类结果: {self.class_names[np.argmax(score)]}\n置信度: {100*np.max(score):.2f}% self.result_label.setText(result)界面布局用Qt Designer拖拽完成主要包含图片上传按钮结果显示区域分类按钮退出按钮5.2 性能优化技巧在实际部署时发现几个问题模型加载慢改用tf.lite转换后速度提升3倍内存占用高添加了图片尺寸检查超过5MB的图片先压缩界面卡顿把预测任务放到单独线程中执行转换TensorFlow Lite模型的代码converter tf.lite.TFLiteConverter.from_keras_model(model) tflite_model converter.convert() with open(model.tflite, wb) as f: f.write(tflite_model)6. 常见问题与解决方案6.1 类别不平衡问题数据集中其他垃圾类别的图片特别多导致模型偏向预测为这类。我试过三种解决方法类权重法在model.fit中添加class_weight参数过采样法用ImageDataGenerator对少数类图片做更多增强欠采样法随机删除多数类图片最终发现方法1效果最好代码如下from sklearn.utils import class_weight import numpy as np class_weights class_weight.compute_class_weight( balanced, classesnp.unique(train_ds.classes), ytrain_ds.classes ) class_weights dict(enumerate(class_weights)) model.fit(..., class_weightclass_weights)6.2 新类别增量学习后来小区新增了可回收物_奶茶杯这个类别我摸索出一套增量学习方案冻结原模型所有层只训练新添加的分类头用小学习率(0.00001)微调几层卷积这样既不用重新训练整个模型又能快速适应新类别。7. 进阶优化方向如果想进一步提升准确率可以尝试改用EfficientNetV2模型我的测试显示能提升3-5%准确率添加注意力机制模块使用CutMix数据增强对模糊图片添加超分辨率预处理不过要提醒的是模型复杂度增加会显著延长训练时间。在实际项目中要在准确率和推理速度之间做好权衡。

相关文章:

从零构建垃圾分类识别系统:基于8万张图片与TensorFlow的实战指南

1. 项目背景与数据集介绍 垃圾分类识别系统听起来高大上,但其实离我们日常生活特别近。去年我帮小区物业做了一套这样的系统,从零开始折腾了两个月,踩了不少坑,也积累了不少实战经验。这次就用8万张图片的数据集为例,…...

以为生活缺的是标准答案,其实是丧失了“拆解”的能力

凌晨书桌前的拆解者一、 那个被几十个“高赞回答”困住的深夜前几天,我以前带过的一个产品经理大林,约我在海淀喝了顿大酒。大林今年38岁,正卡在一个要命的节骨眼上:公司业务大调整,他所在的边缘业务线面临被“优化”的…...

为什么先安慰,比先讲道理更有效(为什么这里会有这么一篇博客)

这里应该有一个场景多人都经历过这样的场景。女生跟男朋友说,今天真的很委屈,很难受。她本来期待的是一句“我懂你”“你今天一定很撑”“这不是你的错”。结果男生下一秒开始分析:那你以后别这样说,你应该先找老师,你…...

终于会了!OpenClaw 与钉钉机器人对接,小白也能上手

前言 在日常开发和办公协作中,将自定义工具 OpenClaw 接入钉钉企业内部机器人,能够实现业务信息和任务的高效协同。这种集成方式可显著提升团队协作效率,特别是在开发与办公场景中。本文将详细介绍 OpenClaw 接入钉钉企业内部机器人的完整流…...

STM32F407新手避坑指南:从点灯到PWM,那些官方手册没细说的实战细节

STM32F407新手避坑指南:从点灯到PWM的实战陷阱解析 第一次点亮STM32F407的LED时,那种成就感就像在黑暗中找到了开关。但很快你会发现,官方手册里那些优雅的代码示例,在实际开发中总会遇到各种"意外"。本文不会重复基础教…...

如何用 style.setProperty 修改带有优先级的 CSS 变量属性

不能用 style.setProperty 直接设置带 !important 的 CSS 变量,因为内联样式不支持 !important,浏览器会静默丢弃该声明;应通过 insertRule 动态注入带 !important 的 CSS 规则,或依靠作用域、类名切换等更健壮的方式管理变量优先…...

从DeepPS到工业实践:剖析基于DCNN的停车位检测算法演进与挑战

1. 停车位检测技术的现实挑战与需求 想象一下,你正开车进入一个陌生的地下停车场,昏暗的灯光下,地面反光严重,部分车位线已经模糊不清。这时候如果依赖传统计算机视觉算法,很可能连最基本的车位线都识别不出来。这正是…...

如何从SQL获取当前登录用户数据_使用系统上下文函数

...

大模型大揭秘:从ChatGPT到国产模型,为什么它突然这么厉害?

本文深入解析了大模型的核心概念,阐述了其“大”体现在参数量、训练数据和计算量三个维度,并介绍了Transformer、预训练、指令微调、RLHF等关键技术。文章还探讨了大模型的涌现能力、局限性以及国产大模型的最新进展,揭示了大模型在AI领域的革…...

探究python-docx的段落缩进——从字体磅值到精准首行缩进

1. 为什么你的首行缩进总是不准确? 很多开发者第一次用python-docx处理段落缩进时,都会遇到这样的困惑:明明设置了固定缩进值(比如0.74厘米),为什么在不同文档里效果天差地别?这个问题我当年也踩…...

Data for AI:取之有度,用之有节!从Harness视角破解Agent应用Token爆炸难题

OpenClaw的流行与Token爆炸OpenClaw的流行最近大家见面免不了都要问一句:你养龙虾了吗?这里的“龙虾”,指的正是近期爆火的开源AI Agent框架OpenClaw。自2025年11月发布以来,OpenClaw在GitHub上已经获得了超过35万星标和超过7万fo…...

如何在 Pandas 中安全地对非空 DataFrame 执行行级操作

本文详解如何在 Pandas 中判断 DataFrame 是否为空,并在行级处理(如 apply 或迭代)中避免对空数据执行无效操作,重点推荐 iterrows() 空值前置校验的稳健方案。 本文详解如何在 pandas 中判断 dataframe 是否为空,并在…...

php怎么用各类ai做用户画像_标签体系构建【操作】

PHP调用大模型API做用户行为打标需预处理、结构化封装与异步调度,而非直传原始日志;须清洗文本、切分语义单元、强制JSON输出格式;校验标签值是否在预设数组内,统一小写下划线;并发时用进程/协程限流并状态管理&#x…...

从ResNet到实战:MSTAR SAR图像目标分类的完整实现与调优

1. MSTAR数据集与SAR图像特性解析 MSTAR数据集作为合成孔径雷达(SAR)图像领域的标杆数据集,自1990年代发布以来一直是军事目标识别研究的黄金标准。这个由美国空军实验室采集的数据集包含10类地面军事车辆的SAR图像,每类目标在不同…...

别再写if-elseif-else了!Matlab里这5个坑,新手程序员踩过几个?

别再写if-elseif-else了!Matlab里这5个坑,新手程序员踩过几个? 刚接触Matlab时,我总以为条件语句不过是if-else的简单组合——直到某次调试让我对着屏幕怀疑人生。为什么明明逻辑正确的代码就是跑不出预期结果?为什么看…...

好用的东莞高新技术企业认定哪个公司好

在东莞,高新技术企业认定服务市场竞争激烈,众多企业都在寻求专业可靠的服务机构来助力自己成功认定。那么,哪家公司在这方面表现出色呢?接下来,我们就来深入探讨一下。选择高新技术企业认定服务公司的关键因素专业能力…...

怎么在MongoDB中实现动态轮换证书(Certificate Rotation)而不停机

证书轮换时连接中断的根本原因是客户端不主动检查证书变更,仅初始握手验证,复用旧连接导致新旧证书混用;必须通过关闭连接池并重建实现热更新。证书轮换时连接中断的根本原因MongoDB 客户端(比如 pymongo 或 mongodb-driver-node&…...

bootstrap怎么实现带有验证状态的表单

需手动在表单控件(input/select/textarea)上添加 is-valid 或 is-invalid 类,并紧邻放置 valid-feedback 或 invalid-feedback 元素作为下一个兄弟节点,配合 blur 或 submit 事件触发验证逻辑。怎么给 Bootstrap 表单控件加 is-va…...

从写代码到问问题:2026年,AI如何重构数据科学工作流(七)

2026年初,腾讯云智能体平台在公积金业务里跑通了一个“边聊边办”的场景。用户随便丢一句“我去年缴存了多少?”,系统三分钟就能甩出一份结构化报告。换成以前,光是拉数据、写清洗逻辑、调格式,至少得耗上十五分钟。这…...

如何3分钟搞定网易云音乐NCM文件转换:ncmdumpGUI完整指南

如何3分钟搞定网易云音乐NCM文件转换:ncmdumpGUI完整指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐下载的NCM加密文件无法在…...

CefFlashBrowser完整指南:在2025年完美运行Flash内容的终极解决方案

CefFlashBrowser完整指南:在2025年完美运行Flash内容的终极解决方案 【免费下载链接】CefFlashBrowser Flash浏览器 / Flash Browser 项目地址: https://gitcode.com/gh_mirrors/ce/CefFlashBrowser 你是否还记得那些经典的Flash游戏和互动课件?当…...

2026论文查AI率渠道降AI工具实测指南「收藏备用」

近年毕业的同学一定要留意:学位法已明确将不当使用人工智能写作纳入学术不端范畴。现在的毕业论文审核,除了传统重复率要求,还必须附上AIGC检测报告,要是AI率超标,轻则被要求退回重改,严重的还会影响学位授…...

2025必备!5款免费AI论文检测工具实测,低查重高原创一站搞定

本文整理了目前学术场景下实用性拉满的AI论文辅助工具,覆盖AIGC检测、降重、降AI率全流程需求,帮你轻松应对论文查重与AI检测双重关卡。 在学术研究与论文写作过程中,内容原创性、无抄袭风险是最基础的要求。近年来随着AI写作工具的普及&…...

**发散创新:基于Python与ROS的机器人运动控制实战解析**在现代机器人系统开发中,*

发散创新:基于Python与ROS的机器人运动控制实战解析 在现代机器人系统开发中,运动控制是实现精准动作的核心环节。本文将以 Python ROS(Robot Operating System) 为技术栈,深入剖析如何通过编程语言完成对差速驱动机器…...

SpringSecurity 权限控制:从登录到接口鉴权实战

在Java后端开发领域,安全控制是永远绕不开的话题。无论是企业内部的管理系统,还是对外的RESTful API,我们都需要解决两个核心问题:你是谁?(认证) 和 你能干什么?(授权&am…...

Redis 缓存穿透、击穿、雪崩解决方案

在互联网高并发场景下,Redis 作为缓存层已经成为系统性能的核心命脉。然而,当缓存层遭遇异常情况时,原本作为“盾牌”的缓存可能瞬间变成系统崩溃的导火索。在业界,有三个经典的缓存问题被称为“三大杀手”——缓存穿透、缓存击穿…...

2026年大模型学习指南|小白/程序员必看收藏,抢占AI高薪赛道

ChatGPT的横空出世,彻底点燃了全球AI大模型的发展热潮,2023年作为AI元年开启了行业新篇章,而历经三年迭代,2026年的AI大模型已正式迈入“工业级应用深化期”,从实验室走向千行百业,深度融入大众生活与职场办…...

更高层次的语言都是建立在C语言的基础之上吗?

更高层次的语言都是建立在C语言的基础之上吗?更高层次的语言的标准库(基础库)都是建立在C语言的标准库(基础库)基础之上吗 注意,问题有两个部分: 一是语言本身是否建立在C基础上, 二是标准库是否建立在C标准库基础上。 需要区分&a…...

智能代码生成错误检测与修复(工业级误报率<0.8%的闭环系统大公开)

第一章:智能代码生成错误检测与修复 2026奇点智能技术大会(https://ml-summit.org) 现代大语言模型驱动的代码生成工具(如Copilot、CodeWhisperer)在提升开发效率的同时,也引入了新型语义错误、上下文不一致及安全漏洞等隐蔽缺陷…...

安装宝塔面板提示权限不足_使用root用户进行规范安装

...