当前位置：首页 > news >正文

pytorch车牌识别

news 2026/3/27 2:54:06

使用pytorch库中CNN模型进行图像识别

收集数据集

可以去找开源的数据集或者自己手做一个
最终整合成 类别分类的图片文件
在这里插入图片描述

定义CNN模型

卷积层

功能：提取特征

概念：

卷积层输入层通道数

如果输入数据是彩色图像，那么通常情况下，输入数据具有三个通道（红、绿、蓝），因此第一个卷积层的输入通道数应该为3。
如果输入数据是灰度图像，那么输入通道数通常为 1。

卷积层输出层通道数

卷积层的输出通道数控制着该层提取的特征的数量和复杂度。更多的输出通道意味着网络可以学习更多种类的特征，但过多的输出通道数会导致复杂度和过拟合。

池化层

功能：使卷积层的特征更加明显，对图像进行降维压缩(舍弃无关特征，避免过拟合)，提高神经网络的泛华能力。
问题：

最大池化操作

最大池化操作是一种常用的池化操作，用于减少特征图的空间维度并保留最重要的特征信息

# 定义最大池化层，池化窗口大小为 2x2，步幅为 2
max_pool_layer = nn.MaxPool2d(kernel_size=2, stride=2)

全连接层

将特征进行整合，然后归一化，对各种分类情况都输入一个概率，根据概率进行分类

CNN模型代码

import os
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
from PIL import Image
from torchvision.datasets import ImageFolder
from torch.utils.data import DataLoader, Dataset
# 进度条工具
from tqdm import tqdm# 数据集中的类别数
num_classes = len(os.listdir('./数据集'))
# 训练的轮数
num_epochs = 10
# 30次：['陕', '陕', 'U', 'U', '6', '6', '6', '6']
# 10次：['陕', 'A', 'D', '0', '6', '6', '6', '6']# 一、定义数据预处理和数据加载器
transform = transforms.Compose([# 固定图像大小transforms.Resize((64, 64)),# 将图像转换为灰度图像transforms.Grayscale(),# 将图像转换为张量transforms.ToTensor(),
])
# 使用ImageFolder定义数据集，标签为序号
train_dataset = ImageFolder(root='./数据集', transform=transform)
# 数据加载器,每个批次包含32张图像
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)# 二、定义 CNN 模型
class CNNModel(nn.Module):def __init__(self):super(CNNModel, self).__init__()# 卷积层1  1代表单通道，黑白；32代表输出通道；3代表3*3的卷积核， 1代表在最外围补一圈0self.conv1 = nn.Conv2d(in_channels=1, out_channels=32, kernel_size=3, padding=1)# 池化层1  最大池化操作，2代表尺寸减半self.pool = nn.MaxPool2d(kernel_size=2, stride=2)# 卷积层2 ,32对于卷积层1的输出通道数self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)# 全连接层 64输出通道数，16*16代表压缩后的尺寸，生成长度128向量self.fc1 = nn.Linear(64 * 16 * 16, 128)self.fc2 = nn.Linear(128, num_classes)# 前向传播 返回输出结果def forward(self, x):# 卷积1x = self.conv1(x)# 激活函数/激化函数 引入非线性变化,增强神经网络复杂性x = torch.relu(x)# 池化x = self.pool(x)x = self.pool(torch.relu(self.conv2(x)))x = x.view(-1, 64 * 16 * 16)x = torch.relu(self.fc1(x))x = self.fc2(x)return x# 三、初始化模型、损失函数和优化器
model = CNNModel()
criterion = nn.CrossEntropyLoss()
# 学习率一般设0.01
optimizer = optim.SGD(model.parameters(), lr=0.01)# 四、只要当主文件运行时候，才训练模型
if __name__ == "__main__":for epoch in range(num_epochs):running_loss = 0.0print(f'Epoch : {epoch + 1}/{num_epochs}')# 显示每轮的进度条for images, labels in tqdm(train_loader):#  将优化器中存储的之前计算的梯度归零optimizer.zero_grad()# 将输入图像数据 images 输入到模型中进行前向传播，得到模型的输出outputs = model(images)# 损失函数 criterion 计算模型 输出 与 真实标签 之间的损失值。loss = criterion(outputs, labels)# 对损失值进行反向传播，计算模型参数的梯度loss.backward()# 据优化算法(梯度下降)更新模型参数，最小化损失函数optimizer.step()running_loss += loss.item()# 输出每个 epoch 的平均损失epoch_loss = running_loss / len(train_loader)print(f'Epoch {epoch + 1} loss: {epoch_loss:.4f}')# 保存模型torch.save(model.state_dict(), 'cnn_model.pt')

使用模型

import torch
from PIL import Image
from torch.utils.data import dataset
from cnn_model import transform, train_dataset, CNNModel# 加载整个模型
model = CNNModel()
# 将模型设置为评估模式
model.eval()
checkpoint = torch.load('./cnn_model.pt')
model.load_state_dict(checkpoint)# 使用模型进行预测，识别单个文字图片
def predict_image(image_path):image = Image.open(image_path)# 转换图片格式image = transform(image)# 只进行前向传播with torch.no_grad():output = model(image)# ImageFolder输出的标签是文件序号，argmax找到张量output中的最大值predicted_idx = torch.argmax(output).item()print(predicted_idx)# 将输出转换成对应序号的文件名if predicted_idx < len(train_dataset.classes) :predicted_label = train_dataset.classes[predicted_idx]return predicted_labelelse:return "null"

pytorch车牌识别

目录使用pytorch库中CNN模型进行图像识别收集数据集定义CNN模型卷积层池化层全连接层 CNN模型代码使用模型使用pytorch库中CNN模型进行图像识别收集数据集可以去找开源的数据集或者自己手做一个最终整合成类别分类的图片文件定义CNN模型卷积层功能：提…...

编程日记 2024/4/14 5:22:59

【C++入门】内联函数、auto与基于范围的for循环

💞💞 前言 hello hello~ ，这里是大耳朵土土垚~💖💖 ，欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 💥个人主页&#x…...

编程日记 2024/4/14 5:21:58

服务器停用，备份服务文件。

文章目录引言I 文件备份1.1 数据库文件/证书1.2 redis1.3 nacosII JAVA流水线备份2.1 java构建2.2 镜像构建2.3 docker 部署2.4 子模块构建2.5 Dockerfile_prodIII VUE项目流水线备份3.1 Node.js 构建3.2 Dockerfile_prod...

编程日记 2024/4/14 5:19:57

基于Python的深度学习的中文情感分析系统（V2.0），附源码

博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…...

编程日记 2024/4/14 5:18:55

使用Postman发送跨域请求实验

使用Postman发送跨域请求 1 跨域是什么？2 何为同源呢?3 跨域请求是如何被检测到的？4 Postman跨域请求测试4.1 后端准备4.2 测试用例4.2.1 后端未配置跨域请求(1) 前端不跨域（2）前端跨域 4.2.2 后端配置跨域信息（1&…...

编程日记 2024/4/14 5:17:54

4、jvm-垃圾收集算法与垃圾收集器

垃圾收集算法分代收集理论当前虚拟机的垃圾收集都采用分代收集算法，这种算法没有什么新的思想，只是根据对象存活周期的不同将内存分为几块。一般将java堆分为新生代和老年代，这样我们就可以根据各个年代的特点选择合适的垃圾收集算法。比如…...

编程日记 2024/4/14 5:14:50

[Excel]如何限制儲存格輸入格式? 以“字首為英文字母大寫，其餘為數字，共15碼“為範例

[Excel]如何限制儲存格輸入格式需求: 當一個excel表格需要由多位使用者來輸入資料時，難免會出現資料輸入錯誤問題，尤其是料號，品號或是訂單號的長類型編碼。若是問題屬於輸入錯誤"資料"但格式未錯誤，則可能需要讓exce…...

编程日记 2024/4/14 5:13:49

错题记录-华为海思

华为海思数字芯片参考 ：FPGA开发/数字IC笔试系列(5) 华为海思IC笔试解析 FPGA开发/数字IC笔试系列(6) 华为海思IC笔试解析 SystemVerilog Function与Task的区别 $readmemh与$readmemb这两个系统任务是用来从指定文件中读取数据到寄存器数组或者RAM、ROM中。除了…...

编程日记 2024/4/14 5:12:48

rspack 使用构建vue3脚手架

基于 Rust 的高性能 Web 构建工具。rspack 主要适配 webpack 生态，对于绝大多数 webpack 工具库都是支持的。启动速度快；增量热更新快。兼容 webpack 生态；内置了 ts、jsx、css、css modules 等开箱即用。生产优化，tree shaking…...

编程日记 2024/4/14 5:11:47

maven之pom中的build标签

1、build标签分类 1.1、全局配置（project build） 针对整个项目的所有情况都有效。 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"htt…...

编程日记 2024/4/14 5:10:46

Cesium.js--》探秘Cesium背后的3D模型魔力—加载纽约模型

今天简单实现一个Cesium.js的小Demo，加强自己对Cesium知识的掌握与学习，先简单对这个开源库进行一个简单的介绍吧！ Cesium 是一个开源的地理空间可视化引擎，用于创建基于 Web 的三维地球应用程序。它允许开发人员在网页上呈现高度…...

编程日记 2024/4/14 5:09:45

.NET i18n 多语言支持与国际化

环境 WIN10 VS2022 .NET8 1.👋创建项目 2.👀创建Resources Controllers HomeController.en.resx HomeController.fr.resx HomeController.zh.resx 3.🌱Program.cs添加国际化支持 // 添加国际化支持 builder.Services.AddLocalization(…...

编程日记 2024/4/14 5:08:44

基于Pytorch实现图像分类——基于jupyter

分类任务网络基本构建与训练方法，常用函数解torch.nn.functional模块nn.Module模块 MNIST数据集下载 from pathlib import Path import requestsDATA_PATH Path("data") PATH DATA_PATH / "mnist"PATH.mkdir(parentsTrue, exist_okTrue)U…...

编程日记 2024/4/14 5:07:43

1.F12 打开开发者工具窗口 2.console下输入命令 (function(){$("#side").remove();$("#comment_title, #comment_list, #comment_bar, #comment_form, .announce, #ad_cen, #ad_bot").remove();$(".nav_top_2011, #header, #navigator").remove…...

编程日记 2024/4/14 5:05:38

面试经典150题——删除有序数组中的重复项

面试经典150题 day3 题目来源我的题解方法一双指针题目来源力扣每日一题；题序：26 我的题解方法一双指针使用两个指针分别指向相同元素的左右边界，再利用一个count记录最终需要的数组长度。时间复杂度：O(n) 空间复杂度&a…...

编程日记 2024/4/14 5:03:36

Unity3D知识点精华浓缩

一、细节 1、类与组件的关系 2、Time.deltaTime的含义 3、怎么表示一帧的移动距离 4、Update和LateUpdate的区别和适用场景 5、找游戏对象的方式（别的对象 / 当前对象的子对象） 6、组件1调用组件2中方法的方式 7、在面板中获取外部数据的方法 8、序列化属…...

编程日记 2024/4/14 5:02:35

HTML的文档说明

1.告诉浏览器当前网页的版本 2.写法： ！以前的写法：要依据网页的HTML的版本去确定，紫萼发油很多很多。具体的写法可以参考：W3C官网的文档说明 ！新写法：W3C都推荐用h5的写法 <DOCTYPE ht…...

编程日记 2024/4/14 5:01:34

ubuntu 更新或更改GCC/G++

最近遇到一些问题，需要用到gcc-9/g-9，但是我自带的ubuntu18.04是gcc-7.5/g-7.5，所以升级一下，奈何文章太多而且很多无效，所以在此记录一下： 参考：https://stackoverflow.com/questions/19836858…...

编程日记 2024/4/14 5:00:32

Java --- Java语言基础

这个Java可是个好东西，是一门面对对象的程序设计语言，其语法很类似C，所以学过C的伙伴们就很好上手，另外Java对C进行了简化与提高，这个在后期学习会感受到，Java还有很多的类库API文档以及第三方开发包。这…...

编程日记 2024/4/14 4:59:31

【C++算法竞赛 · 图论】图的存储

前言图的存储邻接矩阵方法复杂度应用例题题解邻接表方法复杂度应用前言上一篇文章中（【C算法竞赛图论】图论基础），介绍了图论相关的概念和一种图的存储的方法，这篇文章将会介绍剩下的两种方法&#xff…...

编程日记 2024/4/14 4:55:27

SpeedyStepper Forked：嵌入式步进电机硬实时控制库解析

1. SpeedyStepper Forked：面向嵌入式实时控制的高性能步进电机驱动库深度解析1.1 库定位与工程价值SpeedyStepper Forked 是一个专为嵌入式平台（尤其是基于Arduino生态的MCU）设计的轻量级、高精度步进电机运动控制库。其核心目标并非提供图形…...

编程新知 2026/3/27 2:46:46

智能家居控制中心：OpenClaw桥接Qwen3-32B-Chat与HomeAssistant

智能家居控制中心：OpenClaw桥接Qwen3-32B-Chat与HomeAssistant 1. 为什么需要AI驱动的家居控制中心去年冬天的一个深夜，我被空调异常制热的噪音惊醒。摸黑在手机APP上反复调整参数无果后，突然意识到：如果有个能理解自然语言的智…...

编程新知 2026/3/27 2:44:46

基于comsol的三相电力变压器电磁场与电路耦合计算的电压电流及磁通密度分布分析

comsol三相电力变压器电磁场和电路耦合计算，可以得到变压器高低压绕组电压电流分布以及变压器磁通密度分布三相电力变压器建模这事儿，说难不难说简单也不简单。前两天用COMSOL折腾了个带电路耦合的模型，顺手把绕组电流分布和铁芯磁通都摸清楚…...

编程新知 2026/3/27 2:38:45

HTML网页元素中的图片和超链接

哈哈哈，又来更新我这一周里面新学的web前端开发技术啦！今天我将与大家分享网页元素中的图片和超链接。一.图像的应用HTML中加入图片有3种不同的路径：1.绝对路径：是指互联网上唯一且完整的地址，用来精准定位资源。绝对路…...

编程新知 2026/3/27 1:50:35

AceMenu：嵌入式轻量级菜单框架设计与实践

1. AceMenu 库概述：面向嵌入式人机交互的轻量级菜单框架AceMenu 是一个专为资源受限嵌入式系统设计的轻量级、可移植菜单管理库。其核心设计哲学是“以最少的硬件资源开销，实现最直观的用户导航体验”。不同于通用 GUI 框架（如 LVGL 或 Touch…...

编程新知 2026/3/27 1:05:41

摆脱论文困扰!高效论文写作全流程AI论文写作软件推荐（2026 最新）

论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节，2026年AI论文写作软件按环节精准匹配，兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求，覆盖免费/付费、通用/垂直场景…...

编程新知 2026/3/27 0:37:33

Qwen3.5-35B-A3B-AWQ-4bit开源镜像实战：法律合同关键条款图示定位与文本提取

Qwen3.5-35B-A3B-AWQ-4bit开源镜像实战：法律合同关键条款图示定位与文本提取 1. 引言：当AI遇到法律合同想象一下，你是一位法务人员，面前摆着一份长达50页的PDF合同。老板急着要你找出所有关于“违约责任”的条款，并…...

编程新知 2026/3/27 0:35:33

PlayCover终极指南：三步在Mac上畅玩iOS游戏与应用

PlayCover终极指南：三步在Mac上畅玩iOS游戏与应用【免费下载链接】PlayCover Community fork of PlayCover 项目地址: https://gitcode.com/gh_mirrors/pl/PlayCover 还在为心爱的iOS游戏无法在Mac上体验而烦恼吗？PlayCover为你打开了一扇全新的…...

编程新知 2026/3/26 23:55:17

贝叶斯岭回归实战：用Python搞定金融数据预测（附完整代码）

贝叶斯岭回归实战：用Python搞定金融数据预测（附完整代码） 金融市场的波动性一直是投资者和分析师关注的焦点。在瞬息万变的股票市场中，能够准确预测价格走势意味着巨大的商业价值。传统的时间序列分析方法如ARIMA虽然经典&#xf…...

编程新知 2026/3/26 22:22:18

PX4飞控开发实战指南：从环境搭建到自主飞行

PX4飞控开发实战指南：从环境搭建到自主飞行【免费下载链接】PX4-Autopilot PX4 Autopilot Software 项目地址: https://gitcode.com/gh_mirrors/px/PX4-Autopilot 一、认知铺垫：无人机大脑如何工作？ 你是否好奇无人机如何在空中保持…...

编程新知 2026/3/26 21:23:57

目录