当前位置: 首页 > news >正文

使用yolov5和强化学习训练一个AI智能欢乐斗地主(一)

这里写自定义目录标题

  • 项目介绍
    • 项目过程介绍
    • 训练yolov5目标检测斗地主
      • 收集数据集
      • yolov5调参

项目介绍

你好! 欢迎阅读我的文章,本章将介绍,如何使用yolov5和强化学习训练一个AI斗地主,本项目将分为三个部分,其中包含(yolov5目标检测,pyqt5页面搭建,强化学习训练出牌)。为什么会做这个项目呢,主要是出于作者本人感兴趣,我也喜欢打牌,即使这个项目可能在多数项目看来,显得多此一举或者有点笨拙,整个过程,主要是用来体验项目并且学习了,如果你有其他意见或者更好的想法可以联系作者,再次感谢您阅读我的文章。

项目过程介绍

我暂时对整体的AI斗地主做了一个规划,这里我以微信小程序天天斗地主为例,使用yolov5训练斗地主画面的每张扑克牌,识别出所有扑克牌后,通过分析地主、地主上家、地主下家出的牌,进行强化学习,来教AI打牌,整个过程由pyqt5可视化界面展示实现,具体分为以下步骤。

  1. 收集斗地主数据集,yolov5进行训练
  2. 获取小游戏句柄,初步测试目标检测成果
  3. 编写GUI,实时控制整个程序
  4. 通过目标检测结果,编写记牌器,编写上家下家出牌规则
  5. 训练DOUZERO强化学习
  6. 通过上下家出牌规则,调用DOUZERO强化学习出牌
  7. 完善整个程序,进行最终测试

训练yolov5目标检测斗地主

整个AI斗地主分为三部分,yolov5检测斗地主的扑克牌,Douzero强化学习斗地主,pyqt5编写最终界面,本文只讲第一部分

收集数据集

收集斗地主数据集的过程不算复杂困难,但相对无聊枯燥耗时,收集数据集采用最传统的方法,通过一局对局截取一张图片的方式,如下图
在这里插入图片描述
截图存储到本地后,使用labelimg才进行标注,如果不了解labelimg,这里引用一下别的文章:labelimg从安装到使用详解 labelimg就是一个标注工具而已,如下图,将每一张扑克牌都标注好即可
在这里插入图片描述
这里需要注意收集的数据集数量, 经过我本人测试,我收集了100张图片,注意,即使只有100张图片,每一张图片仍然包含多达二三十个标注,其中同一个扑克牌类别最多出现7次(包括最上方会显示的三张地主牌),100张本质上来说不算特别少,经过yolov5训练后, 再放到小程序上进行测试,经观察,仍然有95%的准确率,但这是远远不够的,因为即使一张扑克牌的识别错误,将导致后期整个强化学习,到出牌过程都会决策失败

最后,保存的数据集文件夹如下图所示,这里不仅限于天天斗地主,将其他类型的斗地主标注好后,也可以一起进行训练。

在这里插入图片描述

yolov5调参

yolov5是一个使用pytorch编写的目标检测框架,通过yolov5的训练,最后我们可以知道哪张扑克牌在哪个位置,通过程序编写出牌区域的区分,可以检测区分出地主、地主下家、地主上家,三家的轮流出牌过程,到这一步,其实已经可以做一个记牌器了,如果到这里,你不太了解yolov5是啥的话,这里我推荐几个博客与官方github链接

YOLOv5网络详解
YOLOv5官方github
YOLOv5参数介绍

这里主要是看我的配置参数的一些文件,数据集标签配置如下(其中包含:1-k小王、大王、地主、农民、闹钟、连对、顺子、飞机、炸弹、火箭):
在这里插入图片描述
train.py 这里不做过多介绍,只要了解过yolov5,并根据自身情况训练就行
数据集少的情况下,大概,一两千次即可完成训练,最后展示一下,我用pyqt5写出来的yolov5检测出来的训练结果。
下篇介绍pyqt5界面搭建过程

在这里插入图片描述

相关文章:

使用yolov5和强化学习训练一个AI智能欢乐斗地主(一)

这里写自定义目录标题项目介绍项目过程介绍训练yolov5目标检测斗地主收集数据集yolov5调参项目介绍 你好! 欢迎阅读我的文章,本章将介绍,如何使用yolov5和强化学习训练一个AI斗地主,本项目将分为三个部分,其中包含&am…...

C++ 浅谈之 AVL 树和红黑树

C 浅谈之 AVL 树和红黑树 HELLO,各位博友好,我是阿呆 🙈🙈🙈 这里是 C 浅谈系列,收录在专栏 C 语言中 😜😜😜 本系列阿呆将记录一些 C 语言重要的语法特性 &#x1f3…...

【Kotlin】Kotlin函数那么多,你会几个?

目录标准函数letrunwithapplyalsotakeIftakeUnlessrepeat小结作用域函数的区别作用域函数使用场景简化函数尾递归函数(tailrec)扩展函数高阶函数内联函数(inline)inlinenoinlinecrossinline匿名函数标准函数 Kotlin标准库包含几个…...

饲养员喂养动物-课后程序(JAVA基础案例教程-黑马程序员编著-第四章-课后作业)

【案例4-2】饲养员喂养动物 记得 关注,收藏,评论哦,作者将持续更新。。。。 【案例目标】 案例描述 饲养员在给动物喂食时,给不同的动物喂不同的食物,而且在每次喂食时,动物都会发出欢快的叫声。例如&…...

数据分析:消费者数据分析

数据分析:消费者数据分析 作者:AOAIYI 创作不易,如果觉得文章不错或能帮助到你学习,记得点赞收藏评论一下哦 文章目录数据分析:消费者数据分析一、前言二、数据准备三、数据预处理四、个体消费者分析五、用户消费行为总…...

Transformer论文阅读:ViT算法笔记

标题:An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 会议:ICLR2021 论文地址:https://openreview.net/forum?idYicbFdNTTy 文章目录Abstract1 Introduction2 Related Work3 Method3.1 Vision Transformer3.2…...

Android基础练习解答【2】

文章目录一 填空题二 判断题三 选择题四 简答题一 填空题 1.除了开启开发者选项之外,还需打开手机上的 usb调试 开关,然后才能在手机上调试App。 2.App开发的两大技术路线包括 _原生开发_和混合开发。 3.App工程的编译…...

k8s 搭建

需求:搭建k8s 为后续自动部署做准备进程:安装至少两个ubuntu18.04系统(一个master 一到多个 node)每个系统上都要装上docker 和 kubernetes安装dockersudo su apt-get update#安装相关插件 apt-get install apt-transport-https c…...

安全运维之mysql基线检查

版本加固 选择稳定版本并及时更新、打补丁。 稳定版本:发行6-12个月以内的偶数版本。 检查方法: 使用sql语句:select version(); 检查结果: 存在问题:当前数据库版本较老需要更新 解决方案:前往http://www.mysql…...

跨境电商卖家敦煌、雅虎、乐天、亚马逊测评自养号的重要性!

作为亚马逊、敦煌、乐天、雅虎等跨境的卖家,这两年以来,面对流量越来越贵的现实,卖家需要更加珍惜每次访问listing页面的流量,把转化做好,把流量尽可能转化为更多的订单。 提升转化率的技巧 提升产品转化率&#xff0…...

Python 之 Matplotlib xticks 的再次说明、图形样式和子图

文章目录一. 改变 x 轴显示内容 xticks 方法再次说明1. x 轴是数值型数据2. 将 x 轴更改为字符串3. 总结二. 其他元素可视性1. 显示网格:plt.grid()2. plt.gca( ) 对坐标轴的操作三. plt.rcParams 设置画图的分辨率,大小等信息四. 图表的样式参数设置1. …...

3.InfluxDB WEB使用

结合telegraf做指标数据收集 点击 Load Data -> Telegraf 配置界面 influxDB支持在WEB-UI中生成配置文件 然后利用telegraf通过远程URL请求的方式进行获取 点击CREATE CONFIGURATION 创建telegraf配置文件 选择Bucket InfluxDB提供了很多配置好的监控模板供用户选择 可以…...

git冲突合并

一、版本说明 dev:本地仓库中的dev分支 master:本地仓库中的master分支 remotes/origin/master和origin/master:都是远程仓库上的master分支 二、一个解决冲突的常规流程 1、前提条件:不能在master分支上修改任何文件。master分支…...

项目自动化构建工具make/Makefile

目录 make/Makefile概念和关系 make/Makefie的使用 一个工程中的源文件不计数,其按类型、功能、模块分别放在若干个目录中,makefile定义了一系列的规则来指定,哪些文件需要先编译,哪些文件需要后编译,哪些文件需要重…...

双目客流统计方案的应用原理

双目客流统计客流摄像头采用立体视觉技术实现高度统计功能。基于视差原理。利用双镜头摄取的两幅图像的视差,构建三维场景,在检测到运动目标后。通过计算图像对应点间的位置偏差。获取目标的三维信息,在深度图像中对目标的检测与追踪&#xf…...

python魔术方法(二)

__getattr__() class A:def __getattr__(self,name):print(f"getting {name}")raise AttributeErroro A() print(o.test)程序调用一个对象的属性,当这个属性不存的时候希望程序做些什么,这里我们打印希望的属性,并且抛出异常 __…...

cmd for命令笔记

语法 help for输出如下: 对一组文件中的每一个文件执行某个特定命令。 FOR %variable IN (set) DO command [command-parameters] %variable 指定一个单一字母可替换的参数。 (set) 指定一个或一组文件。可以使用通配符。 command 指定对每个文件执行的命令。 c…...

4.1 Filter-policy

1. 实验目的 熟悉Filter-policy的应用场景掌握Filter-policy的配置方法2. 实验拓扑 Filter-policy实验拓扑如图4-5所示: 图4-5:Filter-policy 3. 实验步骤 (1) 网络连通性 R1的配置 <Huawei>system-vi…...

day15_常用类

今日内容 上课同步视频:CuteN饕餮的个人空间_哔哩哔哩_bilibili 同步笔记沐沐霸的博客_CSDN博客-Java2301 零、 复习昨日 一、作业 二、代码块[了解] 三、API 四、Object 五、包装类 六、数学和随机 零、 复习昨日 抽象接口修饰符abstractinterface是不是类类接口属性正常属性没…...

【网络原理5】IP协议篇

目录 IP协议报头 4位版本号 4位首部长度 8位服务类型(TOS) 16位总长度 IP拆包 16位标识、3位标志、13位片偏移​编辑 8位生存时间(TTL) 8位协议 16位首部校验和 网络地址管理 32位源ip&32位目的ip 方案一:动态分配ip地址 方案2:NAT网络地址转换(使用一个ip代…...

Midjourney输出≠成品!树莓派自动裁切+水印+背胶封装印相工作流(附GitHub开源项目+硬件BOM清单)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Midjourney输出≠成品&#xff01;树莓派自动裁切水印背胶封装印相工作流&#xff08;附GitHub开源项目硬件BOM清单&#xff09; Midjourney生成的高分辨率图像只是创作起点&#xff0c;真正交付实体印…...

别再只会用Matplotlib画基础热力图了!这5个高级定制技巧让你的图表更专业

别再只会用Matplotlib画基础热力图了&#xff01;这5个高级定制技巧让你的图表更专业 热力图是数据可视化中最直观的展示方式之一&#xff0c;但大多数数据分析师止步于基础用法。当你的图表需要出现在学术论文、商业报告或投资人演示中时&#xff0c;默认参数生成的热力图往往…...

黑莓印相≠复古滤镜!基于CIE Lab色域分析的Midjourney色彩空间偏移校准方案(附Python验证脚本)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;黑莓印相≠复古滤镜&#xff01;基于CIE Lab色域分析的Midjourney色彩空间偏移校准方案&#xff08;附Python验证脚本&#xff09; 黑莓印相&#xff08;Blackberry Print Tone&#xff09;常被误认为是…...

Casbin Talent 2026:高校开发者开源进阶与工业级项目实战指南

1. 项目概述&#xff1a;Casbin Talent 2026&#xff0c;一个为高校开发者量身定制的开源进阶通道如果你是一名在校大学生&#xff0c;对开源世界充满好奇&#xff0c;渴望在真实的工业级项目中打磨技术&#xff0c;但又觉得像Google Summer of Code&#xff08;GSoC&#xff0…...

别再硬怼tabular了!用LaTeX的minipage环境搞定不规则子图排版(附代码对比)

LaTeX排版革命&#xff1a;用minipage环境实现不规则子图的高效布局 在学术写作和技术文档中&#xff0c;图片排版常常成为LaTeX用户的痛点。当遇到需要将不同尺寸的子图组合成一个整体时&#xff0c;传统方法往往陷入复杂的表格嵌套和间距调整的泥潭。本文将介绍一种更优雅的解…...

GTA5线上小助手:终极免费工具完整使用指南,快速提升游戏体验

GTA5线上小助手&#xff1a;终极免费工具完整使用指南&#xff0c;快速提升游戏体验 【免费下载链接】GTA5OnlineTools GTA5线上小助手 项目地址: https://gitcode.com/gh_mirrors/gt/GTA5OnlineTools 想要在《侠盗猎车手5》线上模式中摆脱繁琐操作&#xff0c;享受更流…...

Go语言屏幕自动化工具Rizzler:基于计算机视觉的RPA实践指南

1. 项目概述&#xff1a;一个能“读懂”你屏幕的智能助手最近在折腾一个挺有意思的开源项目&#xff0c;叫ghuntley/rizzler。乍一看这个名字&#xff0c;可能有点摸不着头脑&#xff0c;但如果你对自动化、RPA&#xff08;机器人流程自动化&#xff09;或者屏幕交互脚本感兴趣…...

AI相册搜索效率提升300%?Gemini驱动的Google Photos智能检索全解析,含实测对比数据与隐私边界警告

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;AI相册搜索效率提升300%&#xff1f;Gemini驱动的Google Photos智能检索全解析&#xff0c;含实测对比数据与隐私边界警告 Google Photos 近期将 Gemini Pro 1.5 深度集成至其搜索后端&#xff0c;支持…...

利用大语言模型实现数据自动标注:Autolabel 实战指南

1. 项目概述&#xff1a;用大模型自动标注数据&#xff0c;告别人工标注的苦差事 如果你做过机器学习项目&#xff0c;尤其是监督学习&#xff0c;那你一定对数据标注这个环节又爱又恨。爱的是&#xff0c;有了高质量标注数据&#xff0c;模型性能才有保障&#xff1b;恨的是&a…...

电力系统网络安全:从风险认知到威胁建模的实战指南

1. 从日常运维到风险认知&#xff1a;重新审视大容量电力系统的安全基线在能源行业干了十几年&#xff0c;我见过太多同行把大容量电力系统&#xff08;Bulk Energy System, BES&#xff09;的运维简化为“确保别停电”。日常的告警处理、设备巡检、工单流转构成了工作的全部叙…...