当前位置: 首页 > news >正文

2023mathorcup大数据竞赛选题建议及思路

大家好呀,昨天6点2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛开赛,在这里给大家带来初步的选题建议及思路。

注意,本文章只是比较简略的图文讲解,更加详细完整的视频讲解请移步:

2023mathorcup大数据数学建模竞赛选题建议及A题B题思路_哔哩哔哩_bilibili

首先是主基调:

本次mathorcup大数据竞赛AB难度都不低,我个人更推荐小白选择A题,B题看似简单,实际上仅第一问就需要迭代最起码上千次时间序列模型做预测,求解十分繁琐,很容易卡壳,而且想做好是很难的。 A虽然略硬核,但只要有matlab,会最基础的导入数据操作(我会教),直接采用我提取特征数据的代码提取特征然后做机器学习分类预测即可。目前我已经提取了301个图片各自4096个特征,下一步准备降维或者直接进行机器学习分类。 预计28-29日更新A完整成品,B不一定做,具体看需求情况,建议尽量还是选A。

接下来详细讲讲初步思路吧:

赛道A:基于计算机视觉的坑洼道路检测和识别

问题1:结合给出的图像文件,提取图像特征,建立一个识别率高、速度快、分类准确的模型,用于识别图像中的道路是正常或者坑洼。

主要就是提取图像特征嘛,题目给了我们301张图片,看一下:

这些图片的名称本身是包含其是否为坑洼路面的信息的。也就是说后面做机器学习的标签是有的。

那第一步就是提取图像特征了,提取出来特征数据,后面就可以做机器学习分类。提取特征之前,先把图像处理成一样的大小,也就是说像素值要一样,不然我们不太方便采用深度学习算法进行特征提取:

像素值大家可以自由设置,具体怎么设置我在论文里到时候也会教。

之后就是深度学习提取特征:

我提取的特征数量是每个图片4096个,所以一共301*4096:

接下来用户这些特征做机器学习就行,当然了,特征数量太多,因此可能存在过拟合或者计算量过大,也许需要特征降维,这个等我具体训练之后看看精度吧。

给大家送一些部分图片的特征表格,看我文章最下方视频讲解。

问题2:对问题1中构建的模型进行训练,并从不同维度进行模型评估。

用一些指标评估精度,调优就行。

赛道B:电商零售商家需求预测及库存优化问题

问题一:使用附件1-4中的数据,预测出各商家在各仓库的商品2023-05-16至2023-05-30 的需求量,请将预测结果填写在结果表1并上传至竞赛平台,并对你们模型的预测性能进行评价。另外请讨论:根据数据分析及建模过程,这些由商家、仓库、商品形成的时间序列如何分类,使同一类别在需求上的特征最为相似?

B题看似简单,实则做起来会很麻烦。要预测各商家在各仓库的商品需求量,我们来看看数据表格:

35个商家:

1212个商品:

54个仓库:

一个商家-商品-仓库组合才是一个序列,每一个序列都有166个完整的时间数据。

所以,我们需要迭代计算最起码上千个时间序列模型并进行精度计算,这个计算量是非常非常大的,别说新手小白,我自己做起来估计也要很久。必须要有丰富的大数据处理相关经验。

当然了,简化一点的做法就是转化为机器学习模型或者先聚类,然后粗略地把每一类做一个预测,但最标准的做法肯定还是第一种。

之后研究如何分类使得特征需求相似:

两种做法,第一种是根据时间序列的特征进行分类,例如残差大小。

第二种更推荐,那就是根据题目的一些分类做分析。题目的附件2-4给出了商家仓库商品的各种分类信息,我们可以做一下统计,举个例子:

 seller_levelLarge      14.244694Medium      7.682062Small      31.873000Special    14.067908Name: qty, dtype: float64,warehouse _category中心仓 24.151613区域仓 8.616975Name: qty, dtype: float64,warehouse _region东北 3.384538华东 19.891776华中 9.006820华北 10.390700华南 10.989828西北 5.365153西南 6.719487

可以根据这些进行聚类。

OK,b先讲到这里。

AB的思路讲解后续都还会更新哈。总体而言,本次mathorcup大数据竞赛不算简单,推荐大家选择A,我预计29日前更新完整论文哈,B的话看大家需求的情况再定做不做吧。

OK以上只是比较简略的图文版讲解,我目前正在写A题完整论文,后续会更新哈,视频版讲解以及后续完整成品查看和免费资料领取请点击下方我的个人卡片领取↓:

相关文章:

2023mathorcup大数据竞赛选题建议及思路

大家好呀,昨天6点2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛开赛,在这里给大家带来初步的选题建议及思路。 注意,本文章只是比较简略的图文讲解,更加详细完整的视频讲解请移步: 2023mathorcup大数据数学…...

部署vuepress项目到githubPage

部署vuepress项目到githubPage 1. 项目文件夹下有两个分支(main和gh-page) 1.1 main分支存放项目代码 1.2 gh-page分支存放 npm run docs:build之后的dist里面的所有文件 2. 分别提交到github上 3. 你的项目/docs/.vuepress/config.js module.export…...

ORACLE表空间说明及操作

ORACLE 表空间作用 数据存储:表空间是数据库中存储数据的逻辑结构。它提供了用于存储表、索引、视图、存储过程等数据库对象的空间。通过划分数据和索引等对象的存储,可以更好地管理和组织数据库的物理存储结构。性能管理和优化:通过将不同类…...

vue使用Element-plus的Image预览时样式崩乱

🔥博客主页: 破浪前进 🔖系列专栏: Vue、React、PHP ❤️感谢大家点赞👍收藏⭐评论✍️ 问题: 在使用组件库的image时出现了点小问题,预览的图片层级反而没有表格的层级高 效果图:…...

安装使用vcpkg的简易教程

目录 1. 首先安装vcpkg2. 在vcpkg目录下运行bootstrap-vcpkg.bat 命令3. 接着vs进行集成4. 使用vcpkg搜索可用的包5.下载安装所需包6.下载安装完成 1. 首先安装vcpkg 使用git命令下载 git clone https://github.com/Microsoft/vcpkg.git如果下载失败可直接下载文件 (vcpkg-ma…...

制作一个简单的C语言词法分析程序

1.分析组成 C语言的程序中,有很单词多符号和保留字。一些单词符号还有对应的左线性文法。所以我们需要先做出一个单词字符表,给出对应的识别码,然后跟据对应的表格来写出程序 2.程序设计 程序主要有循环判断构成。不需推理即可产生的符号我…...

Java项目中将MySQL改为8.0以上

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容:毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 maven依…...

软考高项-计算题(2)

题4 项目的总预算是包含管理储备的,所以总预算应该是:13238102*360 ETC(BAC-EV)/CPI BAC60 EV60*0.318 CPI18/200.9 ETC42/0.9 答案选择C A 题5 因为题目中提到了“按目前的状况继续发展”,那么是:ETC(BAC-EV)/CPI EV1230*0…...

Centos使用war文件部署jenkins

部署jenkins所需要的jdk环境如下: 这里下载官网最新的版本: 选择jenkins2.414.3版本,所以jdk环境最低得是java11 安装java11环境 这里直接安装open-jdk yum -y install java-11-openjdk.x86_64 java-11-openjdk-devel.x86_64下载jenkins最新…...

数据结构和算法——用C语言实现所有排序算法

文章目录 前言排序算法的基本概念内部排序插入排序直接插入排序折半插入排序希尔排序 交换排序冒泡排序快速排序 选择排序简单选择排序堆排序 归并排序基数排序 外部排序多路归并败者树置换——选择排序最佳归并树 前言 本文所有代码均在仓库中,这是一个完整的由纯…...

吃豆人C语言开发—Day2 需求分析 流程图 原型图

目录 需求分析 流程图 原型图 主菜单: 设置界面: 地图选择: 游戏界面: 收集完成提示: 游戏胜利界面: 游戏失败界面 死亡提示: 这个项目是我和朋友们一起开发的,在此声明一下…...

Nautilus Chain 联合香港数码港举办 BIG DEMO DAY活动,释放何信号?

在今年的 10 月 26 日 9:30-18:30 GMT8 期间,Nautilus Chain 联合香港数码港共同举办了 “BIG DEMO DAY” Web3 项目路演活动,包括Xwinner、Sleek、Tx、All weather、Coral Finance、DBOE、PARSIQ、Hookfi、Parallels、Fintestra 以及 dot.GAMING 等在内…...

手写RPC框架

文章目录 什么是RPC框架RPC框架中的关键点通信协议序列化协议动态代理和反射 目前已有的RPC框架手写RPC框架介绍项目框架项目执行流程项目启动 什么是RPC框架 RPC(Remote Procedure Call,远程过程调用), 简单来说遵循RPC协议的就是RPC框架. …...

音视频常见问题(六):视频黑边或放大

摘要 本文介绍了视频黑边或放大的原因和解决方案。主要原因包括视频分辨率与显示视图尺寸不一致、摄像头采集、美颜滤镜格式兼容和分辨率。为了解决这些问题,开发者可以选择合适的渲染模式、动态调整分辨率、处理视频旋转和使用自定义视频渲染。 即构音视频SDK提供…...

Android笔记(八):基于CameraX库结合Compose和传统视图组件PreviewView实现照相机画面预览和照相功能

CameraX是JetPack库之一,通过CameraX可以向应用增加相机的功能。在下列内容中,将介绍一个结合CameraX实现一个简单的拍照应用。本应用必须采用Android SDK 34。并通过该简单示例,了解传统View层次组件的UI组件如何与Compose组件结合实现移动应…...

【每日一题Day361】LC2558从数量最多的堆取走礼物 | 大顶堆

从数量最多的堆取走礼物【LC2558】 给你一个整数数组 gifts ,表示各堆礼物的数量。每一秒,你需要执行以下操作: 选择礼物数量最多的那一堆。如果不止一堆都符合礼物数量最多,从中选择任一堆即可。选中的那一堆留下平方根数量的礼物…...

【psychopy】【脑与认知科学】认知过程中的面孔识别加工

目录 实验描述 实验思路 python实现 实验描述 现有的文献认为,人们对倒置的面孔、模糊的面孔等可能会出现加工时长增加、准确率下降的问题,现请你设计一个相关实验,判断不同的面孔是否会出现上述现象。请按照认知科学要求,画…...

File类的常用API

判断文件类型 public boolean isDirectory() public boolean isFile() 获取文件信息 public boolean exists() public String getAbsolutePath() public String getPath() 返回创建文件对象时传入的抽象路径的字符串形式 public String getName() public long lastModi…...

02【Git分支的使用、Git回退、还原】

上一篇:01【Git的基本命令、底层命令、命令原理】 下一篇:03【Git的协同开发、TortoiseGit、IDEA的操作Git】 文章目录 02【Git分支的使用、Git回退、还原】一、分支1.1 分支概述1.1.1 Git分支简介1.1.2 Git分支原理 1.2 创建分支1.2.1 创建普通分支1.…...

Qt文件 I/O 操作

一.QFile 文件读取 QIODevice::ReadOnly QString filePath"/home/chenlang/RepUtils/1.txt"; QFile file(filePath); 1.逐行读取 if (file.open(QIODevice::ReadOnly | QIODevice::Text)) {QTextStream in(&file);while (!in.atEnd()) {QString line i…...

OpenClaw资源监控:Qwen3-14b_int4_awq任务执行性能分析

OpenClaw资源监控:Qwen3-14b_int4_awq任务执行性能分析 1. 为什么需要关注OpenClaw资源监控 上周我在本地部署了Qwen3-14b_int4_awq模型,准备用OpenClaw实现自动化内容处理工作流。刚开始运行几个简单任务时一切正常,直到尝试处理一个包含2…...

OpenClaw自动化测试:Gemma-3-12b-it驱动浏览器操作与结果校验

OpenClaw自动化测试:Gemma-3-12b-it驱动浏览器操作与结果校验 1. 为什么选择OpenClawGemma做自动化测试? 上周我在重构一个老旧的Web项目时,遇到了一个典型痛点:前端页面改版后,原有的Selenium测试脚本大面积失效。动…...

主流信道模型对比:从COST207到WINNER II的多场景性能解析

1. 信道模型的前世今生:为什么我们需要这么多标准? 第一次接触信道模型时,我也被各种COST、WINNER之类的缩写搞晕了。这就像去超市买酱油,发现货架上摆着生抽、老抽、海鲜酱油、薄盐酱油...其实它们都是为了解决不同场景下的调味需…...

避开Arduino PID编程的3个常见坑:为什么你的控制总是不稳?

Arduino PID控制实战:避开3个致命陷阱实现精准调节 当你在深夜盯着反复震荡的电机转速曲线,或是加热棒温度始终无法稳定的数据时,是否怀疑过自己复制的PID代码有问题?这不是你的错觉——大多数Arduino PID控制问题都源于三个容易被…...

本地AI模型开发终极指南:从零开始构建智能应用社区

本地AI模型开发终极指南:从零开始构建智能应用社区 【免费下载链接】gallery A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally. 项目地址: https://gitcode.com/GitHub_Trending/gallery44/gallery …...

终极ChatTTS语音合成指南:3分钟搭建本地AI语音系统 [特殊字符]

终极ChatTTS语音合成指南:3分钟搭建本地AI语音系统 🎤 【免费下载链接】ChatTTS-ui 一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthes…...

MySQL后端开发核心知识点

一、存储引擎(只重点 InnoDB)MySQL 5.5 以后默认引擎是 InnoDB,也是现代企业项目唯一使用的引擎。InnoDB 特点:支持 事务支持 行级锁,并发性能好支持 外键(实际开发基本不用)基于 B 树索引结构依…...

EZModbus:面向ESP32的异步无锁Modbus C++库

1. EZModbus项目概述EZModbus是一个专为ESP32平台设计的C Modbus通信库,深度集成FreeRTOS实时操作系统,支持Arduino IDE与原生ESP-IDF两种开发框架。该库并非对现有Modbus协议栈的简单封装,而是从零构建的异步事件驱动型实现,其核…...

实现堆和用堆实现排序数组

什么是堆 就是完全二叉树 前h-1层都是满的 最后一层可以不满,但从左到右必须连续。 逻辑上是链 物理上是数组 首先,实现堆 一、定义一个结构体,用来存3个值 a就是的数组地址 size是有效元素的个数 capacity是总容量,size…...

手把手教你用WouoUI-PageVersion打造128*64 OLED炫酷UI(附Air001移植避坑指南)

嵌入式UI开发实战:WouoUI-PageVersion在128*64 OLED屏上的高效移植与优化 在资源受限的嵌入式设备上实现流畅的UI动画一直是个技术挑战。本文将带你深入探索如何利用WouoUI-PageVersion框架,在仅有4KB RAM和32KB Flash的Air001等微控制器上,打…...