2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题 实现代码
根据之前发布的思路 第一步 进行数据合并
import pandas as pd# 读取所有附件的数据
data1 = pd.read_excel('附件一.xlsx')
data2 = pd.read_excel('附件二.xlsx')
data3 = pd.read_excel('附件三.xlsx')
data4 = pd.read_excel('附件四.xlsx')# 根据商品编码将附件一和附件二连接
combinedData = pd.merge(data1, data2, on='商品编码', how='inner')# 根据商家编码将上述的结果和附件三连接
combinedData = pd.merge(combinedData, data3, on='商家编码', how='inner')# 根据仓库编码将上述的结果和附件四连接
combinedData = pd.merge(combinedData, data4, on='仓库编码', how='inner')# 保存合并后的数据到新的Excel文件中
combinedData.to_excel('合并后的数据.xlsx', index=False, engine='openpyxl')
或者 matlab
% 读取所有附件的数据
data1 = readtable('附件一.xlsx');
data2 = readtable('附件二.xlsx');
data3 = readtable('附件三.xlsx');
data4 = readtable('附件四.xlsx');% 根据商品编码将附件一和附件二连接
combinedData = innerjoin(data1, data2, 'Keys', '商品编码');% 根据商家编码将上述的结果和附件三连接
combinedData = innerjoin(combinedData, data3, 'Keys', '商家编码');% 根据仓库编码将上述的结果和附件四连接
combinedData = innerjoin(combinedData, data4, 'Keys', '仓库编码');% 保存合并后的数据到新的Excel文件中
writetable(combinedData, '合并后的数据.xlsx');
之后就是对于数据的 转码 将文本数据转化为数字
py代码
# 定义数据
data = {"商家编码": {"1": "seller_10", "2": "seller_11", "3": "seller_12", "4": "seller_13", ...},"商品编码": {"1": "product_1914", "2": "product_1915", "3": "product_1916", ...},"仓库编码": {"1": "wh_1", "2": "wh_10", "3": "wh_11", ...},"商品一级分类": {"1": "手机通讯", "2": "食品饮料", "3": "家庭清洁/纸品", ...},"商品二级分类": {"1": "手机配件", "2": "粮油调味", "3": "进口食品", ...},"商品三级分类": {"1": "手机配件_5", "2": "粮油调味_1", "3": "进口食品_1", ...},"商家分类": {"1": "手机通讯", "2": "食品饮料", "3": "美妆护肤", ...},"库存分类": {"1": "A", "2": "B", "3": "D", ...},"商家规模": {"1": "Large", "2": "Special", "3": "Small", ...},"仓库类别": {"1": "Large", "2": "Special", "3": "Small", ...}
}def transcode(record):for key, value in record.items():if value in data[key]:record[key] = data[key][value]return record# 示例
record = {"商家编码": "1","商品编码": "2","仓库编码": "3",...
}transcoded_record = transcode(record)
print(transcoded_record)
matalb
% 假设原始数据存储在一个cell array中,名为data
% data = {...}; % 你需要将这里填充为你的数据% 定义一个map来存储转码信息
map = containers.Map();% 定义你的转码数据
sellers = {'seller_10', 'seller_11', 'seller_12', 'seller_13', ...};
products = {'product_1914', 'product_1915', 'product_1916', 'product_1917', ...};
warehouses = {'wh_1', 'wh_10', 'wh_11', 'wh_12', ...};
% ... 添加其他数据% 填充map
for i = 1:length(sellers)map(sellers{i}) = i;
endfor i = 1:length(products)map(products{i}) = i;
endfor i = 1:length(warehouses)map(warehouses{i}) = i;
end
% ... 同样地,为其他数据填充map% 对原始数据进行转码
rows, cols = size(data);
for r = 1:rowsfor c = 1:colsif isKey(map, data{r, c})data{r, c} = map(data{r, c});endend
end% 输出转码后的数据
disp(data);
然后 就可以进行后续分析了
相关文章:
2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题 实现代码
根据之前发布的思路 第一步 进行数据合并 import pandas as pd# 读取所有附件的数据 data1 pd.read_excel(附件一.xlsx) data2 pd.read_excel(附件二.xlsx) data3 pd.read_excel(附件三.xlsx) data4 pd.read_excel(附件四.xlsx)# 根据商品编码将附件一和附件二连接 combi…...
larvel 中的api.php_Laravel 开发 API
Laravel10中提示了Target *classController does not exist,为什么呢? 原因是:laravel8开始写法变了。换成了新的写法了 解决方法一: 在路由数组加入App\Http\Controllers\即可。 <?phpuse Illuminate\Support\Facades\Route;…...
虚拟机构建部署单体项目及前后端分离项目
目录 一.部署单体项目 1.远程数据库 1.1远程连接数据库 1.2 新建数据库运行sql文件 2.部署项目到服务器中 3.启动服务器运行 二.部署前后端分离项目 1.远程数据库和部署到服务器 2.利用node环境启动前端项目 3.解决主机无法解析服务器localhost问题 方法一 编辑 方法二 一.部…...
C++之特殊类的设计
目录 一、单例模式 1、设计模式 2、单例模式 1、饿汉模式 2、懒汉模式 3、单例对象的释放问题 二、设计一个不能被拷贝的类 三、设计一个只能在堆上创建对象的类 四、设计一个只能在栈上创建对象的类 五、设计一个不能被继承的类 一、单例模式 1、设计模式 概念&am…...
Java练习题2020 -1
统计1到N的整数中,被A除余A-1的偶数的个数 输入说明:整数 N(N<10000), A, (A 输出说明:符合条件的数的个数 输入样例:10 3 输出样例:2 (说明:样例中符合条件的2个数是 2、8) import java.util.Scanner;p…...
LuaTable转C#的列表List和字典Dictionary
LuaTable转C#的列表List和字典Dictionaty 介绍lua中创建表测试lua中list表表转成List表转成Dictionary 键值对表表转成Dictionary 多类型键值对表表转成Dictionary 总结 介绍 之前基本都是从C#中的List或者Dictionary转成luaTable,很少会把LuaTable转成C#的List或者…...
Redis快速上手篇七(集群)
在赶工了..... Redis集群 主从复制的场景无法吗满足主机单点故障时需要引入集群配置 一般数据库要处理的读请求远大于写请求 ,针对这种情况,我们优化数据库可以采用读写分离的策略。我们可以部 署一台主服务器主要用来处理写请求,部署多台从…...
Mac 安装nvm
安装方案: 1. 从github下载nvm仓库到 ~/目录 地址:https://github.com/nvm-sh/nvm.git git clone https://github.com/nvm-sh/nvm.git 2. 进入nvm目录中执行install.sh等待执行完成,执行的操作方法就是直接将文件拖入到终端然后回车。 3.…...
python 从mssql取出datetime2类型之后格式化
我mssql是datetime2类型,用df取出之后发现是个纳秒的int(1698419713000000000 这种) 所以格式化的话就需要变成秒为单位,他们之间是10的9次方倍。所以先除以1e9之后用datetime.datetime.fromtimestamp()转换之后再format就行了 l…...
18.2 使用NPCAP库抓取数据包
NPCAP 库是一种用于在Windows平台上进行网络数据包捕获和分析的库。它是WinPcap库的一个分支,由Nmap开发团队开发,并在Nmap软件中使用。与WinPcap一样,NPCAP库提供了一些API,使开发人员可以轻松地在其应用程序中捕获和处理网络数据…...
pytest-yaml 测试平台-3.创建执行任务定时执行用例
前言 当项目用例编写完成后,需设置执行策略,可以用到定时任务设置每天几点执行。或者间隔几个小时执行一次。 创建定时任务 创建任务 勾选需要执行的项目以及运行环境 触发器可以支持2种方式:interval 间隔多久触发和 cron 表达式定时执行…...
安卓文件资源中,一个字串包含引用其他字串的写法
具体范例: <string name"product_name" translatable"false">Miscope</string><string name"app_name">string/product_name for USB Camera</string> 注意要先定义再引用。...
解决:谷歌浏览器访问http时,自动转https访问的问题
问题背景:某个系统网站,之前一直用https域名访问,现在改成http域名后,用http访问,谷歌浏览器会自动跳转到https。 解决方法: 在浏览器中输入网址:chrome://net-internals/#hsts -》 在“Delete…...
MQTT协议和边缘计算
1.基本概念 MQTT是基于TCP/IP协议栈构建的异步通信消息协议,是一种轻量级的发布、订阅信息传输协议。可以在不可靠的网络环境中进行扩展,适用于设备硬件存储空间或网络带宽有限的场景。使用MQTT协议,消息发送者与接收者不受时间和空间的限制…...
Redis(04)| 数据结构-压缩列表
压缩列表的最大特点,就是它被设计成一种内存紧凑型的数据结构,占用一块连续的内存空间,不仅可以利用 CPU 缓存,而且会针对不同长度的数据,进行相应编码,这种方法可以有效地节省内存开销。 但是,…...
516 最长回文子序列(区间DP)(灵神笔记)
题目 最长回文子序列 给你一个字符串 s ,找出其中最长的回文子序列,并返回该序列的长度。 子序列定义为:不改变剩余字符顺序的情况下,删除某些字符或者不删除任何字符形成的一个序列。 示例 1: 输入:s …...
Kafka - 异步/同步发送API
文章目录 异步发送普通异步发送异步发送流程Code 带回调函数的异步发送带回调函数的异步发送流程Code 同步发送API 异步发送 普通异步发送 需求:创建Kafka生产者,采用异步的方式发送到Kafka broker 异步发送流程 Code <!-- https://mvnrepository…...
嵌套for循环在外层循环和内层循环中使用两个Executors.newCachedThreadPool缓存线程池执行操作
1. 首先,我们需要创建两个ExecutorService对象,这两个对象将作为我们的缓存线程池。 2. 然后,我们使用嵌套的for循环来执行我们的操作。在每个外层循环中,我们将创建一个新的任务并提交给外层线程池。在这个任务中,我…...
【uniapp+云函数调用】人脸识别,实人认证,适用于app,具体思路解析,已实现
2023.10.8 需求: uniapp开发的app项目中使用人脸识别 app项目都是第一次搞,更别提人脸识别了。目前已有的就是Dcloud账号已申请,实现需求的时间没那么紧迫 此篇会详细记录从0到1的过程 2023.10.24 今天开始探究实现的过程 可能会记录的有些冗余 效果图如下: uniapp开发指南…...
系列十六、bean有哪些生命周期的回调方法?有哪几种实现方式?
一、概述 bean的生命周期的回调方法主要分两种,一种是初始化时进行调用,另外一种是销毁时进行调用。但是不管是初始化还是销毁,都对应着三种方式。 二、实现方式 2.1、注解方式 PostConstruct PreDestroy Component public class UserSe…...
Local Moondream2效果展示:真实用户上传图片的高质量描述输出
Local Moondream2效果展示:真实用户上传图片的高质量描述输出 1. 核心能力概览 Local Moondream2是一个基于Moondream2构建的超轻量级视觉对话Web界面,它让普通电脑也能拥有"视觉理解"能力。这个工具最大的特点是能够对用户上传的图片进行深…...
选题毫无头绪?高校导师推荐这几个AI论文写作工具
写论文总是卡壳?选题没方向、结构不清晰、文献找不全、语言不专业……这些痛点让很多学生倍感压力。其实,只要用对 AI 工具、走对写作流程,就能大幅提升效率。资深教授普遍建议:千笔AI(中文全流程首选) 豆包…...
5步搞定Qwen3-ASR语音识别:支持多语言和方言,快速上手教程
5步搞定Qwen3-ASR语音识别:支持多语言和方言,快速上手教程 语音识别技术正在改变我们与数字世界的交互方式,而Qwen3-ASR以其强大的多语言和方言支持能力脱颖而出。本文将带你用最简单的方式,在5个步骤内完成这个专业级语音识别系…...
开箱即用:BAAI/bge-m3镜像,一键启动语义相似度分析WebUI
开箱即用:BAAI/bge-m3镜像,一键启动语义相似度分析WebUI 1. 快速上手:从零到一的十分钟体验 你是不是也遇到过这样的场景?手头有两段文字,想知道它们说的是不是一回事,或者想快速验证一下自己构建的AI知识…...
别再折腾了!Ubuntu 24.04 下用 TeX Live + VSCode 写论文,这份配置清单直接抄
Ubuntu 24.04 TeX Live VSCode:学术写作终极配置指南 如果你正在为毕业论文的格式调整而抓狂,或是厌倦了在不同教程间来回切换却始终无法解决中文乱码问题,那么这份指南就是为你准备的。作为一名在Linux环境下完成过三篇学术论文的老手&am…...
BGE Reranker-v2-m3效果展示:原始分数与归一化分数双维度结果对比分析真实案例
BGE Reranker-v2-m3效果展示:原始分数与归一化分数双维度结果对比分析真实案例 1. 系统核心能力概览 BGE Reranker-v2-m3是一个基于先进AI技术的本地文本相关性重排序工具,专门用于评估查询语句与候选文本之间的匹配程度。这个工具的核心价值在于能够智…...
Noi:整合多 AI 服务的新利器能否突出重围?
Noi:一站式 AI 服务整合新体验Noi 是一款图形用户界面(GUI)应用程序,它的核心亮点在于将所有 AI 服务整合到一处。用户通过单一用户界面(UI)就能访问 ChatGPT、Claude、Gemini、Perplexity 等多个服务&…...
Phi-3 Forest Lab效果展示:对CI/CD流水线失败日志的因果推理与修复路径推荐
Phi-3 Forest Lab效果展示:对CI/CD流水线失败日志的因果推理与修复路径推荐 1. 引言:当森林智慧遇见工程难题 在软件开发的世界里,CI/CD流水线就像一条永不停歇的生产线。但当这条生产线突然停止运转时,开发团队往往要花费数小时…...
OpenCV手眼标定避坑指南:inner和outer内参到底怎么选?
OpenCV手眼标定避坑指南:inner和outer内参到底怎么选? 在工业自动化领域,手眼标定(Eye to Hand)是连接视觉系统与机械臂的关键技术环节。许多工程师在使用OpenCV进行标定时,常常对getOptimalNewCameraMatri…...
springboot-vue+nodejs的宠物领养寄养预约系统
目录技术栈选择系统模块划分数据库设计后端实现要点前端实现要点部署方案安全措施测试计划项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作技术栈选择 后端采用Spring Boot框架,提供RESTful API接口。前端使用Vue.j…...
