当前位置: 首页 > news >正文

2025.01.15python商业数据分析top2

一、 导入项目

导入项目、准备项目数据

import pandas as pd

# 文件路径为python文件位置下的相对路径
dwx=pd.read_excel("电蚊香套装市场近三年交易额.xlsx")
fmfz=pd.read_excel(
"防霉防蛀片市场近三年交易额.xlsx")
msmc=pd.read_excel(
"灭鼠杀虫剂市场近三年交易额.xlsx")
mz=pd.read_excel(
"盘香灭蟑香蚊香盘市场近三年交易额.xlsx")
wxq=pd.read_excel(
"蚊香加热器市场近三年交易额.xlsx")
wxp=pd.read_excel(
"蚊香片市场近三年交易额.xlsx")
wxy=pd.read_excel(
"蚊香液市场近三年交易额.xlsx")

二、合并数据

声明变量、使用方法观察数据

# 使用head()方法查看前5行数据print(dwx.head())# 使用tail()方法查看后5行数据print(dwx.tail())# 使用info()方法查看数据的字段及类型dwx.info()

三、 补齐数据

索引数据、合并数据、训练模型、预测数据

# sum方法汇总数据
dwx_all = dwx['交易金额'].sum()  # 汇总单张表格数据
print(dwx_all)
fmfz_all = fmfz['交易金额'].sum()msmc_all = msmc['交易金额'].sum()
mz_all = mz['交易金额'].sum()
wxq_all = wxq['交易金额'].sum()
wxp_all = wxp['交易金额'].sum()
wxy_all = wxy['交易金额'].sum()
# 7张表格的数据汇总并形成一张表(合并数据)
m_sum = pd.DataFrame(data=[dwx_all, fmfz_all, msmc_all, mz_all, wxq_all, wxp_all, wxy_all], columns=['销售额'],index=['电蚊香', '防霉防蛀', '灭鼠灭虫', '灭蟑', '蚊香加热器', '蚊香片', '蚊香液'])
m_sumtext = pd.DataFrame(data=[dwx_all, fmfz_all, msmc_all, mz_all, wxq_all, wxp_all, wxy_all], columns=['销售额'],index=['电蚊香', '防霉防蛀', '灭鼠灭虫', '灭蟑', '蚊香加热器', '蚊香片', '蚊香液'])
print(m_sum)# 先使用head()tail()方法观察数据d.head()d.tail()# 补齐缺失月份数据# 预测一个叶子行业的12月数据# 索引201712月分数据t17=d.where(d.时间=='2017-12-1').dropna()# 同理将201612月和201512月的数据也索引出来t16=d.where(d.时间=='2016-12-1').dropna()t15=d.where(d.时间=='2015-12-1').dropna()# 2015年,2016年,2017年三年的数据合并t4=pd.concat([t17,t16,t15])# 由于我们的目的是用2015-20173年的12月份数据来进行回归建模,预测201812月数据# 因此,此处我们选用2015,2016,2017作为x变量,每一年12月份的数据作为y变量y=t4.drop('时间',axis=1)# 设置x轴的年份。x=[2017,2016,2015]# 使用回归算法预测,先加载numpysklearn库。
 
# 使用回归算法预测,先加载numpysklearn库。import numpy as npfrom sklearn import linear_model# 将数据处理成回归模型所需要的形式。x_train=np.array(x).reshape(-1,1)y_train=np.array(y.iloc[:,0])# 将线性模型实例化。linear_reg=linear_model.LinearRegression()# 训练模型。linear_reg.fit(x_train,y_train)# 输入自变量2018,预测201812月份的销售额。y_2018_12=linear_reg.predict(np.array([2018]).reshape(-1,1)).round(1)# 输出预测结果。print(y_2018_12[0])# 当一个动作有规律的出现3次或以上,肯定有一个办法可以更高效便捷。# 用循环预测所有叶子行业的12月数据# FOR循环,得到2018年所有类目12月份的预测值。y_12=[]for i in range(7):y_train=np.array(y.iloc[:,i])linear_reg=linear_model.LinearRegression()linear_reg.fit(x_train,y_train)y_pre=linear_reg.predict(np.array([2018]).reshape(-1,1)).round(1)y_12.append(y_pre[0])# 打印2018年个叶子行业12月份的预测结果。print(y_12)
 

四、 整理集数据绘制趋势图

索引数据、汇总数据、绘制各个子行业市场趋势图

# 重置索引。d.reset_index(inplace=True)# 由于“index”列没有作用,可以删除。del d['index']# 查看数据结果。print(d.head())# 汇总每一个月份的类目市场数据d2=d.drop('时间',axis=1)d['col_sum']=d2.apply(lambda x:x.sum(),axis=1)# 提取日期的年份。d['year']=d.时间.apply(lambda x: x.year)# 按年份汇总数据。data_sum=d.groupby('year').sum()print(data_sum)
# 绘制各个叶子市场的趋势图with plt.style.context('ggplot'):# 设置画布大小宽8inch,高6inchpl=plt.figure(figsize=(8,6))# 绘制各叶子行业市场趋势线图。plt.plot(x,data_sum.iloc[:,0])plt.plot(x,data_sum.iloc[:,1])plt.plot(x,data_sum.iloc[:,2])# 设置数字标签。for a,b in zip(x,data_sum.iloc[:,2]):plt.text(a,b+0.05,'%.0f'% b,ha='center',va='bottom',fontsize=8)plt.plot(x,data_sum.iloc[:,3])plt.plot(x,data_sum.iloc[:,4])plt.plot(x,data_sum.iloc[:,5])plt.plot(x,data_sum.iloc[:,6])# 设置数字标签。for a,b in zip(x,data_sum.iloc[:,6]):plt.text(a,b+0.05,'%.0f'% b,ha='center',va='bottom',fontsize=8)# 设置图的标题,x轴标题,y轴标题,设置刻度线格式。plt.title('近三年驱虫市场各子市场容量趋势')plt.xlabel('year')plt.ylabel('交易额')plt.xticks(x,year,fontsize=9,rotation=45)# 设置图例,并画图,如图4-4所示。plt.legend(['电蚊香','防霉防蛀','灭鼠灭虫','灭蟑','蚊香加热器','蚊香片','蚊香液'])plt.show()

提交说明

(请注意以下说明,否则将会影响自己的最终成绩)

1、将所有Python文件压缩之后进行提交,命名为【学号姓名】。压缩包使用zip或rar格式均可。

2、将压缩包提交至对应班级的文件夹下,未上交、上交文件夹错误按0分处理

相关文章:

2025.01.15python商业数据分析top2

一、 导入项目 导入项目、准备项目数据 import pandas as pd# 文件路径为python文件位置下的相对路径dwxpd.read_excel("电蚊香套装市场近三年交易额.xlsx") fmfzpd.read_excel("防霉防蛀片市场近三年交易额.xlsx") msmcpd.read_excel("灭鼠杀虫剂市…...

信息系统项目管理-绩效考核

1.1.组织战略 组织的产品和服务战略的类型通常可以分为:技术密集型、()、目标动态型。 A市场导向型 B成本导向型 C人力密集型 D产品导向型 答案B 在组织的四项基本能力中,建立战略性奖励措施,根据员工对组织的贡献&am…...

【Linux】数据呈现

一、数据的输入与输出 1、标准文件描述符 Linux系统会将每个对象都当做文件来处理,包括输入和输出。它用文件描述符来标识每个文件对象。 文件描述符是一个非负整数,唯一会标识的是会话中打开的文件。每个进程一次最多可以打开9个文件描述符。bash sh…...

oracle 加字段和字段注释 sql

在 Oracle 数据库中,你可以使用 ALTER TABLE 语句来添加字段,并使用 COMMENT ON COLUMN 语句来添加字段注释。以下是一个示例: 假设你有一个名为 employees 的表,你想要添加一个名为 email 的字段,并为其添加注释。 …...

计算机网络压缩版

计算机网络到现在零零散散也算过了三遍,一些协议大概了解,但总是模模糊糊的印象,现在把自己的整体认识总结一下,(本来想去起名叫《看这一篇就够了》,但是发现网上好的文章太多了,还是看这篇吧&a…...

一文了解 gis 相关服务=》及前端地图服务相关总结

文章目录 概要OGC技术名词解释cesium 应用案例openlayers 中应用实例XYZ服务OSM服务WMS服务WMTS服务WFS服务 mapbox 应用实例矢量瓦片服务栅格瓦片服务WMS服务WFS服务 leaflet 中 地图服务实例加载OpenStreetMap瓦片图层加载自定义XYZ瓦片图层加载WMS服务图层加载WFS服务图层加…...

Brocade G610 配置

配置流程 zone创建–>cfg创建–>ip配置–>cfg启动并保存 查看端口信息 G610:admin> switchshow switchName: G610 switchType: 170.5 switchState: Online switchMode: Native switchRole: Principal switchDomain: 1 switchId: ff…...

DuetWebControl 开源项目常见问题解决方案

DuetWebControl 开源项目常见问题解决方案 DuetWebControl A completely new web interface for the Duet electronics [这里是图片001] 项目地址: https://gitcode.com/gh_mirrors/du/DuetWebControl 一、项目基础介绍 DuetWebControl 是一个为 RepRapFirmware 设计的完全响…...

亚信安全举办“判大势 悟思想 强实践”主题党日活动

为深入学习和贯彻党的二十届三中全会精神,近日,亚信安全举办了 “学习贯彻党的二十届三中全会精神——‘判大势 悟思想 强实践’党日活动”,并取得圆满成功。 本次活动特邀南京市委宣讲团成员、南京市委党校市情研究中心主任王辉龙教授出席。…...

Go怎么做性能优化工具篇之基准测试

一、什么是基准测试(Benchmark) 在 Go 中,基准测试是通过创建以 Benchmark 开头的函数,并接收一个 *testing.B 类型的参数来实现的。testing.B 提供了控制基准测试执行的接口,比如设置测试执行的次数、记录每次执行的…...

vue3国际化,主题切换

国际化 安装依赖 pnpm install i18n pnpm install vue-i18n main.js import { createApp } from vue import App from ./App.vue import { i18n } from /i18n/index; const app createApp(App) app.use(i18n); app.mount(#app) 根目录创建i18n文件夹,创建3个文件&…...

Linux Shell 脚本编程基础

打开kali,Xshell连接 一、 vim 1.sh 可利用 #! /bin/bash, #! /bin/dash ,#! bin/sh 这三种脚本解释器不论哪种,最终都是调用 dash 在1.sh内加入内容,尝试执行,./1.sh,但需要加权 或者,在不使用加权的情…...

vuex如何进行状态管理?

**Vuex:是实现组件全局状态(数据)管理的一种机制,可以方便的实现组件之间数据共享。** (1) 如果是Vue2的环境,不能使用vuex4的版本,所以我们需要安装vuex3以下的版本安装。 创建项目:vue crea…...

嵌入式Linux QT+OpenCV基于人脸识别的考勤系统 项目

此项目是基于人脸识别的考勤系统开发,包括如下模块: 1、人脸识别考勤系统GUI界面设计,包括: (1)Qt环境(window环境/linux环境) ; (2)Qt工程创建分析; &am…...

通过阿里云 Milvus 与 PAI 搭建高效的检索增强对话系统

背景介绍 阿里云向量检索服务Milvus版(简称阿里云Milvus)是一款云上全托管服务,确保了了与开源Milvus的100%兼容性,并支持无缝迁移。在开源版本的基础上增强了可扩展性,能提供大规模 AI 向量数据的相似性检索服务。相…...

评估大语言模型在药物基因组学问答任务中的表现:PGxQA

​这篇文献主要介绍了一个名为PGxQA的资源,用于评估大语言模型(LLM)在药物基因组学问答任务中的表现。 研究背景 药物基因组学(Pharmacogenomics, PGx)是精准医学中最有前景的领域之一,通过基因指导的治疗…...

在本地和远程转储域控制器哈希

更多内网知识课前往无问社区查看http://www.wwlib.cn 无凭据 - ntdsutil 如果您没有凭据,但有权访问 DC,则可以使用 lolbin ntdsutil.exe转储 ntds.dit: powershell "ntdsutil.exe ac i ntds ifm create full c:\temp q q" 我们…...

基于SSM+Vue的心理咨询问诊系统+LW示例参考

1.项目介绍 项目角色:管理员、患者(普通用户)、医师项目模块:医生管理、患者管理、科室管理、咨询管理、预约管理、急救知识、患者病历等测试环境:idea2024、tomcat8.5、maven3、jdk8、nodeV14.16.1、mysql5.7技术栈&…...

基于TMS320X281X/F28335的DSP入门到精通01_如何开始DSP的学习与开发

本部分开始基于《手把手教你学DSP—基于TMS320X281X》,《手把手教你DSP基于MS320F28335 》、《TMS320X281x DSP原理及C程序开发》,另外结合B站视频进行DSP嵌入式的学习。 《手把手教你学DSP—基于TMS320X281X》介绍的相对更为基础和详细,《手…...

Java爬虫获取1688 item_search_img接口详细解析

概述 1688作为中国领先的B2B电商平台,提供了丰富的API接口供开发者获取商品信息。item_search_img接口允许通过图片搜索商品,这对于需要基于图片进行商品查找的应用场景非常有用。本文将详细介绍如何使用Java爬虫技术获取1688的item_search_img接口数据…...

Java 连接 FTP 服务器全解析

Java 连接 FTP 服务器全解析 一、引言 在许多企业级应用和数据处理场景中,与 FTP 服务器进行交互是一项常见且重要的任务。Java 提供了强大的工具和库来实现与 FTP 服务器的连接、文件传输、目录操作等功能。本文将详细介绍如何使用 Java 连接 FTP 服务器&#xf…...

字节跳动C++面试题及参考答案(下)

说说B 树 b + 树 B 树: B 树是一种平衡的多路查找树,它的设计目的是为了减少磁盘 I/O 操作,适用于存储大量的数据并进行高效的查找、插入和删除操作。B 树的节点可以有多个子节点(通常称为多路),每个节点包含多个关键字,关键字之间是有序的。 B 树的结构特点包括:根节点…...

Rabbit MQ知识总结

1.什么是Rabbit MQ? Rabbit MQ是一个开源的消息代理软件,它实现了高级消息队列协议(AMQP); 基本概念 消息:消息是在应用程序之间传递的数据单元。可以是简单的文本信息,可以是复杂的对象。队列:队列是消息的容器&am…...

未来将要被淘汰的编程语言

COBOL - 这是一种非常古老的语言,主要用于大型企业系统和政府机构。随着老一代IT工作人员的退休,COBOL程序员变得越来越少。Fortran - 最初用于科学和工程计算,Fortran在特定领域仍然有其应用,但随着更现代的语言(如Py…...

GO环境安装和配置

安装go环境 wget https://go.dev/dl/go1.22.4.linux-amd64.tar.gz -P /usr/local或者去官网下载安装包 tar -xzf go1.23.4.linux-amd64.tar.gz sudo mv go /usr/local export GOROOT/usr/local/go export GOPATH$HOME/go export PATH$PATH:/usr/local/go/bin source ~/.bashr…...

面试题整理(四)

1.Max transition,leakage优化,hold time ,setup time violation修复的顺序是? 答:先把max transition修复掉,如果max transition有violation,意味着其超出了查找表范围之外,所以计算得到的delay都不是很准的。 其次是把setup修复了,因为setup相对来说,需要减少cell…...

mathtype中如何在公式和序号之间加点

1,右编号插入公式 2,打开样式面板(ctrlshiftalts) 3,选中MTDisplayEquation样式,右击修改 4,点击格式,弹出下拉列表,点击制表位 5,先选中34.67字符&#…...

【电源专题】电源芯片的PG(Power Good)管脚是什么?

在看电源芯片规格书时,你会发现有一些电源芯片有PG管脚。如下ti.com.cn/product/cn/tps56637?qgpn=tps56637规格书所示: 对应的描述是:Open Drain Power Good Indicator, it is asserted low if output voltage is out of PG threshold due to over-voltage, under…...

C/C++圣诞树

系列文章 序号直达链接1C/C爱心代码2C/C跳动的爱心3C/C李峋同款跳动的爱心代码4C/C满屏飘字表白代码5C/C大雪纷飞代码6C/C烟花代码7C/C黑客帝国同款字母雨8C/C樱花树代码9C/C奥特曼代码10C/C精美圣诞树11C/C俄罗斯方块12C/C贪吃蛇13C/C孤单又灿烂的神-鬼怪14C/C闪烁的爱心15C…...

牛客--求小球落地5次后所经历的路程和第5次反弹的高度,称砝码

求小球落地5次后所经历的路程和第5次反弹的高度 描述 假设有一个小球从 hh 米高度自由落下,我们不考虑真实的物理模型,而是简洁的假定,该小球每次落地后会反弹回原高度的一半;再落下,再反弹;……。 求小球…...