当前位置：首页 > news >正文

电商会员门店消费数据分析

news 2026/2/11 3:05:05

导包

import os
import sqlite3
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display_htmlpd.set_option('max_colwidth',200)%matplotlib inline

前期准备

转义路径

# 获取Windows系统下的路径
win_path = r"\会员消费报表.xlsx"
win_path1 = r"\会员信息查询.xlsx"
win_path2 = r"\门店信息表.xlsx"
win_path3 = r"\全国销售订单数量表.xlsx"# 使用os.path进行转义
unix_path = os.path.normpath(win_path)  # 或者 os.path.abspath(win_path)
unix_path1 = os.path.normpath(win_path1)  # 或者 os.path.abspath(win_path)
unix_path2 = os.path.normpath(win_path2)  # 或者 os.path.abspath(win_path)
unix_path3 = os.path.normpath(win_path3)  # 或者 os.path.abspath(win_path)# 现在unix_path变量将是 'C:/Users/username/Documents/data.csv'

调整表格样式

html = f"""
<html>
<head><style>div{{background-color: rgba(224, 255, 255, 0.03); /* 包裹表格的 div 背景色 */}}th{{background-color: #79CDCD; /* 表头背景色 */color: black; /* 表头文字颜色 */}}</style>
</head>
</html>
"""
display_html(html, raw=True)

1.1读入表格

1.1.1会员消费表vip_consume

vip_consume = pd.read_excel(unix_path)

vip_consume.head(5)

在这里插入图片描述

1.1.2会员信息查询vip_info

vip_info = pd.read_excel(unix_path1)
vip_info.head(5)

在这里插入图片描述

1.1.3门店信息表shop_info

shop_info = pd.read_excel(unix_path2)
shop_info.head(5)

在这里插入图片描述

1.1.4全国销售订单数量表order_list

order_list = pd.read_excel(unix_path3)
order_list.head(5)

在这里插入图片描述

2数据预处理

2.1查看是否有缺失值、重复值

vip_consume.info()#无缺失值

在这里插入图片描述

2.2转换数据类型，在查找重复值时，有些可能识别不到

2.2.1对vip_consume

#转换日期
vip_consume['订单日期'] = vip_consume['订单日期'].astype("str")
vip_consume['订单日期'] = pd.to_datetime(vip_consume['订单日期'])#名称转化为字符串
vip_consume['卡号'] = vip_consume['卡号'].astype("str")
vip_consume['订单号'] = vip_consume['订单号'].astype("str")
vip_consume['订单类型'] = vip_consume['订单类型'].astype("str")
vip_consume['店铺代码'] = vip_consume['店铺代码'].astype("str")
vip_consume['款号'] = vip_consume['款号'].astype("str")vip_consume.info()

在这里插入图片描述

#验证每个元素是否转化为str
for card_id in vip_consume['卡号']:print(type(card_id))

在这里插入图片描述

#vip_consume.groupby('卡号').count()
dup = vip_consume.copy().duplicated(keep= 'first')
print(dup[dup == True])
print(len(dup[dup == True]))
vip_consume.copy()[dup]

在这里插入图片描述

vip_consume[vip_consume['卡号'] == "BL6093096660436300333" ]

在这里插入图片描述

vip_consume = vip_consume.drop_duplicates(keep='first')
print(len(vip_consume))

在这里插入图片描述

2.2.2对vip_info

vip_info.info()

在这里插入图片描述

#创建缺失率函数
def missing (df):"""计算每一列的缺失值及占比"""missing_number = df.isnull().sum().sort_values(ascending=False)              # 每一列的缺失值求和后降序排序                  missing_percent = (df.isnull().sum()/df.isnull().count()).sort_values(ascending=False)          # 每一列缺失值占比missing_values = pd.concat([missing_number, missing_percent], axis=1, keys=['Missing_Number', 'Missing_Percent'])      # 合并为一个DataFramereturn missing_values
missing(vip_info)

在这里插入图片描述

vip_info_origin = vip_info.copy()

#drop掉缺失率达到0.7以上的列
vip_info = vip_info_origin
vip_info = vip_info.drop(columns=['门店店员编码','城市', '省份'])
vip_info = vip_info.dropna(axis= 0, subset=['生日', '年齡'])
print(vip_info.isnull().sum())
print(len(vip_info))
vip_info

在这里插入图片描述

#去掉重复值
vip_info = vip_info.drop_duplicates(keep='first')
print(len(vip_info))

在这里插入图片描述

2.2.3对shop_info

shop_info.info()

在这里插入图片描述

#计算缺失率
missing(shop_info)

在这里插入图片描述

#备份
shop_info_origin = shop_info.copy()

#删除缺失值
shop_info = shop_info.dropna(axis = 0)
print(shop_info.isnull().sum())

在这里插入图片描述

#删除重复值
print(len(shop_info))
shop_info.drop_duplicates(keep= 'first')
print(len(shop_info))

在这里插入图片描述

2.2.4对orderlist

order_list.info()#无缺失值

在这里插入图片描述

order_list

在这里插入图片描述

#计算缺失率
missing(order_list)

在这里插入图片描述

#删除零值，零值可能是没有会员
order_list.dropna(axis = 0, inplace=True)

order_list['年'] = order_list['年月'].astype(str).str[:4]
order_list['月'] = order_list['年月'].astype(str).str[4:].astype(int).astype(str)

order_list

在这里插入图片描述

3表连接

a = vip_info.sample(3).to_html()
b = vip_consume.sample(3).to_html()
c = shop_info.sample(3).to_html()
d = order_list.sample(3).to_html()# 写规范点的格式，当然可以简单实现  html_str = f"<div>{a}</div><div>{b}</div><div>{c}</div><div>{d}</div>"
html_str = f"""
<html>
<head><style>.cen{{display: flex;flex-direction: column;align-items: center;}}.t{{font-size: 24px;font-weight: bold;}}</style>
</head>
<body><div class="cen"><span class="t">【会员消费表】</span><div>{a}</div><span class="t">【会员信息表】</span><div>{b}</div><span class="t">【门店信息表】</span><div>{c}</div><span class="t">【全国订单表】</span><div>{d}</div></div>
</body>
</html>
"""
display_html(html_str, raw=True)

在这里插入图片描述

3几种可能的表连接情况

3.1会员信息表+会员消费表

info_consume = pd.merge(vip_info,vip_consume,left_on = ['会员卡号'],right_on = ['卡号'], how = 'inner')
print(vip_info.shape,vip_consume.shape,info_consume.shape)
info_consume.head()

在这里插入图片描述

3.1.1订单数量根据时间的变化

有效订单数量、下单数量、退单数量、退单数量、退货率随时间的变化

pd.to_datetime(info_consume['订单日期'])

在这里插入图片描述
。。。。

#后续源码请点击下面链接：
https://mbd.pub/o/bread/Z52Umplt

在这里插入图片描述

#后续源码请点击下面链接：
https://mbd.pub/o/bread/Z52Umplt

电商会员门店消费数据分析

导包 import os import sqlite3 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from IPython.display import display_htmlpd.set_option(max_colwidth,200)%matplotlib inline前期准备转义路径 # 获取Windows系统下的路…...

编程日记 2024/12/28 6:18:12

Vue.js 入门与进阶：打造高效的前端开发体验

Vue.js 是一款渐进式的 JavaScript 框架，凭借其轻量、易用、灵活的特点，已经成为了前端开发者的首选之一。从简单的交互到复杂的单页应用（SPA），Vue 为开发者提供了一套高效且易于上手的工具。在本文中，我们…...

编程日记 2024/12/28 6:13:06

Java包装类型的缓存

Java 基本数据类型的包装类型的大部分都用到了缓存机制来提升性能。 Byte,Short,Integer,Long 这 4 种包装类默认创建了数值 [-128，127] 的相应类型的缓存数据，Character 创建了数值在 [0,127] 范围的缓存数据，Boolean 直接返回 True or Fal…...

编程日记 2024/12/28 6:12:05

【蓝桥杯——物联网设计与开发】拓展模块4 - 脉冲模块

目录一、脉冲模块 （1）资源介绍 🔅原理图 🔅采集原理 （2）STM32CubeMX 软件配置 （3）代码编写 （4）实验现象二、脉冲模块接口函数封装三、踩坑日记 &a…...

编程日记 2024/12/28 6:11:04

.NET平台用C#通过字节流动态操作Excel文件

在.NET开发中，通过字节流动态操作Excel文件提供了一种高效且灵活的方式处理数据。这种方法允许开发者直接在内存中创建、修改和保存Excel文档，无需依赖直接的文件储存、读取操作，从而提高了程序的性能和安全性。使用流技术处理Excel不仅简化了…...

编程日记 2024/12/28 6:10:03

SpringMVC详解

文章目录 1 什么是MVC 1.1 MVC设计思想1.2 Spring MVC 2 SpringMVC快速入门3 SpringMVC处理请求 3.1 请求分类及处理方式 3.1.1 静态请求3.1.2 动态请求 3.2 处理静态请求 3.2.1 处理html文件请求3.2.2 处理图片等请求 3.3 处理动态请求 3.3.1 注解说明3.3.2 示例 3.4 常见问题…...

编程日记 2024/12/28 6:07:00

springboot、spring、springmvc有哪些注解

Spring Boot 常用注解虽然Spring Boot本身并没有引入大量新的注解，但它基于Spring框架，并整合了多种技术和库，使得开发者可以更方便地使用Spring框架的功能。在Spring Boot项目中，常用的注解主要来自于Spring框架本身。 ‌Sprin…...

编程日记 2024/12/28 6:02:56

Apache Commons ThreadUtils 的使用与优化

Apache Commons ThreadUtils 的使用与优化 1. 问题背景在 Java 系统中，跨系统接口调用通常需要高并发支持，尤其是线程池的合理配置至关重要。如果线程池使用不当，可能导致性能下降，线程等待或过载。当前问题使用了 Apache …...

编程日记 2024/12/28 6:01:55

重温设计模式--5、职责链模式

文章目录职责链模式的详细介绍C 代码示例C示例代码2 职责链模式的详细介绍定义与概念职责链模式（Chain of Responsibility Pattern）是一种行为型设计模式，它旨在将请求的发送者和多个接收者解耦，让多个对象都有机会处理请求&am…...

编程日记 2024/12/28 6:00:54

下午四点半

客户的员工竟然背着公司开发报表系统，是在密谋什么大事吗？ 之前去线下给客户的员工培训，当时我就对这个小姑娘印象很深刻，因为她后面加了我们的技术人员，问了很多问题，不同于从来没有用过低代码平台的人&a…...

编程日记 2024/12/28 5:59:53

嵌入式单片机中Flash存储器控制与实现

第一：嵌入式单片机内部Flash概述 1.存储器的概念存储器指的是若干个存储单元的集合，每个存储单元都可以存储若干个二进制数，为了方便的操作存储单元，就为每个存储单元都分配了地址，就可以通过寻址来访问存储单元。由于计算机的处理的数据量较大，并且运算速度都很快，就…...

编程日记 2024/12/28 5:58:52

loki failed to flush

loki 报错 levelerror ts2024-12-27T08:13:10.450140686Z callerflush.go:143 org_idfake msg"failed to flush" err"failed to flush chunks: store put chunk: open /data/loki/chunks/ZmFrZS85ODBmM2U3NzliODg2MjY1OjE5M2VhNDVkYTc4OjE5M2VhNDVlNDdkOjVmMjA…...

编程日记 2024/12/28 5:57:50

微信小程序打印生产环境日志

微信小程序打印生产环境日志新建一个log.js文件，写入以下代码： let log wx.getRealtimeLogManager ? wx.getRealtimeLogManager() : nullmodule.exports {debug() {if (!log) returnlog.debug.apply(log, arguments)},info() {if (!log) returnlog.i…...

编程日记 2024/12/28 5:56:49

利用 deepin-IDE 的 AI 能力，我实现了文件加密扩展

经过多轮迭代，deepin 文件管理器（dde-file-manager）的扩展功能已经趋于稳定，看到越来越丰富的文管新功能，作为一名技术爱好者，也想自己动手写个插件扩展一下文管的功能。我选择的开发工具是 deepin-IDE&a…...

编程日记 2024/12/28 5:54:44

JPA 基本查询（五）

JPA 查询Exists示例 JPA教程 - JPA 查询Exists示例如果子查询返回任何行，则EXISTS条件返回true。以下代码显示如何在JPQL中使用带有子查询的EXISTS运算符。 List l em.createQuery("SELECT e FROM Professor e WHERE EXISTS " "(SELECT p FROM …...

编程日记 2024/12/28 5:53:43

hiprint结合vue2项目实现静默打印详细使用步骤

代码地址是：vue-plugin-hiprint: hiprint for Vue2/Vue3 ⚡打印、打印设计、可视化设计器、报表设计、元素编辑、可视化打印编辑本地安装包地址：electron-hiprint 发行版 - Gitee.com 1、先安装hipint安装包在本地 2、项目运行npm（socket.…...

编程日记 2024/12/28 5:51:41

项目报 OutOfMemoryError 、GC overhead limit exceeded 问题排查以及解决思路实战

项目报 OutOfMemoryError、GC overhead limit exceeded 问题排查以及解决思路实战前言： 问题现象描述： 1，生产环境有个定时任务，没有初始化告警数据【告警数据量为1000多个】 2，其他定时任务执行正常 3，查…...

编程日记 2024/12/28 5:47:31

【计算机-显示屏灰阶测试】

硬计算机-显示屏灰阶测试 ■ 对比度■ 清晰度■ 灰度色阶（色带）■ 对比率■■ ■ 对比度在一个性能良好的显示器上，您可观察到每种颜色的标尺都可分为从 1 至 32、大致上等宽但不同亮度的色带。即使是在刻度1处的色带也应该隐约可见。一个…...

编程日记 2024/12/28 5:46:30

CSS系列（40）-- Container Queries详解

前端技术探索系列：CSS Container Queries详解 📦 致读者：探索组件响应式的艺术 👋 前端开发者们， 今天我们将深入探讨 CSS Container Queries，这个强大的组件级响应式特性。基础概念 🚀 容…...

编程日记 2024/12/28 5:45:25

工作生活做事慢效率低原因及解决方案

时间和效率管理具体版（初阶）（一） 工作&生活做事慢效率低原因及解决方案一、效率慢的原因（动物解析法（编者自创）） 打败你的可能是生活的小事 1.无头苍蝇无流程做事之前没有想…...

编程日记 2024/12/28 5:44:23

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2026/2/10 11:02:44

AI-调查研究-01-正念冥想有用吗？对健康的影响及科学指南

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2026/2/8 5:11:39

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分： 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析： CTR…...

编程新知 2025/9/14 19:44:52

云计算——弹性云计算器（ECS）

弹性云服务器：ECS 概述云计算重构了ICT系统，云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台，包含如下主要概念。 ECS（Elastic Cloud Server）：即弹性云服务器，是云计算…...

编程新知 2025/8/16 21:50:27

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口（适配服务端返回 Token） export const login async (code, avatar) > {const res await http…...

编程新知 2026/1/29 11:40:13

CRMEB 框架中 PHP 上传扩展开发：涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展扩展入口文件文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

编程新知 2025/12/30 22:56:56

[Java恶补day16] 238.除自身以外数组的乘积

给你一个整数数组 nums，返回数组 answer ，其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积。题目数据保证数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位整数范围内。请不要使用除法，且在 O(n) 时间复杂度…...

编程新知 2025/10/3 13:53:38

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构，使它们在 VS 解决方案资源管理器中以“组”（Filter）的形式进行分类展示。 🎯 目标通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总（共4种）方法描述是否推荐…...

编程新知 2025/12/4 15:47:17

dify打造数据可视化图表

一、概述在日常工作和学习中，我们经常需要和数据打交道。无论是分析报告、项目展示，还是简单的数据洞察，一个清晰直观的图表，往往能胜过千言万语。一款能让数据可视化变得超级简单的 MCP Server，由蚂蚁集团 AntV 团队…...

编程新知 2026/1/20 20:10:03

导包

前期准备

转义路径

调整表格样式

1.1读入表格

1.1.1会员消费表vip_consume

1.1.2会员信息查询vip_info

1.1.3门店信息表shop_info

1.1.4全国销售订单数量表order_list

2数据预处理

2.1查看是否有缺失值、重复值

2.2转换数据类型，在查找重复值时，有些可能识别不到

2.2.1对vip_consume

2.2.2对vip_info

2.2.3对shop_info

2.2.4对orderlist

3表连接

3几种可能的表连接情况

3.1会员信息表+会员消费表

3.1.1订单数量根据时间的变化

有效订单数量、下单数量、退单数量、退单数量、退货率随时间的变化

相关文章：