当前位置：首页 > news >正文

SQL29 计算用户的平均次日留存率

news 2026/5/12 23:54:45

SQL29 计算用户的平均次日留存率

计算用户的平均次日留存率_牛客题霸_牛客网

题目：现在运营想要查看用户在某天刷题后第二天还会再来刷题的留存率。

示例：question_practice_detail

-- 输入：
DROP TABLE IF EXISTS `question_practice_detail`;
CREATE TABLE `question_practice_detail` (`id` int NOT NULL,`device_id` int NOT NULL,`question_id`int NOT NULL,`result` varchar(32) NOT NULL,`date` date NOT NULL
);

-- 插入数据：
INSERT INTO question_practice_detail VALUES(1,2138,111,'wrong','2021-05-03');
INSERT INTO question_practice_detail VALUES(2,3214,112,'wrong','2021-05-09');
INSERT INTO question_practice_detail VALUES(3,3214,113,'wrong','2021-06-15');
INSERT INTO question_practice_detail VALUES(4,6543,111,'right','2021-08-13');
INSERT INTO question_practice_detail VALUES(5,2315,115,'right','2021-08-13');
INSERT INTO question_practice_detail VALUES(6,2315,116,'right','2021-08-14');
INSERT INTO question_practice_detail VALUES(7,2315,117,'wrong','2021-08-15');
INSERT INTO question_practice_detail VALUES(8,3214,112,'wrong','2021-05-09');
INSERT INTO question_practice_detail VALUES(9,3214,113,'wrong','2021-08-15');
INSERT INTO question_practice_detail VALUES(10,6543,111,'right','2021-08-13');
INSERT INTO question_practice_detail VALUES(11,2315,115,'right','2021-08-13');
INSERT INTO question_practice_detail VALUES(12,2315,116,'right','2021-08-14');
INSERT INTO question_practice_detail VALUES(13,2315,117,'wrong','2021-08-15');
INSERT INTO question_practice_detail VALUES(14,3214,112,'wrong','2021-08-16');
INSERT INTO question_practice_detail VALUES(15,3214,113,'wrong','2021-08-18');
INSERT INTO question_practice_detail VALUES(16,6543,111,'right','2021-08-13');

-- 输出：
avg_ret
0.3000

-- 方法一：
SELECTCOUNT(DISTINCT t2.device_id, t2.date) / COUNT(DISTINCT t1.device_id, t1.date) AS avg_ret 
FROMquestion_practice_detail AS t1
LEFT JOIN question_practice_detail AS t2
ON t1.device_id = t2.device_idAND DATEDIFF(t2.date, t1.date) = 1;

【解题思路】
1）用 datediff 区分第一天和第二天在线的 device_id
2）用 left join 做自表联结
3）用 distinct t2.device_id, t2.date 做双重去重，找到符合条件的当天在线人数

-- 方法二：
SELECT(t1.num / t2.num) AS avg_ret
FROM( -- 计算第二天再来的记录数量SELECTCOUNT(DISTINCT a.device_id, a.date) AS numFROMquestion_practice_detail aINNER JOIN question_practice_detail b ON a.device_id = b.device_idAND a.date = DATE_ADD(b.date, INTERVAL 1 DAY)) t1,( -- 计算总记录数量SELECTCOUNT(DISTINCT device_id, date) AS numFROMquestion_practice_detail) t2;

【解题思路】
留存率=(去重后的用户有连续两天刷题记录次数)/(去重日期用户后刷题记录次数)
1）计算第二天再来的记录数量 (t1)
使用自连接查找在某一日期出现的设备 ID，且该设备 ID 在前一天也有记录，计算这些设备 ID 和日期组合的唯一数量。
2）计算总记录数量 (t2)
计算 question_practice_detail 表中所有唯一的设备 ID 和日期组合数量。
3）最终计算
将 t1 的结果（第二天再来的设备数量）除以 t2 的结果（总的设备和日期组合数量），得到平均值 avg_ret。

【总结】

1）COUNT()函数

COUNT()函数是一个聚合函数，用于计算表中行的数量或特定列的非空值数量。
COUNT(*) 计算表中的所有行，包括 NULL 值
COUNT(column_name) 只计算该列中的非NULL 值
COUNT(DISTINCT column_name) 计算该列中唯一且非NULL 的值，即该列的不同值的数目
count(distinct a.device_id, a.date) as num
计算在 question_practice_detail 表中不同设备(device_id)和日期(date)组合的数量。

2）日期加减函数

DATE_SUB(date, interval 1 day) 从给定的 date 中减去指定的时间间隔
DATE_ADD(date, interval -1 day) 向给定的 date 中加上指定的时间间隔(加上-1天，即减去1天)
DATEDIFF(date2, date1) = 1 返回 date2 - date1 之间的天数差(天数差1天)

示例
DATE_SUB('2025-03-10', interval 1 day) 将返回 '2025-03-09'。
DATE_ADD('2025-03-10', interval -1 day) 也将返回 '2025-03-09'。
DATEDIFF('2025-03-10', '2025-03-09') 将返回 1，表示两天之间相差1天。

【参考文献】
1、https://blog.csdn.net/zhanchulan/article/details/140047896
2、https://blog.csdn.net/qq_43543789/article/details/142854428
3、https://blog.csdn.net/2301_76352996/article/details/142143839

【附录】

原本日期

减1后日期
date_sub(date, interval 1 day)

left join 后情况（表关联后计数注意NULL值）

SQL29 计算用户的平均次日留存率

相关文章：

SQL29 计算用户的平均次日留存率

MWC 2025 | 移远通信推出AI智能无人零售解决方案，以“动态视觉+边缘计算”引领智能零售新潮流

sparkTTS window 安装

数据库原理6

接口自动化入门 —— Http的请求头，请求体，响应码解析！

tcc编译器教程6 进一步学习编译gmake源代码

公司共享网盘怎么建立

【高分论文密码】AI大模型和R语言的全类型科研图形绘制，从画图、标注、改图、美化、组合、排序分解科研绘图每个步骤

深入理解Java中的static关键字及其内存原理

linux 系统之centos安装 docker

Python语法核心架构与核心知识点：从理论到实践

FreeRTOS（5）内核控制函数及其他函数

网络DNS怎么更改?

VIC模型有哪些优势？适用哪些范围？基于QGIS的VIC模型建模；未来气候变化模型预测；基于R语言VIC参数率定和优化

脏读、不可重复读，幻读的区别 mvcc及四种隔离级别

SpringAI介绍及本地模型使用方法

numpy广播性质

Flutter_学习记录_实现列表上下拉加载 +实现加载html的数据

基于PaddleNLP使用DeepSeek-R1搭建智能体

『PostgreSQL』PGSQL备份与还原实操指南

Simulink仿真避坑指南：PWM控制48V直流电机时，轻载和重载下的参数设置与波形分析（附2018a源文件）

【力扣100题】22. 矩阵置零

ElevenLabs API实战速成：从零部署高保真语音克隆服务，5步完成企业级TTS集成（含实时情感控制代码）

在Windows上安装Android应用：APK Installer让跨平台操作变得简单

AI如何重塑科学创新：从构思成本坍塌到知识组合爆炸

CodeBuddy ai对话框上面的git docs terminal Rulds 干嘛用的,以thinkphp fastadmin 为例，插件市场

保姆级教程：用GATK4从玉米B73参考基因组中提取SNP和Indel（附完整代码）

利用GPU指纹技术进行位置验证

如何给非技术背景的老板汇报技术问题？一个框架搞定

芯片设计演进：从摩尔定律到软件驱动与异构集成的工程实践