news 2026/4/5 10:09:07

SQL查询连续登录用户方法详解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SQL查询连续登录用户方法详解

1. 基本数据表结构

假设有一个登录记录表:

CREATETABLElogin_log(user_idINT,login_dateDATE);

示例数据:

INSERTINTOlogin_logVALUES(1,'2024-01-01'),(1,'2024-01-02'),(1,'2024-01-03'),(1,'2024-01-05'),-- 这里断了一天(1,'2024-01-06'),(1,'2024-01-07'),(2,'2024-01-01'),(2,'2024-01-02'),(2,'2024-01-04');-- 这里断了一天

2. 方法一:使用窗口函数(推荐)

2.1 查询连续登录3天及以上的用户

WITHranked_logsAS(SELECTuser_id,login_date,ROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYlogin_date)asrnFROMlogin_logGROUPBYuser_id,login_date-- 去重,防止一天多次登录),date_diffAS(SELECTuser_id,login_date,DATE_SUB(login_date,INTERVALrnDAY)asgroup_dateFROMranked_logs)SELECTuser_id,MIN(login_date)asstart_date,MAX(login_date)asend_date,COUNT(*)asconsecutive_daysFROMdate_diffGROUPBYuser_id,group_dateHAVINGCOUNT(*)>=3ORDERBYuser_id,start_date;

2.2 使用LEAD/LAG函数的简化版

WITHconsecutive_groupsAS(SELECTuser_id,login_date,LAG(login_date)OVER(PARTITIONBYuser_idORDERBYlogin_date)asprev_date,LEAD(login_date)OVER(PARTITIONBYuser_idORDERBYlogin_date)asnext_dateFROM(SELECTDISTINCTuser_id,login_dateFROMlogin_log)t)SELECTuser_id,login_dateasconsecutive_dateFROMconsecutive_groupsWHERE-- 连续3天的情况:当前日期、前1天、前2天都存在(login_date=prev_date+INTERVAL1DAYANDlogin_date=prev_date+INTERVAL2DAY)OR-- 或者检查连续区间(login_date=prev_date+INTERVAL1DAYANDlogin_date=next_date-INTERVAL1DAY)OR(login_date=next_date-INTERVAL1DAYANDlogin_date=next_date-INTERVAL2DAY);

3. 方法二:使用自连接

SELECTDISTINCTl1.user_idFROMlogin_log l1JOINlogin_log l2ONl1.user_id=l2.user_idANDl2.login_date=l1.login_date+INTERVAL1DAYJOINlogin_log l3ONl1.user_id=l3.user_idANDl3.login_date=l1.login_date+INTERVAL2DAYWHEREEXISTS(SELECT1FROMlogin_logWHEREuser_id=l1.user_idANDlogin_date=l1.login_date+INTERVAL1DAY)ANDEXISTS(SELECT1FROMlogin_logWHEREuser_id=l1.user_idANDlogin_date=l1.login_date+INTERVAL2DAY);

4. 方法三:使用递归CTE(复杂但功能强大)

WITHRECURSIVE consecutive_loginAS(-- 基础查询:每个用户的首次登录SELECTuser_id,login_date,login_dateasstart_date,1asconsecutive_daysFROM(SELECTuser_id,login_date,ROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYlogin_date)asrnFROMlogin_log)tWHERErn=1UNIONALL-- 递归部分:查找连续的下一天SELECTcl.user_id,ll.login_date,CASEWHENll.login_date=cl.login_date+INTERVAL1DAYTHENcl.start_dateELSEll.login_dateENDasstart_date,CASEWHENll.login_date=cl.login_date+INTERVAL1DAYTHENcl.consecutive_days+1ELSE1ENDasconsecutive_daysFROMconsecutive_login clJOINlogin_log llONcl.user_id=ll.user_idANDll.login_date>cl.login_dateWHEREll.login_date=(SELECTMIN(login_date)FROMlogin_logWHEREuser_id=cl.user_idANDlogin_date>cl.login_date))SELECTuser_id,MAX(consecutive_days)asmax_consecutive_daysFROMconsecutive_loginGROUPBYuser_idHAVINGMAX(consecutive_days)>=3;

5. 实用查询示例

5.1 查询每个用户的最大连续登录天数

WITHranked_logsAS(SELECTuser_id,login_date,DATE_SUB(login_date,INTERVALROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYlogin_date)DAY)asgroup_dateFROM(SELECTDISTINCTuser_id,login_dateFROMlogin_log)t)SELECTuser_id,MAX(consecutive_days)asmax_consecutive_daysFROM(SELECTuser_id,group_date,COUNT(*)asconsecutive_daysFROMranked_logsGROUPBYuser_id,group_date)groupsGROUPBYuser_idORDERBYmax_consecutive_daysDESC;

5.2 查询指定时间段内的连续登录

WITHranked_logsAS(SELECTuser_id,login_date,DATE_SUB(login_date,INTERVALROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYlogin_date)DAY)asgroup_dateFROM(SELECTDISTINCTuser_id,login_dateFROMlogin_logWHERElogin_dateBETWEEN'2024-01-01'AND'2024-01-31')t)SELECTuser_id,COUNT(*)asconsecutive_days,MIN(login_date)asstart_date,MAX(login_date)asend_dateFROMranked_logsGROUPBYuser_id,group_dateHAVINGCOUNT(*)>=7-- 连续7天登录ORDERBYconsecutive_daysDESC;

5.3 查询连续登录中断的情况

WITHlogin_gapsAS(SELECTuser_id,login_date,LEAD(login_date)OVER(PARTITIONBYuser_idORDERBYlogin_date)asnext_date,DATEDIFF(LEAD(login_date)OVER(PARTITIONBYuser_idORDERBYlogin_date),login_date)asgap_daysFROM(SELECTDISTINCTuser_id,login_dateFROMlogin_log)t)SELECTuser_id,login_dateaslast_login_before_gap,next_dateasnext_login_after_gap,gap_days-1asmissed_daysFROMlogin_gapsWHEREgap_days>1ORDERBYuser_id,login_date;

6. 性能优化建议

  1. 创建索引
CREATEINDEXidx_user_loginONlogin_log(user_id,login_date);
  1. 分区表:如果数据量很大,按月份或用户ID范围分区

  2. 物化视图:对于频繁查询的结果可以创建物化视图

  3. 定期清理:删除历史数据,只保留最近N天的数据

7. 不同数据库的语法差异

函数/特性MySQLPostgreSQLSQL ServerOracle
日期加减DATE_ADD()+ INTERVALDATEADD()+ INTERVAL
日期差DATEDIFF()-DATEDIFF()-
行号ROW_NUMBER()ROW_NUMBER()ROW_NUMBER()ROW_NUMBER()
递归CTE支持(8.0+)支持支持支持

选择哪种方法取决于:

  • 数据量:大数据量建议使用窗口函数
  • 查询频率:频繁查询建议建立物化视图
  • 数据库版本:确保支持相关函数
  • 业务需求:是否需要实时结果还是可接受延迟
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 4:29:10

BabylonJS:三维世界的入门指南

目录 第一章:启航!三维世界的入场券 1.1 WebGL与BabylonJS:你的浏览器里藏着一个宇宙 3D图形学极简史:从三角形到元宇宙 BabylonJS的“超能力清单”:为什么选它? 环境搭建:Node.js、TypeScr…

作者头像 李华
网站建设 2026/4/4 0:03:01

Excalidraw issue模板规范,提升问题反馈质量

Excalidraw 与高效 issue 反馈:构建技术协作的双重闭环 在今天的技术团队中,一个 bug 的修复速度往往不取决于开发者的编码能力,而取决于问题能否被准确理解。尤其是在开源项目里,维护者面对的是全球用户的随机反馈——没有上下文…

作者头像 李华
网站建设 2026/3/28 4:53:07

从Git Commit到TensorRT镜像构建:全流程技术拆解

从Git Commit到TensorRT镜像构建:全流程技术拆解 在AI模型日益复杂的今天,一个训练好的深度学习网络从实验室走向生产环境,往往面临“落地难”的窘境。即便精度达标,推理延迟高、吞吐量低、部署不一致等问题依然让许多团队望而却步…

作者头像 李华
网站建设 2026/4/2 15:21:58

python基于django的音乐推荐系统 音乐歌曲播放器界面设计与实现_mtj199wx_论文

目录已开发项目效果实现截图关于我系统介绍开发技术路线核心代码参考示例本项目开发思路结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发项目效果实现截图 同行可拿货,招校园代理 python基于django的音乐推荐系统 音乐歌曲播…

作者头像 李华