news 2026/3/16 16:06:30

mysql常见指标计算笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
mysql常见指标计算笔记

文章目录

  • 1、用户拉新情况相关指标
    • PV(页面浏览量/访问量)
    • UV(独立访客数)
    • PVUV(人均页面浏览量)
  • 2、用户留存率指标
    • 2.1 留存率计算
  • 3、用户行为
  • 4、用户定位RFM模型

1、用户拉新情况相关指标

可以分析每日浏览深度(按日期分组),每时浏览深度(按时间分组)

PV(页面浏览量/访问量)

  • 定义:用户对页面的每一次浏览/刷新都计为1次PV(同一用户多次访问同一页面会重复计数)。
  • 计算公式
    PV = 所有用户的页面浏览次数之和
  • 示例:用户A浏览页面X 3次,用户B浏览页面X 2次 → 页面X的PV = 3 + 2 = 5

UV(独立访客数)

  • 定义:统计周期内(如1天),独立的用户数(同一用户多次访问只计1次,以设备/账号/IP等唯一标识区分)。
  • 计算公式
    UV = 去重后的独立用户标识数量
  • 示例:用户A用手机访问页面X 3次,用户B用电脑访问页面X 2次 → 页面X的UV = 2(2个独立用户)

PVUV(人均页面浏览量)

  • 定义:平均每个独立用户的页面浏览次数,反映用户的访问深度。
  • 计算公式
    PVUV = PV ÷ UV
  • 示例:页面X的PV=5,UV=2 → PVUV = 5 ÷ 2 = 2.5
SELECTdates,count(IF(behavior_type='pv',1,NULL))ASPV,count(DISTINCTuser_id)ASUV,round((count(IF(behavior_type='pv',1,NULL))/count(DISTINCTuser_id)),2)ASPVUVFROMuserbehaviorGROUPBYdates;

2、用户留存率指标

2.1 留存率计算

(1)计算次日留存率方法1

-- 次日留存率:SQL164witht1as(selectuid,min(day_time)asfirst_dayfrom(selectuid,date(in_time)asday_timefromtb_user_log)r1groupbyuidhavingdate_format(first_day,'%Y-%m')='2021-11'),t2as(selectt1.uid,first_day,day_timeassecond_dayfromt1leftjoin(selectuid,date(in_time)asday_timefromtb_user_logunionselectuid,date(out_time)asday_timefromtb_user_log)bont1.uid=b.uidanddatediff(day_time,first_day)=1)selectfirst_day,# round(sum(if(second_day is null, 0 ,1))/count(uid),2) as uv_left_rateround(count(second_day)/count(uid),2)asuv_left_ratefromt2groupbyfirst_dayorderbyfirst_day-- 次日留存率:CREATETABLEdf_retention_1(datesCHAR(10),retention_1FLOAT);INSERTINTOdf_retention_1SELECTub1.dates,count(ub2.user_id)/count(ub1.user_id)ASretention_1FROM(SELECTDISTINCTuser_id,datesFROMuserbehavior)ASub1LEFTJOIN(SELECTDISTINCTuser_id,datesFROMuserbehavior)ASub2ONub2.user_id=ub1.user_idANDub2.dates=date_add(ub1.dates,INTERVAL1DAY)GROUPBYub1.dates;

(2)计算次日留存率方法2

SELECT-- 统计基准日(用户首次登录的日期,按这个日期分组算留存)first_login.login_dateAS统计日期,-- 1. 次日留存率:登录日期差 = 1 天CONCAT(ROUND((COUNT(DISTINCTCASEWHENDATEDIFF(second_login.login_date,first_login.login_date)=1THENsecond_login.user_idEND)/COUNT(DISTINCTfirst_login.user_id))*100,2),"%")AS次日留存率,-- 2. 三日留存率:登录日期差 = 2 天(当日为0,次日1,第三日就是2)CONCAT(ROUND((COUNT(DISTINCTCASEWHENDATEDIFF(second_login.login_date,first_login.login_date)=2THENsecond_login.user_idEND)/COUNT(DISTINCTfirst_login.user_id))*100,2),"%")AS三日留存率FROM-- 表1:所有用户每日登录去重(1人1天1条)(SELECTDISTINCTuser_id,login_dateFROMuser_login_table)first_login-- 左连接:关联用户后续登录记录(满足「后续日期>基准日期」,覆盖所有留存可能)LEFTJOIN(SELECTDISTINCTuser_id,login_dateFROMuser_login_table)second_loginONfirst_login.user_id=second_login.user_id-- 同一用户关联ANDsecond_login.login_date>first_login.login_date-- 核心条件:后续登录日期>基准日GROUPBYfirst_login.login_date-- 按基准日分组,每日的留存单独算ORDERBYfirst_login.login_dateDESC;-- 按日期倒序,优先看最新数据

3、用户行为

指标:用户购买行为
用户购买次数(按照用户分组统计)
用户复购率:购买次数超过两次的用户比上总购买用户数,计算思路为使用用户表t和重复购买的用户表sub进行左连接,计算sub表中的用户数,占连接后表的用户数的比例。

指标:用户转化率

用户PV,FAV,CART, BUY
计算方法:对于用户行为字段,按照用户和商品分组统计对应行为的数量

用户行为归一标准化
计算方法:对于上一步按照用户和商品分组统计过的指标,不管数量,只要大于0就有过这种行为统计为1

用户行为路径记录
计算方法:以用户和商品为唯一字段,记录行为路径

统计不同用户行为路径的数量,并按照漏斗分析来分类分组计数

4、用户定位RFM模型

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/9 23:15:50

Linux系统RTL8852BE无线网卡驱动完整解决方案

Linux系统RTL8852BE无线网卡驱动完整解决方案 【免费下载链接】rtl8852be Realtek Linux WLAN Driver for RTL8852BE 项目地址: https://gitcode.com/gh_mirrors/rt/rtl8852be 在Linux系统中使用Realtek RTL8852BE无线网卡时,你是否经常遇到设备无法识别、Wi…

作者头像 李华
网站建设 2026/3/13 7:23:24

pyside6.QtCore.Slot 的简单研究

在 PySide6 中,Slot() 是 信号与槽(Signal & Slot)机制 的核心装饰器,用于将普通 Python 方法声明为 槽函数(Slot)—— 槽函数是专门响应信号(Signal)触发的回调方法&#xff0c…

作者头像 李华
网站建设 2026/3/16 7:58:44

在DevSecOps中,如何将安全测试(SAST/DAST等) 无缝集成到CI/CD流水线?

一、核心理念:安全左移,持续防护 将安全测试从传统“发布前检测”转变为开发全流程的嵌入式检查,实现“安全即代码”。 二、集成架构设计 分层安全测试策略 text CI/CD流水线安全防护链: ├── 提交前(Pre-commit) │ ├── Git Hooks:代码规范/敏感信息扫描 │…

作者头像 李华
网站建设 2026/3/15 11:59:46

腾讯云云渠道商:如何利用镜像实现跨云平台迁移?

一、引言 随着多云战略的普及,跨云迁移已成为企业数字化转型的关键环节。数据显示,超过40%​ 的企业采用多云架构,每年平均迁移23个应用。传统迁移方式存在停机时间长(平均8-12小时)、数据丢失风险(高达15%…

作者头像 李华
网站建设 2026/3/16 7:06:24

ThinkPad风扇控制终极指南:让你的笔记本告别噪音烦恼

ThinkPad风扇控制终极指南:让你的笔记本告别噪音烦恼 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 还在忍受ThinkPad风扇的嗡嗡声吗?无论是编…

作者头像 李华
网站建设 2026/3/9 0:26:54

量化模型部署:LobeChat运行7B级别模型的可行性

量化模型部署:LobeChat运行7B级别模型的可行性 在个人开发者和小型团队中,越来越多的人希望搭建属于自己的AI对话系统——不依赖OpenAI、无需支付高昂API费用,还能保障数据隐私。然而,现实挑战摆在眼前:像LLaMA-2-7B或…

作者头像 李华