news 2026/5/19 22:35:47

鹅厂二面:王者荣耀亿级排行榜,怎么设计?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
鹅厂二面:王者荣耀亿级排行榜,怎么设计?

前言

分享一道网上很火的腾讯面试题:亿级用户排行榜怎么设计呢?换种说法,王者荣耀亿级排行榜,如何设计?

本文跟大家一起探讨一下,如何回答更好呢?

  • 数据库的order by为什么不行?

  • 为什么Redis是排行榜的“扛把子”?

  • Redis扛亿级数据可能存在哪些问题以及对应解决方案

  • 实现方案:分治

  • 巨人的肩膀,前人踩过的坑

1. 数据库的order by

很多小伙伴,一提到排行榜,就想到数据库的order by。

比如微信运动的步数排行:

select * from user_info order by step desc

这个实现没有问题的,如果表的数据量少的话,反而推荐这样实现。如果数据量多呢。则存在问题,尤其还涉及亿级的数据量时~

在亿级用户+高并发实时更新的场景下,会彻底崩盘。 原因一句话:磁盘扛不住,排序算不动,并发撑不起

2.为什么Redis是排行榜的扛把子

当数据量较大且需要实时更新并频繁查询时,使用 Redis 的zset有序集合更为适合。

zsetRedis提供的一种数据结构,它类似于集合(set),但每个成员都关联着一个分数(score),Redis 使用这个分数来对集合中的成员进行排序。

不仅仅是redis的zset支持排序,API简单易用,还因为redis的排序快、可扩展性强、能轻松应对高并发。

2.1 redis排序快

Redis 的数据全放内存,避免磁盘读写,核心操作秒回:

  • 更新分数(ZADD)→ 快如闪电

  • 查排名(ZREVRANK)→ 毫秒响应

  • 查Top 100(ZREVRANGE)→ 瞬间出结果

以下为 Redis vs MySQL 性能对比(亿级数据)

操作Redis (Sorted Set)MySQL (ORDER BY)

更新单个用户分数

0.1ms

5~50ms(索引更新代价高)

查询用户排名

0.2ms

100ms~5s(依赖索引和缓存)

获取Top 100

1ms

1s~10s(内存排序或临时文件)

高并发支撑能力

10万+/秒

1000+/秒(需分库分表)

2.2 可扩展性强

分片存储轻松应对亿级数据。

Redis通过分片存储将数据拆分到多个实例,如同把1亿用户分配到10个小数据库,每个只需处理1000万数据,轻松实现:

  • 1️⃣ 线性扩展:加机器就能提升容量和性能

  • 2️⃣ 压力分散:读写请求分摊到不同分片,避免单点瓶颈

  • 3️⃣ 独立扩容:热点分片可单独升级配置,不干扰其他节点

类比理解:

把一仓库货物(数据)分装到10辆卡车(分片),每辆车只运1/10的货,装卸速度自然快10倍!

2.3 轻松应对高并发

Redis用内存操作+单线程+IO多路复用三把利剑,轻松切开高并发大山:

  • 1️⃣ 内存闪电读写:数据全放内存,比磁盘快10万倍

  • 2️⃣ 单线程无锁:避免多线程切换损耗,原子操作不怕并发冲突

  • 3️⃣ IO多路复用:一个线程监听万个连接,像银行超级柜员同时处理多窗口业务

田螺哥打个比喻吧

Redis就像一个超高效快餐窗口

  • 只卖预制菜(内存数据)→ 出餐快

  • 一个收银员专注打单(单线程)→ 不手忙脚乱

  • 智能叫号器管理排队(IO多路复用)→ 千人排队也能快速响应

据有关测试证明,单机Redis可扛10万+ QPS,分片集群轻松突破百万级并发

3.Redis扛亿级数据可能存在哪些问题以及对应解决方案

3.1 热Key问题

比如“全服TOP100”榜单,容易造就热点key问题。

全服玩家频繁查询 ZREVRANGE leaderboard 0 99(获取Top 100),导致所有请求集中访问 同一个Key(leaderboard)。容易导致单分片CPU和带宽被打满(假设数据分片不均匀)。极端情况下Redis实例崩溃,全服排行榜瘫痪

可以通过这些方式解决:

  • 1. 多级缓存(Redis + jvm本地缓存)

  • 请求优先读本地内存缓存

  • 缓存未命中时读Redis集群

  • Redis集群内部缓存Top 100(设置更短TTL)

  • 读写分离 + 从库负载均衡

主库处理写请求(更新分数)。多个从库轮询处理读请求(查Top 100)

  • 分片Key设计

操作:将排行榜按分数区间拆分成多个Key,例如:

  • leaderboard:top1(前100名)

  • leaderboard:top2(101~1000名)

  • leaderboard:rest(其他用户)

查询逻辑:查Top 100时,只需访问 leaderboard:top1。

3.2 内存爆炸

存储1亿用户,若每个键占32字节(如 user:123),仅键就需约3.2GB,加上分数和指针,内存压力巨大。

优化方案:

  • 缩短键名:将 user:123 转换为整数(如123),利用 Redis 的 int 编码优化内存。

  • 分片存储:按用户ID哈希分片到多个 Redis 实例,分散压力。

3.3 数据持久化风险

Redis 宕机可能导致最新数据丢失(即使开启AOF,默认每秒同步一次)。

容灾方案:

  • 异步双写:更新分数时,同步写入 Kafka,由消费者异步落库 MySQL,用于故障恢复。

  • 混合持久化:开启 RDB + AOF,平衡恢复速度与数据完整性。

4. 实现方案:分治

比如我们要查询王者荣耀巅峰赛的前一百积分的玩家。(其实就是一个TOP N问题)

我们可以按照这种思路:

  • 按区间拆分

  • 动态路由

  • 聚合查询

4.1. 按区间拆分:把排行榜切成小块蛋糕**

怎么拆?

  • 高分玩家放「金盘子」:2500分以上 →rank:2500_2600

  • 中分玩家放「银盘子」:2400~2500分 →rank:2400_2500

  • 低分玩家丢「大锅」:0~2400分 →rank:0_2400

为什么快?

  • 查Top 100只需翻「金盘子」,不用搅动整个大锅!

  • 盘子越小 → 翻找速度越快

4.2 动态路由:玩家换区自动导航

怎么动?

  • 玩家积分变化时,自动检测该去哪

# 伪代码:2503分该放哪个区间? if 2500 <= new_score < 2600: 扔进 rank:2500_2600 elif 2400 <= new_score < 2500: 扔进 rank:2400_2500

4.3 聚合查询:拼图式合并结果

怎么拼?

  1. 从高到低翻盘子:

  • 先查「金盘子」→ 拿到前50名

  • 不够100?再查「银盘子」→ 补50名

  1. 全局排序:

  • 把两个盘子的100人按分数重新排座次

5. 巨人的肩膀,前人踩过的坑

  • 慎用ZREVRANGE类全量操作

直接使用ZREVRANGE获取Top N时,若数据量过大(如1亿用户),会触发O(N)复杂度遍历,导致Redis线程阻塞

  • 警惕黑马用户冲击分片策略

突然出现的高分用户(如积分暴涨至前0.1%)可能打乱原有分片规则,导致数据集中在某个分片引发热点。

  • 内存爆炸与性能抖动

亿级用户存储占用内存超限,且RDB/AOF持久化时fork子进程引发内存翻倍。

  • 数据迁移阻塞服务

用户积分跨分片迁移时,若未原子操作可能导致数据丢失或重复。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/19 6:44:57

面试被问:OOM类型有哪些?怎么答?

面试官&#xff1a;OOM类型有哪些&#xff1f;你&#xff1a;就是老年代放不下了嘛&#xff01;面试官&#xff1a;等消息吧&#xff01;OOM&#xff08;Out Of Memory&#xff09; 错误有多种类型&#xff0c;每种类型对应不同的内存区域或触发场景。以下是常见的 OOM 类型及其…

作者头像 李华
网站建设 2026/5/16 3:11:12

GitHub镜像网站支持GLM-4.6V-Flash-WEB私有仓库镜像

GitHub镜像网站支持GLM-4.6V-Flash-WEB私有仓库镜像 在AI模型日益“重载化”的今天&#xff0c;一个现实问题摆在许多开发者面前&#xff1a;明明看到一款强大的多模态模型发布&#xff0c;却因为下载不动、跑不起来、部署不了而只能望洋兴叹。尤其是在国内网络环境下&#xff…

作者头像 李华
网站建设 2026/5/14 1:00:31

从日志到修复全过程:Dify中Flask-Restx错误处理机制深度解析

第一章&#xff1a;从日志到修复全过程&#xff1a;Dify中Flask-Restx错误处理机制深度解析在Dify平台的API开发中&#xff0c;Flask-Restx作为核心框架承担着接口定义与请求调度职责&#xff0c;其内置的错误处理机制直接影响系统的可观测性与稳定性。当异常发生时&#xff0c…

作者头像 李华
网站建设 2026/5/11 18:10:44

Chromedriver下载地址不稳定?改用GLM-4.6V-Flash-WEB识别动态网页内容

GLM-4.6V-Flash-WEB&#xff1a;用视觉智能替代 Chromedriver 的新范式 在企业自动化流程日益复杂的今天&#xff0c;一个看似不起眼的技术问题——“Chromedriver 下载失败”——却频繁出现在 CI/CD 日志中&#xff0c;成为不少工程师心头之痛。尤其是在国内网络环境下&#x…

作者头像 李华
网站建设 2026/5/13 12:34:17

ComfyUI发布新版支持GLM-4.6V-Flash-WEB拖拽式部署

ComfyUI集成GLM-4.6V-Flash-WEB&#xff1a;拖拽式多模态AI部署新范式 在当前Web应用对实时视觉理解能力需求激增的背景下&#xff0c;开发者面临一个两难困境&#xff1a;一方面希望引入强大的图文理解模型来提升产品智能化水平&#xff1b;另一方面又受限于传统VLM&#xff0…

作者头像 李华
网站建设 2026/5/13 3:09:53

GLM-4.6V-Flash-WEB适用于哪些典型业务场景?一文说清

GLM-4.6V-Flash-WEB 的典型业务场景与落地实践 在今天这个图像信息爆炸的时代&#xff0c;用户早已不再满足于纯文本的交互方式。无论是上传一张截图询问“这个错误怎么解决”&#xff0c;还是拍照提问一道数学题&#xff0c;亦或是在社交平台上发布图文并茂的内容——这些行为…

作者头像 李华