给你1亿的Redis key,如何高效统计?
bigegpt 2025-06-18 19:15 2 浏览
前言
有些小伙伴在工作中,可能遇到过这样的场景:老板突然要求统计Redis中所有key的数量,你随手执行了KEYS *命令,下一秒监控告警疯狂闪烁——整个Redis集群彻底卡死,线上服务大面积瘫痪。
今天这篇文章就跟大家一起聊聊如果给你1亿个Redis key,如何高效统计这个话题,希望对你会有所帮助。
1 为什么不建议使用KEYS命令?
Redis的单线程模型是其高性能的核心,但也是最大的软肋。
当Redis执行 KEYS * 命令时,内部的流程如下:
Redis的单线程模型是其高性能的核心,但同时也带来一个关键限制:所有命令都是串行执行的。
当我们执行 KEYS * 命令时:
Redis必须遍历整个key空间(时间复杂度O(N))
在遍历完成前,无法处理其他任何命令
对于1亿个key,即使每个key查找只需0.1微秒,总耗时也高达10秒!
致命三连击:
- 时间复杂度:1亿key需要10秒+(实测单核CPU 0.1μs/key)
- 内存风暴:返回结果太多可能撑爆客户端内存
- 集群失效:在Cluster模式中只能查当前节点的数据。
如果Redis一次性返回的数据太多,可能会有OOM问题:
127.0.0.1:6379> KEYS *
(卡死10秒...)
(error) OOM command not allowed when used memory > 'maxmemory'
超过了最大内存。
那么,Redis中有1亿key,我们要如何统计数据呢?
2 SCAN命令
SCAN命令通过游标分批遍历,每次只返回少量key,避免阻塞。
Java版基础SCAN的代码如下:
public long safeCount(Jedis jedis) {
long total = 0;
String cursor = "0";
ScanParams params = new ScanParams().count(500); // 每批500个
do {
ScanResult<String> rs = jedis.scan(cursor, params);
cursor = rs.getCursor();
total += rs.getResult().size();
} while (!"0".equals(cursor)); // 游标0表示结束
return total;
}
使用游标查询Redis中的数据,一次扫描500条数据。
但问题来了:1亿key需要多久?
- 每次SCAN耗时≈3ms
- 每次返回500key
- 总次数=1亿/500=20万次
- 总耗时≈20万×3ms=600秒=10分钟!
3 多线程并发SCAN方案
现代服务器都是多核CPU,单线程扫描是资源浪费。
看多线程优化方案如下:
多线程并发SCAN代码如下:
public long parallelCount(JedisPool pool, int threads) throws Exception {
ExecutorService executor = Executors.newFixedThreadPool(threads);
AtomicLong total = new AtomicLong(0);
// 生成初始游标(实际需要更智能的分段)
List<String> cursors = new ArrayList<>();
for (int i = 0; i < threads; i++) {
cursors.add(String.valueOf(i));
}
CountDownLatch latch = new CountDownLatch(threads);
for (String cursor : cursors) {
executor.execute(() -> {
try (Jedis jedis = pool.getResource()) {
String cur = cursor;
do {
ScanResult<String> rs = jedis.scan(cur, new ScanParams().count(500));
cur = rs.getCursor();
total.addAndGet(rs.getResult().size());
} while (!"0".equals(cur));
latch.countDown();
}
});
}
latch.await();
executor.shutdown();
return total.get();
}
使用线程池、AtomicLong和CountDownLatch配合使用,实现了多线程扫描数据,最终将结果合并。
性能对比(32核CPU/1亿key):
方案 | 线程数 | 耗时 | 资源占用 |
单线程SCAN | 1 | 580s | CPU 5% |
多线程SCAN | 32 | 18s | CPU 800% |
4 分布式环境的分治策略
如果你的系统重使用了Redis Cluster集群模式,该模式会将数据分散在16384个槽(slot)中,统计就需要节点协同。
流程图如下:
每一个Redis Cluster集群中的master服务节点,都负责统计一定范围的槽(slot)中的数据,最后将数据聚合起来返回。
集群版并行统计代码如下:
public long clusterCount(JedisCluster cluster) {
Map<String, JedisPool> nodes = cluster.getClusterNodes();
AtomicLong total = new AtomicLong(0);
nodes.values().parallelStream().forEach(pool -> {
try (Jedis jedis = pool.getResource()) {
// 跳过从节点
if (jedis.info("replication").contains("role:slave")) return;
String cursor = "0";
do {
ScanResult<String> rs = jedis.scan(cursor, new ScanParams().count(500));
total.addAndGet(rs.getResult().size());
cursor = rs.getCursor();
} while (!"0".equals(cursor));
}
});
return total.get();
}
这里使用了parallelStream,会并发统计Redis不同的master节点中的数据。
5 毫秒统计方案
方案1:使用内置计数器
如果只想统计一个数量,可以使用Redis内置计数器,瞬时但非精确。
127.0.0.1:6379> info keyspace
# Keyspace
db0:keys=100000000,expires=20000,avg_ttl=3600
优点:毫秒级返回。
缺点:包含已过期未删除的key,法按模式过滤数据。
方案2:实时增量统计
实时增量统计方案精准但复杂。
基于键空间通知的实时计数器,具体代码如下:
@Configuration
publicclass KeyCounterConfig {
@Bean
public RedisMessageListenerContainer container(RedisConnectionFactory factory) {
RedisMessageListenerContainer container = new RedisMessageListenerContainer();
container.setConnectionFactory(factory);
container.addMessageListener((message, pattern) -> {
String event = new String(message.getBody());
if(event.startsWith("__keyevent@0__:set")) {
redisTemplate.opsForValue().increment("total_keys", 1);
} elseif(event.startsWith("__keyevent@0__:del")) {
redisTemplate.opsForValue().decrement("total_keys", 1);
}
}, new PatternTopic("__keyevent@*"));
return container;
}
}
使用监听器统计数量。
成本分析:
- 内存开销:额外存储计数器
- CPU开销:增加5%-10%处理通知
- 网络开销:集群模式下需跨节点同步
6 如何选择方案?
本文中列举出了多个统计Redis中key的方案,那么我们在实际工作中如何选择呢?
下面用一张图给大家列举了选择路线:
各方案的时间和空间复杂度如下:
方案 | 时间复杂度 | 空间复杂度 | 精度 |
KEYS命令 | O(n) | O(n) | 精确 |
SCAN遍历 | O(n) | O(1) | 精确 |
内置计数器 | O(1) | O(1) | 不精确 |
增量统计 | O(1) | O(1) | 精确 |
硬件法则:
- CPU密集型:多线程数=CPU核心数×1.5
- IO密集型:线程数=CPU核心数×3
- 内存限制:控制批次大小(count参数)
常见的业务场景:
- 电商实时大屏:增量计数器+RedisTimeSeries
- 离线数据分析:SCAN导出到Spark
- 安全审计:多节点并行SCAN
终极箴言:
精确统计用分治
实时查询用增量
趋势分析用采样
暴力遍历是自杀
真正的高手不是能解决难题的人,而是能预见并规避难题的人。
在海量数据时代,选择比努力更重要——理解数据本质,才能驾驭数据洪流。
相关推荐
- 悠悠万事,吃饭为大(悠悠万事吃饭为大,什么意思)
-
新媒体编辑:杜岷赵蕾初审:程秀娟审核:汤小俊审签:周星...
- 高铁扒门事件升级版!婚宴上‘冲喜’老人团:我们抢的是社会资源
-
凌晨两点改方案时,突然收到婚庆团队发来的视频——胶东某酒店宴会厅,三个穿大红棉袄的中年妇女跟敢死队似的往前冲,眼瞅着就要扑到新娘的高额钻石项链上。要不是门口小伙及时阻拦,这婚礼造型团队熬了三个月的方案...
- 微服务架构实战:商家管理后台与sso设计,SSO客户端设计
-
SSO客户端设计下面通过模块merchant-security对SSO客户端安全认证部分的实现进行封装,以便各个接入SSO的客户端应用进行引用。安全认证的项目管理配置SSO客户端安全认证的项目管理使...
- 还在为 Spring Boot 配置类加载机制困惑?一文为你彻底解惑
-
在当今微服务架构盛行、项目复杂度不断攀升的开发环境下,SpringBoot作为Java后端开发的主流框架,无疑是我们手中的得力武器。然而,当我们在享受其自动配置带来的便捷时,是否曾被配置类加载...
- Seata源码—6.Seata AT模式的数据源代理二
-
大纲1.Seata的Resource资源接口源码2.Seata数据源连接池代理的实现源码3.Client向Server发起注册RM的源码4.Client向Server注册RM时的交互源码5.数据源连接...
- 30分钟了解K8S(30分钟了解微积分)
-
微服务演进方向o面向分布式设计(Distribution):容器、微服务、API驱动的开发;o面向配置设计(Configuration):一个镜像,多个环境配置;o面向韧性设计(Resista...
- SpringBoot条件化配置(@Conditional)全面解析与实战指南
-
一、条件化配置基础概念1.1什么是条件化配置条件化配置是Spring框架提供的一种基于特定条件来决定是否注册Bean或加载配置的机制。在SpringBoot中,这一机制通过@Conditional...
- 一招解决所有依赖冲突(克服依赖)
-
背景介绍最近遇到了这样一个问题,我们有一个jar包common-tool,作为基础工具包,被各个项目在引用。突然某一天发现日志很多报错。一看是NoSuchMethodError,意思是Dis...
- 你读过Mybatis的源码?说说它用到了几种设计模式
-
学习设计模式时,很多人都有类似的困扰——明明概念背得滚瓜烂熟,一到写代码就完全想不起来怎么用。就像学了一堆游泳技巧,却从没下过水实践,很难真正掌握。其实理解一个知识点,就像看立体模型,单角度观察总...
- golang对接阿里云私有Bucket上传图片、授权访问图片
-
1、为什么要设置私有bucket公共读写:互联网上任何用户都可以对该Bucket内的文件进行访问,并且向该Bucket写入数据。这有可能造成您数据的外泄以及费用激增,若被人恶意写入违法信息还可...
- spring中的资源的加载(spring加载原理)
-
最近在网上看到有人问@ContextConfiguration("classpath:/bean.xml")中除了classpath这种还有其他的写法么,看他的意思是想从本地文件...
- Android资源使用(android资源文件)
-
Android资源管理机制在Android的开发中,需要使用到各式各样的资源,这些资源往往是一些静态资源,比如位图,颜色,布局定义,用户界面使用到的字符串,动画等。这些资源统统放在项目的res/独立子...
- 如何深度理解mybatis?(如何深度理解康乐服务质量管理的5个维度)
-
深度自定义mybatis回顾mybatis的操作的核心步骤编写核心类SqlSessionFacotryBuild进行解析配置文件深度分析解析SqlSessionFacotryBuild干的核心工作编写...
- @Autowired与@Resource原理知识点详解
-
springIOCAOP的不多做赘述了,说下IOC:SpringIOC解决的是对象管理和对象依赖的问题,IOC容器可以理解为一个对象工厂,我们都把该对象交给工厂,工厂管理这些对象的创建以及依赖关系...
- java的redis连接工具篇(java redis client)
-
在Java里,有不少用于连接Redis的工具,下面为你介绍一些主流的工具及其特点:JedisJedis是Redis官方推荐的Java连接工具,它提供了全面的Redis命令支持,且...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)