文章目录
⛄引言
本文参考黑马 点评项目
在各个项目中,我们都可能需要用到UV数据统计功能,这样可以使我们更加方便、快捷的查看网站的活跃度!
一、HyperLoglog基础用法
⛅HyperLoglog 基本语法、命令
HyperLogLog
- PFADD :将指定元素添加到HyperLogLog
- PFCOUNT:返回存储在HyperLogLog结构体的该变量的近似基数,如果该变量不存在,则返回0
- PFMARGE:将多个 HyperLogLog 合并(merge)为一个 HyperLogLog , 合并后的 HyperLogLog 的基数接近于所有输入 HyperLogLog 的可见集合(observed set)的并集.
详见官网:****Redis 中文翻译 官方网站 HyperLogLog
⚡HyperLoglog 命令完成功能实现
PFADD命令
使用PFADD 添加数据
PFCOUNT 统计
- 得到基数值,白话就叫做去重值(1,1,2,2,3, 3)的插入pfcount得到的是3
- 可一次统计多个key
- 时间复杂度为O(N),N为key的个数
- 返回值是一个带有 0.81% 标准错误(standard error)的近似值.
使用PFCOUNT查询
PFMERGE 合并
合并key
HyperLogLog 的应用场景
- 基数不大的、数据量不大就用不上。
- 有局限性,就是只能统计基数数量,没办法统计具体的内容
- 和BitMap相比,属于两种特定统计情况,HyperLogLog比 BitMap去重方便很多
- HyperLogLog 可以 与 BitMap 配合使用,BitMap标识那些用户活跃,HyperLogLog计数
二、UV统计 测试百万数据的统计
☁️什么是UV统计
- UV:全称Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站,只记录1次。
- PV:全称Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录1次PV,用户多次打开页面,则记录多次PV。往往用来衡量网站的流量。
通常来说 UV 会比 PV 大很多,一个网站的独立访客量 和 页面访问或点击量,肯定是独立访客大的。
UV统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计过的用户信息保存。但是如果每个访问的用户都保存到Redis中,数据量会非常恐怖,那怎么处理呢?
Hyperloglog(HLL)是从Loglog算法派生的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。
Redis 中的HLL 是基于string数据结构实现的,单个HLL的内存永远小于16kb, 内存极低!作为代价,其测量结果是概率性的,有小于0.81%的误差。不过对于UV统计来说,这完全可以忽略。
⚡使用SpringBoot单元测试进行测试百万数据统计
首先进入Redis 查看 内存占用
info memory
核心源码
@TestvoidtestHyperLoglog(){String[] values =newString[1000];int j =0;for(int i =0; i <1000000; i++){
j = i %1000;
values[j]="user"+ i;if(j ==999){//发送至redis
stringRedisTemplate.opsForHyperLogLog().add("hl2", values);}}//统计数量Long count = stringRedisTemplate.opsForHyperLogLog().size("hl2");System.out.println("count = "+ count);}
执行后,如下图
再次查看内存占比
可以看出占用大约为14KB,存储上百万数据只占用了14KB数据,可见HyperLogLog的强大!
⛵小结
以上就是【Bug 终结者】对 微服务Spring Boot 整合 Redis 实现 UV 数据统计 的简单介绍,UV数据统计功能是很常用的,在项目中,是一个不错的亮点,统计功能也是各大系统中比较重要的功能,签到完成后,去统计本月的连续 签到记录,来给予奖励,可大大增加用户对系统的活跃度,HyperLogLog可以与BitMap相结合,从而能够能高效的对网站进行深层次的分析!**
技术改变世界!!!
**
如果这篇【文章】有帮助到你,希望可以给【Bug 终结者】点个赞👍,创作不易,如果有对【后端技术】、【前端领域】感兴趣的小可爱,也欢迎关注❤️❤️❤️ 【Bug 终结者】❤️❤️❤️,我将会给你带来巨大的【收获与惊喜】💝💝💝!
版权归原作者 Bug 终结者 所有, 如有侵权,请联系我们删除。