hincky的主页 hincky的主页
  • 学习笔记

    • Vue笔记
    • Vuepress
    • nginx
  • 语言类

    • java
    • go
    • python
    • 设计模式
  • 框架类

    • Spring
    • Spring Security
    • Mybatis
  • 容器技术

    • docker
    • k8s
    • helm
    • prometheus
    • grafana
    • jenkins
  • 命令集合

    • linux命令
    • docker命令
    • git命令
    • vim命令
    • k8s命令
  • 数据库

    • sql
    • mysql
  • 协议

    • 网络模型
    • http/1.1
    • WebSocket
    • http/2
    • TLS/SSL
    • tcp
    • IP
    • tcpdump抓包命令
    • wireshark抓包工具
  • 通用

    • Git
  • 技术分享

    • git push/pull总是超时怎么办
    • idea debug技巧
    • postman使用
    • 问题总结
    • idea使用技巧
  • Oauth2

    • Oauth2原理
  • 项目列表

    • redis项目
    • 微服务项目
  • 分类
  • 标签
  • 归档
  • 随笔
GitHub (opens new window)

Hincky

当有趣的人,做想做的事
  • 学习笔记

    • Vue笔记
    • Vuepress
    • nginx
  • 语言类

    • java
    • go
    • python
    • 设计模式
  • 框架类

    • Spring
    • Spring Security
    • Mybatis
  • 容器技术

    • docker
    • k8s
    • helm
    • prometheus
    • grafana
    • jenkins
  • 命令集合

    • linux命令
    • docker命令
    • git命令
    • vim命令
    • k8s命令
  • 数据库

    • sql
    • mysql
  • 协议

    • 网络模型
    • http/1.1
    • WebSocket
    • http/2
    • TLS/SSL
    • tcp
    • IP
    • tcpdump抓包命令
    • wireshark抓包工具
  • 通用

    • Git
  • 技术分享

    • git push/pull总是超时怎么办
    • idea debug技巧
    • postman使用
    • 问题总结
    • idea使用技巧
  • Oauth2

    • Oauth2原理
  • 项目列表

    • redis项目
    • 微服务项目
  • 分类
  • 标签
  • 归档
  • 随笔
GitHub (opens new window)
  • redis-点评项目

    • 基础篇

    • 实战篇

      • 导读
        • 开篇导读
      • 短信登录
        • 导入项目
          • 导入SQL
          • 有关当前模型
          • 导入后端项目
          • 导入前端工程
          • 运行前端项目
        • 基于Session实现登录流程
        • 实现发送短信验证码功能
        • 实现登录拦截功能
        • 隐藏用户敏感信息
        • session共享问题
        • Redis代替session的业务流程
          • 设计key的结构
          • 设计key的具体细节
          • 整体访问流程
        • 基于Redis实现短信登录
        • 解决状态登录刷新问题
          • 初始方案思路总结:
          • 优化方案
          • 代码
      • 商户查询缓存
        • 什么是缓存?
          • 为什么要使用缓存
          • 如何使用缓存
        • 添加商户缓存
          • 缓存模型和思路
          • 代码如下
        • 缓存更新策略
          • 数据库缓存不一致解决方案:
          • 数据库和缓存不一致采用什么方案
        • 实现商铺和缓存与数据库双写一致
        • 缓存穿透问题的解决思路
        • 编码解决商品查询的缓存穿透问题:
        • 缓存雪崩问题及解决思路
        • 缓存击穿问题及解决思路
        • 利用互斥锁解决缓存击穿问题
      • 利用逻辑过期解决缓存击穿问题
        • 利用逻辑过期解决缓存击穿问题
        • 封装Redis工具类
      • 优惠劵秒杀
        • 全局唯一ID
        • Redis实现全局唯一Id
        • 添加优惠卷
        • 实现秒杀下单
        • 库存超卖问题分析
        • 乐观锁解决超卖问题
        • 优惠券秒杀-一人一单
        • 集群环境下的并发问题
      • 分布式锁-redis
        • 基本原理和实现方式对比
        • Redis分布式锁的实现核心思路
        • 实现分布式锁版本一
        • Redis分布式锁误删情况说明
        • 解决Redis分布式锁误删问题
        • 分布式锁的原子性问题
        • Lua脚本解决多条命令原子性问题
        • 利用Java代码调用Lua脚本改造分布式锁
      • 分布式锁-redission
        • 分布式锁-Redission快速入门
        • 分布式锁-redission可重入锁原理
        • 分布式锁-redission锁重试和WatchDog机制
        • 分布式锁-redission锁的MutiLock原理
      • 秒杀优化
        • 秒杀优化-异步秒杀思路
        • 秒杀优化-Redis完成秒杀资格判断
        • 秒杀优化-基于阻塞队列实现秒杀优化
      • 消息队列
        • 认识消息队列
        • 基于List实现消息队列
        • 基于PubSub的消息队列
        • 基于Stream的消息队列
        • 基于Stream的消息队列-消费者组
        • Stream-异步秒杀下单
      • 网红探店
        • 发布探店笔记
        • 查看探店笔记
        • 点赞功能
        • 点赞排行榜
      • 好友关注
        • 关注和取消关注
        • 共同关注
        • Feed流实现方案
        • 推送到粉丝收件箱
        • 实现分页查询收邮箱
      • 附近商户
        • GEO数据结构的基本用法
        • 导入店铺数据到GEO
        • 实现附近商户功能
      • 用户签到
        • BitMap功能演示
        • 实现签到功能
        • 签到统计
        • bitmap来解决缓存穿透
      • UV统计
        • UV统计-HyperLogLog
        • 测试百万数据的统计
    • 高级篇

  • springcloud微服务项目

  • 项目实战
  • redis-点评项目
  • 实战篇
hincky
2022-11-08
目录

UV统计

# UV统计-HyperLogLog

首先我们搞懂两个概念:

  • UV:全称Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站,只记录1次。
  • PV:全称Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录1次PV,用户多次打开页面,则记录多次PV。往往用来衡量网站的流量。

通常来说UV会比PV大很多,所以衡量同一个网站的访问量,我们需要综合考虑很多因素,所以我们只是单纯的把这两个值作为一个参考值

UV统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计过的用户信息保存。但是如果每个访问的用户都保存到Redis中,数据量会非常恐怖,那怎么处理呢?

Hyperloglog(HLL)是从Loglog算法派生的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。相关算法原理大家可以参考:https://juejin.cn/post/6844903785744056333#heading-0 Redis中的HLL是基于string结构实现的,单个HLL的内存永远小于16kb,内存占用低的令人发指!作为代价,其测量结果是概率性的,有小于0.81%的误差。不过对于UV统计来说,这完全可以忽略。

1653837988985

# 测试百万数据的统计

测试思路:我们直接利用单元测试,向HyperLogLog中添加100万条数据,看看内存占用和统计效果如何

1653838053608

经过测试:我们会发生他的误差是在允许范围内,并且内存占用极小

编辑 (opens new window)
#redis
用户签到
分布式缓存

← 用户签到 分布式缓存→

最近更新
01
人生前期重要的能力
05-17
02
防火墙命令
04-11
03
docker-compose部署mysql主从集群
03-22
更多文章>
Theme by Vdoing | Copyright © 2022-2023 Hincky | MIT License | 粤ICP备2022120427号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式