加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

位图法统计活跃用户

发布时间:2020-12-14 04:36:47 所属栏目:大数据 来源:网络整理
导读:Setbit 的实际应用 场景: 1亿个用户,每个用户 登陆/做任意操作,记为 今天活跃,否则记为不活跃 每周评出: 有奖活跃用户: 连续7天活动 每月评,等等... 思路: Userid dt active 1 2013-07-27 1 1 2013-0726 1 如果是放在表中,1:表急剧增大,2:要用group,sum运算,
Setbit 的实际应用

场景: 1亿个用户,每个用户 登陆/做任意操作,记为 今天活跃,否则记为不活跃

每周评出: 有奖活跃用户: 连续7天活动
每月评,等等...

思路:

Userid dt active
1 2013-07-27 1
1 2013-0726 1

如果是放在表中,1:表急剧增大,2:要用group,sum运算,计算较慢

用: 位图法 bit-map
Log0721: ‘011001...............0’

......
log0726 : ‘011001...............0’
Log0727 : ‘0110000.............1’

1: 记录用户登陆:
每天按日期生成一个位图,用户登陆后,把user_id位上的bit值置为1

2: 把1周的位图 and 计算,
位上为1的,即是连续登陆的用户

redis 127.0.0.1:6379> setbit mon 100000000 0 (一亿用户星期一的初始状态,都是0)
(integer) 0
redis 127.0.0.1:6379> setbit mon 3 1 (3号用户周一登录一次,计为1)
(integer) 0
redis 127.0.0.1:6379> setbit mon 5 1(5号用户周一登录一次,计为1)
(integer) 0
redis 127.0.0.1:6379> setbit mon 7 1(7号用户周一登录一次,计为1)
(integer) 0
redis 127.0.0.1:6379> setbit thur 100000000 0
(integer) 0
redis 127.0.0.1:6379> setbit thur 3 1
(integer) 0
redis 127.0.0.1:6379> setbit thur 5 1
(integer) 0
redis 127.0.0.1:6379> setbit thur 8 1
(integer) 0
redis 127.0.0.1:6379> setbit wen 100000000 0
(integer) 0
redis 127.0.0.1:6379> setbit wen 3 1
(integer) 0
redis 127.0.0.1:6379> setbit wen 4 1
(integer) 0
redis 127.0.0.1:6379> setbit wen 6 1
(integer) 0
redis 127.0.0.1:6379> bitop and res mon feb wen
(integer) 12500001

如上例,优点:1: 节约空间,1亿人每天的登陆情况,用1亿bit,约1200WByte,约10M 的字符就能表示2: 计算方便

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读