大数据统计之基数估计(Cardinality Estimation):LogLog Count
1、解读Cardinality Estimation算法(第一部分:基本概念) http://blog.codinglabs.org/articles/cardinality-estimation.html 2、解读Cardinality Estimation算法(第二部分:Linear Counting) http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-ii.html 3、解读Cardinality Estimation算法(第三部分:LogLog Counting) http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iii.html 4、解读Cardinality Estimation算法(第四部分:HyperLogLog Counting及Adaptive Counting) http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iv.html 5、大数据计数:如何仅用1.5KB内存为十亿对象计数 http://www.csdn.net/article/2012-12-21/2813063-big-data-counting-how-to-count- 6、基数估值算法在TDW中的应用 http://mta.qq.com/mta/bigdata/?p=567 7、上述算法的开源库:stream-lib https://github.com/addthis/stream-lib 8、Java使用极小的内存完成对超大数据的去重计数,用于实时计算中统计UV http://lxw1234.com/archives/2015/09/516.htm 9、基于Storm的Nginx log实时监控系统:基数计数 http://tech.uc.cn/?p=2866#more-2866 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |