?? BI | 超越咨询顾问的算力,在BI:大数据改变管理咨询
消费品企业应该如何使用内部产生以及外部采集的数据,像互联网公司一样建立用户画像与会员体系,以数据驱动的方式进行精细化的生产,运营和销售? 传统的管理咨询公司,虽然有无数顶尖的大脑,但是他们的大脑只靠Excel等简单工具的辅助,这样的算力,能不能满足上述的需求? 在2015年上半年,我们团队有幸为国内一家时尚消费品行业的龙头公司进行数据平台的建设,历时半年,完成了内部数据的打通和洞察,用户画像,会员体系的搭建,以及外部数据获取与跟踪。 在这里和大家分享我自己的一些体会,希望更多的消费品企业可以用数据驱动的方式来进行精细化的运作。 其实作为龙头消费品企业,其数据生产能力与中等规模的互联网公司不相上下,支撑日常业务的IT系统大大小小共有十余个,比如: 1)分销系统: 支撑全国上千家线下门店每日的销售配货,每日订单量在数十万量级; 2)电商订单系统: 负责处理十余个主流电商(京东,天猫,唯品会,一号店,聚美,亚马逊,当当网,有赞等)的订单管理与客服; 3)仓库管理系统:负责全国各大区域的仓储物流,数千个SKU的备货情况; 4)BI系统: 负责各主要业务系统的数据聚合,制成日常统计报表;外加大大小小的财务系统,人力系统,绩效系统,品牌/分公司订货系统等,每日产生的数据维度以及量级其实已经相当庞大。 但和互联网公司相比,消费品企业的数据消费,数据分析能力存在明显的短板。越来越多的管理层也十分希望像互联网公司一样管理用户和数据,使用数据驱动他们的决策。 面对这样庞杂而分散的数据以及对快速实时产生数据的渴求,不仅传统企业的IT及经营分析部门束手无策,再高端的管理咨询公司也只能挠挠头说“臣妾做不到呀”,实在是超越了这群聪明人大脑的算力。 接下来会从三个角度分享如何为传统行业搭建数据平台,首先介绍大数据(数据科学)与商业智能(BI)在消费品领域的应用,然后详细讲解用户画像与用户体系搭建,最后分享如何利用外部数据(电商,社交媒体)对行业趋势与其他企业的运营进行监控。 在这里面所用到的数据相关的技术,已经大大超越管理咨询顾问的算力。如同封面图中的《魔戒》水晶球Palantiri,它如同数据技术赋予了人类及精灵看到任何地方的能力。 而传统的人类,无论如何提高人肉的眼力,也只能到目力所及的有限范围。 1. 大数据和商业智能(BI) 我们很少说自己是一家大数据公司,因为大数据这三个字的意义更多是指一种概念和思维方式,并没有什么具体的含义,既不是一种工作也不是一种技术,可能勉强算得上是一些门槛稍高的,和数据科学有关的算法,技术以及工具的统一称谓,比如数据挖掘(聚类,关联),机器学习(逻辑回归,神经网络),比如自然语言处理,比如分布式运算(Hadoop,Spark)。 但在服务具体企业的时候,我们难免会被套上大数据的壳子,毕竟大家都在找能做“大数据”的公司。 1.1 商业智能(BI) 其实软件厂商所提供的BI软件与广义的BI概念还是有很大程度的区别。 为了追求高度的抽象化与通用性,BI软件大部分时间所承担的责任是一家公司的各类报表应用:将各个IT系统的数据聚合至BI,然后进行统计汇总,并统一在前端通过BI portal呈现出图表与数值,便于业务人员了解日常数据和运营情况。 ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。其实传统的消费品企业面对零散的数据库,特别需要ETL的服务。 ETL看似低端,其实当今的大数据顶尖企业Palantir,在最初为CIA服务的时候,也是从ETL开始的,让美帝特工不用在分散的多个数据库上分别做一次查询。 这也就决定了BI软件的sweet spot在于监控和绘制通用性的统计报表,比如时间序列统计,分布统计,分段统计等等。 BI软件的强项是将这些业务数据汇总起来,无需编程即可绘制出可供长期监控的可视化报表,同时实现随时更新,而不是传统管理咨询的一份静态报告。传统咨询提供的报告,往往在出炉的第一天就过时了。
1.2 数据科学 反观数据科学,如果站在一个数据工程师的立场上,BI软件做的事情其实也属于数据分析的范畴,任何数据洞察,数据挖掘工作都需要涉及到这些通用维度的基本统计。 举一个实际的例子,图3是用户重复购买间隔的CDF曲线(Cumulative distribution function)。横坐标代表天数,纵坐标代表百分比。
除了复杂和高定制性的统计逻辑外,对于非结构化数据的处理和挖掘也并非BI软件的强项。对于大型消费品公司来说,全电商渠道的运营已经成了常态,每日来自京东,天猫,唯品会,一号店,聚美这些大型电商平台的订单数高达数万个。 热力图这样的算力往往超过了管理咨询公司的能力范围,然而对于用户的选址却是很有价值。
对于一些并无日常监控必要的统计,有时也会贡献许多有价值的洞察。图5展示了线上用户购买时间的分布情况。可以看得出,周末线上购物的时间十分均匀,除了半夜之外大部分时间段都有网购发生。
和图5类似,图6将线上用户的购买数据按照一周七天进行分布统计,也会出现一些有意思的现象,比如周六周日上网买东西的用户极少,每周网购的高峰出现在周一和周二。 像图5,图6这样的数据洞察往往也是BI软件无法捕捉到的。数据工程师们可以将这些没有长期监控的意义的指标转化成拥有商业价值的洞察。同时这又是传统的管理咨询公司无法做到的,因为他们缺乏能力整合如此海量的数据并按天甚至按小时进行实时输出。
个人认为,数据科学(大数据)和广义的商业智能原本没有本质区别,两者都涵盖了非常广泛的内容,并且两者的核心都是通过数据处理和分析的方式,提升业务表现。 与传统的管理咨询公司相比,在BI层面,大数据的相关技术胜在算力:数据整合能力、实时处理能力以及呈现能力。 End. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |