大数据分析然并卵?那是因为你没做到这些
看到这篇文章,感觉对数据分析一些点总结蛮好的,分享给大家。数据分析要产生真正的价值,或者说要让业务方,管理层感觉到真正的价值,其实需要非常多的东西:
好了,一起来看看本文吧! 有人认为大数据只是一个空洞的商业术语,大有概念炒作的嫌疑。事实上,大数据只是对于不同的人有不同的含义。众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的、深入的、有价值的信息。 那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。那么在执行过程中通常会遇到哪些问题,我们该如何应对呢? 1放慢脚步 回头看路初创公司里的人们仿佛一直在被人念着紧箍咒:“要么快要么死。”他们是如此着急于产品开发,以至于他们常常没有空想用户对产品的具体使用细节,产品在哪些场景怎么被使用,产品的哪些部分被使用,以及用户回头二次使用产品的原因主要有哪些。而这些问题如果没有数据难以回答。 2记录足够多的数据光给你的团队看呈现总结出来的数据是没有用的。如果没有精确到日乃至小时的变化明细,你无法分析出来数据变化背后看不见的手。如果只是粗放的,断续的统计,没有人可以解读出各种细微因素对于销售或者用户使用习惯的影响。 与此同时,数据储存越来越便宜。同时做大量的分析也不是什么高风险的事情,只要买足够的空间就不会有系统崩溃的风险。因此,记录尽可能多的数据总不会是一件坏事。 不要害怕量大。对于初创企业来说,大数据其实还是比较少见的事情。如果正处于初创期的你果真(幸运地)有这样的困扰,推荐使用Hadoop平台。 3及时解答团队成员的疑惑许多公司以为他们把数据扔给Mixpanel,Kissmetrics,或者Google Analytics就够了,但他们常常忽略团队的哪些成员能真正解读这些数据的内在含义。你需要经常提醒团队里面每位成员多去理解这些数据,并更多地基于数据来做决策。否则,产品团队只会盲目地开发产品,并祈祷能踩中热点,不管最终成功还是失败都是一头雾水。 这就像有天你决定采用市场上常见的病毒营销手段吸引新用户。如你所愿,用户量啪啪啪地上来了。可此时你会遇到新的迷茫:你无法衡量这个营销手段对老用户的影响。人们可能被吸引眼球,注册为新用户,然后厌倦而不再使用。你可能为吸引了一帮没有价值的用户付出了过高的代价。而你的产品团队可能还在沾沾自喜,认为这个损害产品的营销手段是成功的。 这种傻错误经常发生。而如果你的企业在一开始就建立起人人可自助使用的数据平台,来解答他们工作中最重要的疑惑,则可以避免上文所说的悲剧。 4把数据存放在合适的地方先让我们来看一个正确示范吧。Porerfield提到他有个客户整合了NoSQL,Redshift,Kitnesis以及Looker的资源自创了一个数据分析框架。这个框架不仅能在很高的量级上捕获及储存自己的数据,还能承受每月数以百万计的点击流量,还能让所有人查询自己想要的数据。这个系统甚至可以让不懂SQL语言的小白用户们真正理解数据的意义。而在数据分析的世界里,基本上如果你不会SQL,你就完蛋了。如果总是要等待工程师去把数据跑出来,那就是把自己陷入困境。而工程师在不理解需求的情况下建立的算法或者买的软件对于使用者来说往往是个煎熬,因为他们对数据的使用往往与前者不再同一水平线上。 你需要让你所有的数据都存放在同一个地方。这个是关键关键最关键的原则。 5不拘泥于一个系统任何一个好的数据分析框架在设计之初都必须满足长期使用的需要。诚然,你总是可以调整你的框架。但数据积累越多,做调整的代价越大。而且常常做出调整后,你需要同时记录新旧两套系统来确保数据不会丢失。 因此,我们最好能在第一天就把框架设计好。其中一个简单粗暴有效地方法就是所有能获取的数据放在同一个可延展的平台。不需要浪费时间选择一个最优解决方法,只要确认这个平台可以装得下所有将来可能用到的数据,且跨平台也能跑起来就行了。一般来说这样的原始平台能至少支撑一到两年。 6不过度总结这个问题对于拥有大? 人们常常自我陶醉于做出了几张漂亮的图标或者PPT。这些总结性的表达看上去很令人振奋,但我们不应该基于这些肤浅的总结来做决策,因为这些漂亮的总结性陈述并不能真正反映问题的实质。相反,我们更应该关注极端值(Outliers)。 近期精彩活动(直接点击查看): 福利 · 阅读 | 免费申请读大数据新书 第10期 版权声明: 转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。 为大家提供与大数据相关的最新技术和资讯。 近期精彩文章(直接点击查看): 160718?12种思维导图工具助你成为结构化思维专家 160717?从O2O到全民直播:95%的创业者败给了认知界限? 160714?关于反爬虫,看这一篇就够了 160710?他是比尔盖茨的偶像,用50年写出编程圣经,被奉为程序员鼻祖 160611?腾讯的实践表明:最重要的不是大数据,而是…… 160519?史上最全的大数据分析和制作工具 160515?深解读:什么是数据科学?如何把数据变成产品?? 160511?一篇文看懂Hadoop:风雨十年,未来何去何从 160510?全球20个最佳大数据可视化工具,高级PPTers的法宝 160503?一篇对大数据深度思考的文章,让你认识并读懂大数据 160428?2016年,文本分析、情感分析和社交分析的10大趋势 160423?10年内,这三大领域将被人工智能和大数据重塑 160412?爬取QQ空间3000万用户,玩玩大数据分析? 160331?华为内部狂转好文,有关大数据,看这一篇就够了! 160303?大数据的误区:数据统计≠大数据 160102?自拍有风险!大数据在用什么姿势“出卖”你? 151219?2016年大数据发展七大趋势 150928?大数据研究常用软件工具与应用场景 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |