认识大数据分析
最近关注大数据,读了一些相关的书和文章,这里对自己在大数据概念上做一个总结。 1. 大数据是泡沫吗?泡不泡沫有什么关系? 大数据很热,热的让人都觉得有问题了。不过,大数据应该是有一定含金量的,否则,没人会炒作它,至于泡沫有多大,要真正了解大数据才知道。 泡不泡沫其实跟大数据没关系,大数据就在那,泡沫就只是别人的炒作。 泡沫破裂后,大数据可能会暂时被很多企业放在一边,但随着其价值的存在,必定会慢慢兴起,因为数据分析的动机一直都存在。 大数据改变是分析专家所使用的分析策略和工具,但不会从根本上改变分析的动机,以及从分析中可获取的价值。 2. 大数据的特点、价值在哪里?或者说谁有这个需求?或者说让谁知道他有这个需求? 大数据不仅是容量大、还有复杂性、速度及多样性等特征。 其价值威力,不是体现在“大”或“数据”,而是对其进行的分析和行动。 而且大数据不意味着控制所有数据,而是抽取重要的部分即可。如何确定哪些是重要的部分? 前期,可以收集一些样本数据,然后,分析确定,哪些是重要的数据。 其重要的价值体现:与其他数据结合后,所带来的业务价值。 3. 大数据与传统的数据分析 有什么区别? 分析策略和工具的不同,但其分析动机,及获取的价值,可能大部分都无分别。 ?两者都是整体数据和分析的一部分。 4. 哪些数据该被收集?目前常用的分析应用有哪些?(是不是新的商业搜索机会?从哪些小处、痛点找到需求?) 交易数据、网络行为数据、客户接触点等数据,都应当被收集,然后,进行分析。这些数据会将分析带到新的高度。 大数据分析相关的应用: 推荐商品 流失模型 响应模型 顾客分类 顾客搜索 在线广告分析 车载信息的应用:车险、交通管理、道路规划、辅助驾驶 LBS:基于位置的服务。时间与位置信息 的影响力 库存分析 欺诈分析 员工绩效分析 电力系统、电量分析 作弊分析 设备传感器数据 来进行故障诊断 游戏类数据分析:玩家分类、定位交易等 社交网络类的分析:电信业,从账号分析,转移到用户社交网络关联分析 金融行业顾客投诉原因分析,提示业务效率(其他行业也是可以的吧,如电信) 3. 大数据分析如何部署?企业如何采用正确的策略,流程和方法去实施大数据分析?? 1)关注新的并行能力、可扩展性。MMP数据库,云计算架构,MapReduce的并发的分析方式。 2)更新分析的流程,熟悉沙箱,传统分析数据集ADS,企业分析数据集EADS的架构和区别 3)各种高级工具与方法的使用。单点解决方案、R开源工具、用户界面数据可视化、模型的简单与复杂、模型组合等相关概念。 4)关注业务应用。报表与高级分析的区别。高级分析是研究“为什么发生”,“该怎么做”,提供方案;选取分析结果,不能忽视不利的结论,而选取有利的结论。 4. 大数据的问题不是技术问题,而是人、文化、流程或基础设施的问题 参考: 《驾驭大数据》 其他 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |