谈谈大数据分析架构
经常有人问,大数据分析要如何开始,怎样使用大数据分析去解决实际问题? 为了能很好的解决问题,需要退一步思考问题,站在具体的应用场景之中,提出整体的解决方案。 大数据以及相关的概念,其根本的目标是为了解决业务问题,即应用场景,这一点我们要时刻记住!虽然大数据的应用场景是从上至下建立的,但是从下而上的解释或许更简单。 数据层: 毫无疑问,架构的最底层是数据,数据支撑着整个架构。数据库和存储器厂商在这一层竞争激烈。具有创新性的hadoop在数据层的影响力不可小觑。 数据展现层: 再往上一层是数据预处理。由于大量的数据按照不同的形式存在,需要数据预处理层将数据从数据源提取、合并、处理成分析所需要的格式。这一领域也拥有很多厂商。 分析层: 再往上是数据分析层,统计是最常用的分析手段,可以使用的工具包括statistics和开源的R。机器学习也是属于这一层,使用机器学习进行自动的分析是数据分析的未来。 展现层: 展现层是数据分析引擎最终的输出,并且紧密依赖应用场景。这一层也被称为执行层、消费层。
应用层: 作为最终的价值层,整个数据分析的架构都为此服务,应用层决定了以上三层应该选择什么样的饿工具。应用的案例包括,欺诈检测、通话故障、网络故障、机器故障等等,就像菜单上的菜名一样多,并且随着数据量的增长不断增长。 最后,你家的大数据分析架构是什么样的?能否谈谈你的看法? 原文地址: http://www.smartdatacollective.com/radhika-subramanian/339005/what-your-big-data-analytics-stack (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |