加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据测试之Hadoop的基本概念

发布时间:2020-12-14 02:10:00 所属栏目:大数据 来源:网络整理
导读:大数据测试之Hadoop的基本概念 ? ? ?poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标,也是国内最早探索大数据测试培训的机构,开发了独有的课程体系。如果对课程感兴趣,请大家咨询qq:90

大数据测试之Hadoop的基本概念

? ? ?poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标,也是国内最早探索大数据测试培训的机构,开发了独有的课程体系。如果对课程感兴趣,请大家咨询qq:908821478,咨询电话010-84505200。

?

一、服务形式

?????? Saas(Software as a Service)基础设施作为服务、Paas(Platform as a service)平台作为服务、Iaas(Infrastructure as a Service)软件作为服务。

?

二、云计算技术体系结构

????? 物理资源层:计算机、存储器、网络设施、数据库、软件。

????? 资源池层:计算资源池、存储资源池、网络资源池、数据资源池、软件资源池。

????? 管理中间层:负责资源管理、任务管理、用户管理和安全管理等工作。

????? SOA构建层:服务接口、服务注册、服务查找、服务访问、服务工作流。

?

三、HDFS文件系统

??????HDFS:用于提供高吞吐量的分布式文件系统,用GFS实现开源。hadoop分布式软件架构的基础部件。默认每个数据块有两个备份,备份子不同的位置上。

????? NameNode:HDFS集群中只有一个NameNode。管理文件系统所有的元数据,包括名字空间、访问控制信息、文件到块的映射信息、文件块的位置信息等。

????? DataNode:部署在物理机器上,负责数据的存储和管理。名字节点用心跳和NameNode指示是否存活。

?

四、MapReduce实现机制

???????Map:数据的分片统计。

?????? Shuffle:数据从Maptask到Reducetask传输过程,是mapreduce的核心。

?????? Reduce:数据的聚合统计。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读