加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据处理技术

发布时间:2020-12-14 02:23:50 所属栏目:大数据 来源:网络整理
导读:1.大数据 容量(volume) 速度(velocity) 数据多样性(variety of Big Data) 2.大数据的解决方法 充足的储存能力—虚拟化存储 高速度的计算平台—多核处理器,网络计算机,内存内计算 高新能的运算平台 —容错系统 处理各种数据的能力 —分布式计算 及时

1.大数据

  1. 容量(volume)
  2. 速度(velocity)
  3. 数据多样性(variety of Big Data)

2.大数据的解决方法

  • 充足的储存能力—虚拟化存储
  • 高速度的计算平台—多核处理器,网络计算机,内存内计算
  • 高新能的运算平台 —容错系统
  • 处理各种数据的能力 —分布式计算
  • 及时定制化信息传递 —移动设备,可视化范例,实时报警

关键技术:分布式与并行计算,Hadoop。
虚拟化:分区,隔离,封装

3.云计算

  1. IaaS—将硬件,存储和网络作为服务提供—eg:虚拟机,负载平衡器,网络附加存储
  2. PaaS—编写,运行程序—eg:Windows Azure 谷歌应用程序引擎(GAE)
  3. SaaS—IaaS,PaaS必须先运行起来,方能用。

4.并行计算技术

  1. 集群和网格
  2. 大规模并行处理(MPP)—eg:EMC Greenplum,ParAccel
  3. 高性能计算(HPC)

5.Spark

官方Spark: http://spark.apache.org/
入门简介:http://blog.jobbole.com/89446/

  1. 实现语言—Scala
  2. 整合了内存计算的基元
  3. SparkSQL—支持通过SQL或者Hive查询语言来查询数据
  4. Streaming—支持对流数据的实时处理
  5. MLlib—机器学习库
  6. Graphx—图处理

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读