Python3实战spark大数据分析及调度 ???
Python3实战spark大数据分析及调度? ??? 一、实例分析1.1 数据 student.txt? ? ? ? ? ? 1.2 代码? ? ? ? ? ? ? ? ? ? ? ? 二、代码解析2.1函数解析2.1.1 collect()RDD的特性 ? ? ? ? ? ? ? ? 在进行基本RDD“转换”运算时不会立即执行,结果不会显示在显示屏中,collect()是一个“动作”运算,会立刻执行,显示结果。 2.1.2 reduce() 语法 参数 ? ? ? ? 2.1.3 type()语法class type(name,bases,dict) 参数
返回值一个参数返回对象类型,三个参数,返回新的类型对象。 实例? ? ? ? ? ? ? ? 三、问题分析? ? ? ? ? 解析1、检查拼写是否有误 四、实例 小练4.1 数据 user_small? ? ? ? ? 4.2 用户上网记录统计(一行为一条记录).(用户:第3列)? ? ? ? ? ?? ?4.2用户流量统计。分别统计上行流量及下行流量并将结果各列以空格键隔开输出到文件。(用户:第3列;上行流量:第25列;下行流量:第26列) ? ? ? ? ? 4.3 统计用户总流量? ? ? ? ? 4.4、微信APP流量统计。(微信APP特征MicroMessenger,位于第20列,统计对应的下行流量值——第26列的数值。)? ? ? ? ? 谢谢观看。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |