加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > 安全 > 正文

scala – 如何在Spark中打印特定RDD分区的元素?

发布时间:2020-12-16 09:28:51 所属栏目:安全 来源:网络整理
导读:如何打印特定分区的元素,比如第五,单独? val distData = sc.parallelize(1 to 50,10) 解决方法 使用Spark / Scala: val data = 1 to 50val distData = sc.parallelize(data,10)distData.mapPartitionsWithIndex( (index: Int,it: Iterator[Int]) =it.toLis
如何打印特定分区的元素,比如第五,单独?

val distData = sc.parallelize(1 to 50,10)

解决方法

使用Spark / Scala:

val data = 1 to 50
val distData = sc.parallelize(data,10)
distData.mapPartitionsWithIndex( (index: Int,it: Iterator[Int]) =>it.toList.map(x => if (index ==5) {println(x)}).iterator).collect

生产:

26
27
28
29
30

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读