加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > 安全 > 正文

scala – 合并循环中生成的多个RDD

发布时间:2020-12-16 09:55:33 所属栏目:安全 来源:网络整理
导读:我在 scala中调用一个函数,它给出了一个RDD [(Long,Long,Double)]作为输出. def helperfunction():RDD [(长,长,双)] 我在代码的另一部分循环调用此函数,我想合并所有生成的RDD.调用该函数的循环看起来像这样 for (i - 1 to n){ val tOp = helperfunction()
我在 scala中调用一个函数,它给出了一个RDD [(Long,Long,Double)]作为输出.

def helperfunction():RDD [(长,长,双)]

我在代码的另一部分循环调用此函数,我想合并所有生成的RDD.调用该函数的循环看起来像这样

for (i <- 1 to n){
    val tOp = helperfunction()
    // merge the generated tOp
}

我想要做的是类似于StringBuilder在你想要合并字符串时为你做的事情.我已经研究了合并RDD的技术,这些技术主要指向使用这样的union函数

RDD1.union(RDD2)

但是这需要在结合之前生成两个RDD.我虽然初始化一个var RDD1来累积for循环之外的结果,但我不知道如何初始化[[Long,Double]]类型的空白RDD.另外我开始使用spark,所以我甚至不确定这是否是解决此问题的最优雅的方法.

解决方法

您可以使用函数式编程范例来实现您想要的,而不是使用变量:

val rdd = (1 to n).map(x => helperFunction()).reduce(_ union _)

此外,如果您仍需要创建一个空的RDD,您可以使用以下命令:

val empty = sc.emptyRDD[(long,long,String)]

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读