在Scala中,您可以以串行和并行的方式提交Spark作业。看看如何使用
for
和
par.foreach
构造对应的例子。
串行Spark作业(使用
for
)
// 串行Spark作业设置for(tag <- tags){
spark.sparkContext.setJobGroup(tag.toString,s"Tag: $tag")// 为每个标签执行Spark操作}
并行Spark作业(使用par.foreach)
// 并行Spark作业设置
tags.par.foreach { tag =>
spark.sparkContext.setJobGroup(tag.toString,s"Tag: $tag")// 并行执行每个标签的Spark操作}
关键区别
for用于顺序处理,而par.foreach允许并行处理。
本文转载自: https://blog.csdn.net/Mint6/article/details/134463110
版权归原作者 Mint6 所有, 如有侵权,请联系我们删除。
版权归原作者 Mint6 所有, 如有侵权,请联系我们删除。