0


RDD的创建 头歌答案

RDD的创建

第1关 集合并行化创建RDD

编程要求

根据提示,在右侧编辑器

  1. begin-end

处补充代码,计算并输出各个学生的总成绩。

  • ("bj",88)bj指学生姓名,88指学生成绩。

测试说明

平台会对你编写的代码进行测试:

预期输出:

  1. (bj,254)` `(sh,221)` `(gz,285)

开始你的任务吧,祝你成功!

代码

  1. import org.apache.spark.rdd.RDD
  2. import org.apache.spark.SparkContext
  3. import org.apache.spark.SparkConf
  4. object Student {
  5. def main(args: Array[String]): Unit = {
  6. val conf = new SparkConf().setAppName(this.getClass.getSimpleName).setMaster("local")
  7. val sc = new SparkContext(conf)
  8. val arr1=Array(("bj",88),("sh",67),("gz",92))
  9. val arr2=Array(("bj",94),("sh",85),("gz",95))
  10. val arr3=Array(("bj",72),("sh",69),("gz",98))
  11. /********** begin **********/
  12. //第一步:先将数组进行合并
  13. val arr=arr1++arr2++arr3
  14. //第二步:创建RDD
  15. val stuRDD=sc.makeRDD(arr)
  16. //第三步:把相同key的进行聚合
  17. val result=stuRDD.reduceByKey(_+_)
  18. //第四步:输出
  19. result.foreach(println)
  20. /********** end **********/
  21. sc.stop()
  22. }
  23. }

第2关:读取外部数据集创建RDD

编程要求

根据提示,在右侧编辑器

  1. begin-end

处补充代码,按每位老师出现的次数降序,输出老师姓名和出现次数。

  • 输入文件样例:
  1. bigdata,laozhang` `bigdata,laoduan` `javaee,xiaoxu
  1. bigdata

指科目,

  1. laozhang

指老师名称。

测试说明

平台会对你编写的代码进行测试:

预期输出:

  1. (laozhao,15)
  1. (laoyang,9)
  1. (laoduan,5)
  1. (xiaoxu,4)
  1. (laoli,3)
  1. (laozhang,2)
  1. (laoliu,1)

开始你的任务吧,祝你成功!

  1. import org.apache.spark.SparkContext
  2. import org.apache.spark.SparkConf
  3. object Teachers {
  4. def main(args: Array[String]): Unit = {
  5. val conf = new SparkConf().setAppName("Teachers").setMaster("local")
  6. val sc = new SparkContext(conf)
  7. val dataFile = "file:///root/step2_files"
  8. /********** begin **********/
  9. //第一步:以外部文件方式创建RDD
  10. val teaRDD=sc.textFile(dataFile)
  11. //第二步:将文件中每行的数据切分,得到自己想要的返回值
  12. val teacher=teaRDD.map(line => {
  13. val course=line.split(",")(0)
  14. val name=line.split(",")(1)
  15. (name,1)
  16. })
  17. //第三步:将相同的key进行聚合
  18. val tea=teacher.reduceByKey(_+_)
  19. //第四步:按出现次数进行降序
  20. val result=tea.sortBy(_._2,false,3)
  21. //第五步:输出
  22. result.foreach(println)
  23. /********** end **********/
  24. sc.stop()
  25. }
  26. }
标签: spark scala java

本文转载自: https://blog.csdn.net/weixin_54237806/article/details/128477156
版权归原作者 4师傅 所有, 如有侵权,请联系我们删除。

“RDD的创建 头歌答案”的评论:

还没有评论