0


【大数据实验五】 MapReduce初级编程实践

大数据实验五 MapReduce初级编程实践

1实验目的
1.通过实验掌握基本的MapReduce编程方法;
2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。
2实验平台
已经配置完成的Hadoop伪分布式环境。
(1)操作系统:Linux(Ubuntu18.04)
(2)Hadoop版本:3.1.3
3实验内容和要求
1.编程实现文件合并和去重操作
在这里插入图片描述
在这里插入图片描述

  1. 编写程序实现对输入文件的排序

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  1. 对给定的表格进行信息挖掘

本文转载自: https://blog.csdn.net/m0_51011320/article/details/130977980
版权归原作者 almostspring 所有, 如有侵权,请联系我们删除。

“【大数据实验五】 MapReduce初级编程实践”的评论:

还没有评论