0


MapReduce课程设计-----好友推荐功能

一、项目说明

 互为推荐关系

 非好友的两个人之间存在相同好友则互为推荐关系

 朋友圈两个非好友的人,存在共同好友人数越多,越值得推荐

 存在一个共同好友,值为1;存在多个值累加

二、程序需求

1.需求:

 程序要求,给每个人推荐可能认识的人

 互为推荐关系值越高,越值得推荐

 每个用户,推荐值越高的可能认识的人排在前面

2.数据:

 数据使用空格分割

 每行是一个用户以及其对应的好友

 每行的第一列名字是用户的名字,后面的是其对应的好友

创建friends.txt文本:

xiaoming laowang renhua linzhiling
laowang xiaoming fengjie
renhua xiaoming ligang fengjie
linzhiling xiaoming ligang fengjie guomeimei
ligang renhua fengjie linzhiling
guomeimei fengjie linzhiling
fengjie renhua laowang linzhiling guomeimei

三、程序内容

1.xshell启动集群

    使用命令start-dfs.sh启动HDFS
start-dfs.sh
    使用命令start-yarn.sh启动Yarn
start-yarn.sh

2.在idea里面编写代码

    创建java项目:

    分别创建FriendsRecommend、FriendsRecommendMapper、FriendsRecommendReduce项目

2.1编写FriendsRecommend

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class FriendsRecommend {
    public static void main(String[] args) throws Exception{
        //获取虚拟机配置信息
        Configuration configuration = new Configuration();
        //创建Job对象
        Job job = Job.getInstance(configuration);
        job.setJarByClass(FriendsRecommend.class);

        //Map端
        job.setMapperClass(FriendsRecommendMapper.class);
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //combiner组件
//      job.setCombinerClass(FriendsRecommendReduce.class);
        //Reduce端
        job.setReducerClass(FriendsRecommendReduce.class);
        //文件的输入路径
        Path inputPath = new Path("/friend/input");
        FileInputFormat.addInputPath(job, inputPath);
        //结果的输出路经
        Path outputPath = new Path("/friend/output");
        //若路径存在则将其删除
        if (outputPath.getFileSystem(configuration).exists(outputPath))
            outputPath.getFileSystem(configuration).delete(outputPath);
        FileOutputFormat.setOutputPath(job, outputPath);

        System.exit(job.waitForCompletion(true) ? 0 : 1);

    }
}

2.2编写FriendsRecommendMapper

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;
@Slf4j
public class FriendsRecommendMapper extends Mapper<Object, Text, Text, IntWritable> {

    /**
     *
     * map的key为好友名,value为0|直接好友;1|可能是间接好友,需要在reduce中进行进一步处理
     *
     */
    @Override
    public void map(Object key, Text value, Context context) throws IOException, InterruptedException {

        log.info("key:" + key + ",value:" + value);
        String[] friends = value.toString().split(" ");
        for(int i=0; i < friends.length; i++) {

            String self = friends[i];

            for(int j=i+1; j < friends.length; j++) {

                log.info("i:" + i + ",j:" + j);
                if(i == 0) {
                    // 直接好友
                    String directFriend = friends[j];
                    Text directFriendKey = new Text(sort(self, directFriend));
                    log.info("direct:" + directFriendKey.toString());
                    context.write(directFriendKey, new IntWritable(0));
                } else {
                    // 可能是间接好友
                    String indirectFriend = friends[j];
                    Text indirectFriendKey = new Text(sort(self, indirectFriend));
                    log.info("indirect:" + indirectFriendKey.toString());
                    context.write(indirectFriendKey, new IntWritable(1));
                }

            }

        }

    }

    private String sort(String self, String directFriend) {
        if(self.compareToIgnoreCase(directFriend) < 0) {
            return directFriend + " " + self;
        }
        return self + " " + directFriend;
    }

}

2.3编写FriendsRecommendReduce

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;
@Slf4j
public class FriendsRecommendReduce extends Reducer<Text, IntWritable, Text, IntWritable> {

    @Override
    public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        log.info("key:" + key);
        int sum = 0;
        boolean isDirectFriend = false;
        for(IntWritable value : values) {
            if(value.get() == 0) {
                // 直接好友
                log.info("direct friend");
                isDirectFriend = true;
                break;
            }
            sum = sum + value.get();
        }

        if(!isDirectFriend) {
            context.write(key, new IntWritable(sum));
        }
    }

}

3.在项目右侧Maven打包一下package

 找到friends-recommend-1.0-SNAPSHOT.jar,一会要用!

4.创建目录

创建程序以及数据存放目录

cd /opt/

ls # 如果目录下没有testData目录的话自己手动创建一下即可

cd testData/

mkdir friends

cd friends/

5.上传程序

 把程序先上传到虚拟机node01里面
cd /opt/testData/friends/
 直接将刚才找到的friends-recommend-1.0-SNAPSHOT.jar拖进去,也可以使用命令rz进行操作

 在D盘创建一个friends.txt文本文件

 将数据打印进去

然后将friends.txt文本拖进xshell

6.分布式文件系统上传测试数据

分布式文件系统创建/friend/input目录并且input目录上传测试文件friends.txt
hdfs dfs -mkdir /friend/input
hdfs dfs -put friends.txt /friend/input
hdfs dfs -ls /friend/input

7.执行程序

hadoop jar friends-recommend-1.0-SNAPSHOT.jar  /friend /input /output

8.查看结果

hdfs dfs -cat /friend/output/part-r-00000

大功告成!!!!


本文转载自: https://blog.csdn.net/qq_53025556/article/details/127118667
版权归原作者 -我不是码农 所有, 如有侵权,请联系我们删除。

“MapReduce课程设计-----好友推荐功能”的评论:

还没有评论