第1关:数据清洗MapReduce综合应用案例 — 招聘数据清洗
第1关:数据清洗MapReduce综合应用案例 — 招聘数据清洗
安装和配置HBase
一、下载阿里云镜像下载比较快。https://mirrors.aliyun.com/apache/hbase/2.4.12/二、安装1、解压解压安装包hbase-2.4.12-bin.tar.gz至路径 /usr/local2、把hbase目录权限赋予给hadoop用户3、配置环境变量将hbase下
Sqoop安装配置
sqoop安装配置
大数据之Hadoop数据仓库Hive
Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 查询功能,用于查询的 SQL 语句会被转化为 MapReduce 作业,然后提交到 Hadoop 上运行。简单、容易上手 (提供了类似 sql 的查询语言 hql),使得精通 sql 但是不了解
基于Spark的电影推荐系统实现
受某视频网站委托,需开发一套基于Spark的大数据机器学习系统,应用协同过滤算法对网站客户进行电影推荐。本案例所使用的数据集说明如下: 评分数据集:/data/dataset/ml/movielens/ratings.csv 电影数据集:/data/dataset/ml/movielens/mo
Ubuntu下搭建伪分布式从0开始安装Hive详细教程(从JDK安装、Hadoop搭建开始)
Ubuntu下搭建伪分布式从0开始安装Hive详细教程(从JDK安装、Hadoop搭建开始)
解决hive表中文乱码问题
hive字段名称和字段描述等存储进如hivemetastore是中文,查询出来也是???等无法识别的中文乱码;
MapReduce实现词频统计
1.词频统计任务要求准备两个txt文件分别为wordfile1.txt和wordfile2.txt,内容如下:2.在Eclipse中创建项目我的eclipse在usr/local/eclipse目录下,使用如下命令启动cd /usr/local/eclipse./eclipse
Hive合并小文件详解(参数介绍)
一、MR输出时合并小文件参数设置 含义set hive.merge.mapfiles=true; 默认值ture,在Map-only的任务结束时合并小文件set hive.merge.mapredfiles=true; 默认值false,在Map-Reduce的任务结束时合并小文件set hive.
虚拟机CentOs7配置网络 (NAT模式)
虚拟机网络配置NAT模式,虚拟机ping不通外网,Hadoop集群网络配置
hadoop 拒绝连接
在启动 Hadoop 服务之前,需要先检查 Hadoop 的配置文件是否正确,比如 core-site.xml、hdfs-site.xml、yarn-site.xml 等。检查Hadoop配置:检查Hadoop配置文件,如core-site.xml、hdfs-site.xml等,确保其中的配置正确。
Hadoop集群环境搭建(超详细)
Hadoop集群环境搭建
HDFS常用操作
大数据学习笔记01学习林子雨大数据教材的一些笔记HDFS常用操作启动Hadoop,在HDFS中创建用户目录“/user/hadoop”;$ cd /usr/local/hadoop$ ./sbin/start-dfs.sh$ jps在Linux系统的本地文件系统的“/usr/local/spark/
【hadoop】常见期末考试客观题大全
hadoop期末考试题,来着不易。希望大家关注点赞收藏哦
Hive的安装与配置详解
Hive的安装与配置详解
HDFS 高可用的环境搭建
在开始Hadoop集群的HDFS高可用环境搭建之前,需要完成搭建工作。
华为大数据HCIP认证(HCIP-Big Data Developer V2.0) 考试大纲
华为大数据HCIP认证(HCIP-Big Data Developer V2.0) 考试大纲
保姆级教学——集群环境搭建及创建集群
集群环境搭建及集群配置
大数据项目实战-招聘网站职位分析
本项目是通过hadoop生态系统基于大数据离线处理技术完成的。利用HDFS存储数据、MapReduce做批量计算,将计算完成的数据存储在Hive数据仓库中。