第1关:数据清洗MapReduce综合应用案例 — 招聘数据清洗

第1关:数据清洗MapReduce综合应用案例 — 招聘数据清洗

安装和配置HBase

一、下载阿里云镜像下载比较快。https://mirrors.aliyun.com/apache/hbase/2.4.12/二、安装1、解压解压安装包hbase-2.4.12-bin.tar.gz至路径 /usr/local2、把hbase目录权限赋予给hadoop用户3、配置环境变量将hbase下

Sqoop安装配置

sqoop安装配置

大数据之Hadoop数据仓库Hive

Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 查询功能,用于查询的 SQL 语句会被转化为 MapReduce 作业,然后提交到 Hadoop 上运行。简单、容易上手 (提供了类似 sql 的查询语言 hql),使得精通 sql 但是不了解

基于Spark的电影推荐系统实现

受某视频网站委托,需开发一套基于Spark的大数据机器学习系统,应用协同过滤算法对网站客户进行电影推荐。本案例所使用的数据集说明如下:  评分数据集:/data/dataset/ml/movielens/ratings.csv  电影数据集:/data/dataset/ml/movielens/mo

Ubuntu下搭建伪分布式从0开始安装Hive详细教程(从JDK安装、Hadoop搭建开始)

Ubuntu下搭建伪分布式从0开始安装Hive详细教程(从JDK安装、Hadoop搭建开始)

解决hive表中文乱码问题

hive字段名称和字段描述等存储进如hivemetastore是中文,查询出来也是???等无法识别的中文乱码;

MapReduce实现词频统计

1.词频统计任务要求准备两个txt文件分别为wordfile1.txt和wordfile2.txt,内容如下:2.在Eclipse中创建项目我的eclipse在usr/local/eclipse目录下,使用如下命令启动cd /usr/local/eclipse./eclipse

Hive合并小文件详解(参数介绍)

一、MR输出时合并小文件参数设置 含义set hive.merge.mapfiles=true; 默认值ture,在Map-only的任务结束时合并小文件set hive.merge.mapredfiles=true; 默认值false,在Map-Reduce的任务结束时合并小文件set hive.

虚拟机CentOs7配置网络 (NAT模式)

虚拟机网络配置NAT模式,虚拟机ping不通外网,Hadoop集群网络配置

hadoop 拒绝连接

在启动 Hadoop 服务之前,需要先检查 Hadoop 的配置文件是否正确,比如 core-site.xml、hdfs-site.xml、yarn-site.xml 等。检查Hadoop配置:检查Hadoop配置文件,如core-site.xml、hdfs-site.xml等,确保其中的配置正确。

Hadoop集群环境搭建(超详细)

Hadoop集群环境搭建

HDFS常用操作

大数据学习笔记01学习林子雨大数据教材的一些笔记HDFS常用操作启动Hadoop,在HDFS中创建用户目录“/user/hadoop”;$ cd /usr/local/hadoop$ ./sbin/start-dfs.sh$ jps在Linux系统的本地文件系统的“/usr/local/spark/

【hadoop】常见期末考试客观题大全

hadoop期末考试题,来着不易。希望大家关注点赞收藏哦

Hive的安装与配置详解

Hive的安装与配置详解

HDFS 高可用的环境搭建

在开始Hadoop集群的HDFS高可用环境搭建之前,需要完成搭建工作。

华为大数据HCIP认证(HCIP-Big Data Developer V2.0) 考试大纲

华为大数据HCIP认证(HCIP-Big Data Developer V2.0) 考试大纲

保姆级教学——集群环境搭建及创建集群

集群环境搭建及集群配置

大数据项目实战-招聘网站职位分析

本项目是通过hadoop生态系统基于大数据离线处理技术完成的。利用HDFS存储数据、MapReduce做批量计算,将计算完成的数据存储在Hive数据仓库中。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈