大数据 Hadoop - overfit.cn

第1关：数据清洗MapReduce综合应用案例 — 招聘数据清洗

overfit同步小助手 2023-06-03 18:03:45 0 收藏

安装和配置HBase

一、下载阿里云镜像下载比较快。https://mirrors.aliyun.com/apache/hbase/2.4.12/二、安装1、解压解压安装包hbase-2.4.12-bin.tar.gz至路径 /usr/local2、把hbase目录权限赋予给hadoop用户3、配置环境变量将hbase下

overfit同步小助手 2023-06-03 16:04:01 0 收藏

大数据平台运维（hadoop入门（保姆篇））----概述及基本环境配置(HA-1)

大数据运维基础

overfit同步小助手 2023-06-03 15:03:49 0 收藏

Sqoop安装配置

sqoop安装配置

overfit同步小助手 2023-06-03 13:03:39 0 收藏

大数据之Hadoop数据仓库Hive

Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。简单、容易上手 (提供了类似 sql 的查询语言 hql)，使得精通 sql 但是不了解

overfit同步小助手 2023-06-03 04:03:35 0 收藏

基于Spark的电影推荐系统实现

受某视频网站委托，需开发一套基于Spark的大数据机器学习系统，应用协同过滤算法对网站客户进行电影推荐。本案例所使用的数据集说明如下：评分数据集：/data/dataset/ml/movielens/ratings.csv 电影数据集：/data/dataset/ml/movielens/mo

overfit同步小助手 2023-06-02 16:03:45 0 收藏

Ubuntu下搭建伪分布式从0开始安装Hive详细教程（从JDK安装、Hadoop搭建开始）

overfit同步小助手 2023-06-02 12:03:43 0 收藏

解决hive表中文乱码问题

hive字段名称和字段描述等存储进如hivemetastore是中文，查询出来也是???等无法识别的中文乱码；

overfit同步小助手 2023-06-02 12:03:36 0 收藏

MapReduce实现词频统计

1.词频统计任务要求准备两个txt文件分别为wordfile1.txt和wordfile2.txt，内容如下：2.在Eclipse中创建项目我的eclipse在usr/local/eclipse目录下，使用如下命令启动cd /usr/local/eclipse./eclipse

overfit同步小助手 2023-06-01 23:03:46 0 收藏

Hive合并小文件详解(参数介绍)

一、MR输出时合并小文件参数设置含义set hive.merge.mapfiles=true; 默认值ture,在Map-only的任务结束时合并小文件set hive.merge.mapredfiles=true; 默认值false,在Map-Reduce的任务结束时合并小文件set hive.

overfit同步小助手 2023-06-01 22:03:50 0 收藏

虚拟机CentOs7配置网络（NAT模式）

虚拟机网络配置NAT模式，虚拟机ping不通外网，Hadoop集群网络配置

overfit同步小助手 2023-06-01 12:03:44 0 收藏

hadoop 拒绝连接

在启动 Hadoop 服务之前，需要先检查 Hadoop 的配置文件是否正确，比如 core-site.xml、hdfs-site.xml、yarn-site.xml 等。检查Hadoop配置：检查Hadoop配置文件，如core-site.xml、hdfs-site.xml等，确保其中的配置正确。

overfit同步小助手 2023-06-01 08:04:24 0 收藏

Hadoop集群环境搭建（超详细）

Hadoop集群环境搭建

overfit同步小助手 2023-06-01 05:04:21 0 收藏

HDFS常用操作

大数据学习笔记01学习林子雨大数据教材的一些笔记HDFS常用操作启动Hadoop，在HDFS中创建用户目录“/user/hadoop”；$ cd /usr/local/hadoop$ ./sbin/start-dfs.sh$ jps在Linux系统的本地文件系统的“/usr/local/spark/

overfit同步小助手 2023-05-31 21:04:23 0 收藏

【hadoop】常见期末考试客观题大全

hadoop期末考试题，来着不易。希望大家关注点赞收藏哦

overfit同步小助手 2023-05-31 21:04:16 0 收藏

Hive的安装与配置详解

overfit同步小助手 2023-05-31 20:03:53 0 收藏

HDFS 高可用的环境搭建

在开始Hadoop集群的HDFS高可用环境搭建之前，需要完成搭建工作。

overfit同步小助手 2023-05-31 19:04:29 0 收藏

华为大数据HCIP认证（HCIP-Big Data Developer V2.0）考试大纲

overfit同步小助手 2023-05-31 15:03:49 0 收藏

保姆级教学——集群环境搭建及创建集群

集群环境搭建及集群配置

overfit同步小助手 2023-05-31 11:04:21 0 收藏

大数据项目实战-招聘网站职位分析

本项目是通过hadoop生态系统基于大数据离线处理技术完成的。利用HDFS存储数据、MapReduce做批量计算，将计算完成的数据存储在Hive数据仓库中。

overfit同步小助手 2023-05-30 14:04:26 0 收藏