大数据 Hadoop - overfit.cn

hive数据倾斜（超详细）

说到hive的数据倾斜，可能有的小伙伴还不了解什么是数据倾斜，所以咱们这一次就从hive数据倾斜的表现、hive数据倾斜发生的原因、hive数据倾斜的解决方案这三个方面来聊一聊hive的数据倾斜。

overfit同步小助手 2023-03-11 06:04:09 0 收藏

Hadoop安装搭建伪分布式教程（全面）吐血整理

Hadoop安装搭建伪分布式教程（全面）吐血整理1、安装下载虚拟机VMware2、下载Ubuntu18.04镜像文件，并在VMware中添加虚拟机。3、Hadoop伪分布式搭建3.1 创建hadoop用户，并更新ubuntu系统中相应软件，安装vim编辑器3.1.1 创建hadoop账户3.1.2

overfit同步小助手 2023-03-10 21:04:07 0 收藏

基于Hadoop的电商广告点击数的分析与可视化（Shell脚本执行与大屏可视化设计）

本项目需要部署的可以私信博主！！！！！！！！！本文介绍了基于Hadoop的电商广告点击数的分析与可视化，以及相应的Shell脚本执行和大屏可视化设计。首先，我们介绍了Hadoop的基本原理和使用方法，包括如何安装和配置Hadoop集群。然后，我们介绍了如何使用Hadoop MapReduce框架对电

overfit同步小助手 2023-03-10 08:03:44 0 收藏

hadoop的运行模式

目录hadoop的三种运行模式区别：完全分布式运行模式步骤：一，虚拟机准备：二，编写集群分发脚本xsync （1）scp定义：（2）基础语法：(1)按照上述语法进行拷贝jdk（2）按照上述语法拷贝Hadoop（第二种方法）（3）拷贝也可以让Hadoop103操作从H

overfit同步小助手 2023-03-07 18:04:09 0 收藏

（初学者强烈推荐）Ubuntu 配置hadoop 超详细教程（全过程）

本文的教程仅为个人的操作经验所写，每个人下载的版本不一样，所以会出现不同的情况异常等，如有问题可询问博主或百度查找解决方法。

overfit同步小助手 2023-03-04 09:03:56 0 收藏

Hadoop面试题及参考答案

整理了一部分hadoop相关的面试题和参考答案，不当之处请大家指正

overfit同步小助手 2023-03-03 18:04:16 0 收藏

(超详细) Spark环境搭建（Local模式、 StandAlone模式、Spark On Yarn模式）

Spark环境搭建JunLeon——go big or go home目录Spark环境搭建一、环境准备1、软件准备2、Hadoop集群搭建3、Anaconda环境搭建二、Spark Local模式搭建1、Spark下载、上传和解压2、配置环境变量3、配置Spark配置文件4、测试5、补充：spar

overfit同步小助手 2023-03-03 11:04:13 0 收藏

大数据之Hadoop3.x 运行环境搭建（手把手搭建集群）

环境

overfit同步小助手 2023-03-03 08:04:13 0 收藏

Hadoop的安装与配置（非常重要）

这是以主从模式来运行的，前两个在maser节点上，最后一个在slave节点上。

overfit同步小助手 2023-03-02 08:04:18 0 收藏

一文带你快速初步了解云计算与大数据

一文带你快速初步了解云计算与大数据，这是一篇涨知识的文章

overfit同步小助手 2023-02-26 08:03:48 0 收藏

Hadoop常见端口号及配置文件

Hadoop常用端口及配置文件

overfit同步小助手 2023-02-24 07:04:04 0 收藏

数据倾斜的原因及解决方案

一、什么是数据倾斜及数据倾斜是如何产生的数据倾斜的根本原因是数据的key分布不均，个别key数据很多，超出了计算节点的计算能力的结果；过程：数据经过 map后，由于不同key 的数据量分布不均，在shuffle 阶段中通过 partition 将相同的 key 的数据打上发往同一个 reducer

overfit同步小助手 2023-02-23 15:04:25 0 收藏

虚拟机的网络配置

虚拟机中网络配置

overfit同步小助手 2023-02-23 15:03:46 0 收藏

Hadoop史诗级入门详解

Hadoop最详细的入门讲解

overfit同步小助手 2023-02-23 13:04:10 0 收藏

初识Hadoop，走进大数据世界

在古时候，人们用牛来拉重物，当一头牛拉不动一根圆木时，人们从来没有考虑过要想方设法培育出一种更强壮的牛。同理，我们也不该想方设法打造什么超级计算机，而应该千方百计综合利用更多计算机来解决问题。

overfit同步小助手 2023-02-21 08:03:41 0 收藏

【大数据】大数据学习路线

首先明确一点：大数据涉及的知识面广度还是有的，需要学习的组件繁多，想要每一项精通几乎不可能，所以企业在招聘的时候会进行细分，基于某个方向进行招聘，比如关键字，数据仓库工程师、数据治理工程师、大数据开发工程师、大数据算法工程师、ETL工程师等。我们在学习的时候也要有所侧重，保证自己兴趣所致并重点关注。

overfit同步小助手 2023-02-18 16:04:18 0 收藏

【SQL开发实战技巧】系列（一）:关于SQL不得不说的那些事

复合索引的字段顺序，会影响查询速度，创建复合索引做SQL优化的一般原则是，如果两个字段在WHERE子句中使用频率相同,则将最具选择性的字段排在最前面，以下是分析结果：原SQL进行了两次全表扫描，优化后的SQL减少一次全表扫描，提高了查询效率。cusomer和customer_detail两个表的cu

overfit同步小助手 2023-02-18 13:04:01 0 收藏

hadoop考试应急

为了应对hadoop考试的同学可以看看

overfit同步小助手 2023-02-18 09:04:36 0 收藏

2023版大数据学习路线图（适合自学）

为数据存储与计算（离线场景），主要讲解协调服务ZK(1T)、数据存储hdfs(2T)、数据存储alluxio(1T)、数据采集flume、数据采集logstash、数据同步Sqoop(0.5T)、数据同步datax(0.5T)、数据同步mysql-binlog(1T)、计算模型MR与DAG(1T)、

overfit同步小助手 2023-02-18 09:03:59 0 收藏

大数据面试题（八）：Hive优化措施

Fetch抓取Fetch抓取是指Hive中对某些情况的查询可以不必使用MapReduce计算。例如：SELECT * FROM employees;在这种情况下，Hive可以简单地读取employee对应的存储目录下的文件，然后输出查询结果到控制台。在hive-default.xml.templat

overfit同步小助手 2023-02-17 23:04:09 0 收藏