Hadoop - overfit.cn

一篇文章带你学会Hadoop-3.3.4集群部署

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。在进行自学的时候，我们都需要自己搭建一个稳定的hadoop集群，但是hadoop的集群部署还是比较麻烦的，今天我就带你通过我的一篇文章，学会

overfit同步小助手 2023-11-20 12:03:48 0 收藏

Ubuntu安装Hadoop以及伪分布式配置

确保自己的虚拟机可以连接到网络，到浏览器搜索hadoop，然后下载hadoop压缩包，这里我选择了hadoop3.2.4版本，如果官网下载速度慢的话，可以搜索hadoop镜像去下载，下边是清华镜像站的hadoop链接。在浏览器地址栏中访问 localhost:9870，出现如下界面，此时hadoop

overfit同步小助手 2023-11-20 04:03:46 0 收藏

虚拟机vmware下安装Ubuntu16.04修改屏幕尺寸与更新源，以及对应的安装vim和vim常见的操作命令

学习Linux时经常需要我们在自己的主机里面安装VMware虚拟机，用来学习使用，下面是小编安装Ubuntu16.04，修改屏幕尺寸与更新源，以及对应的安装vim和vim常见的操作命令。以上就是今天要讲的内容，本文仅仅简单介绍了在VMware里面安装Ubuntu的基本步骤，以及对应的更新源与vim的

overfit同步小助手 2023-11-19 22:03:46 0 收藏

大数据导论——Hadoop生态系统

Hadoop生态系统及各组成部分简介

overfit同步小助手 2023-11-19 12:03:20 0 收藏

基于Yarn搭建Flink

overfit同步小助手 2023-11-19 07:03:16 0 收藏

【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景

overfit同步小助手 2023-11-19 05:03:30 0 收藏

hadoop datanode无法启动

datanode无法启动报错问题及解决方法

overfit同步小助手 2023-11-18 21:03:27 0 收藏

从零开始搭建hadoop集群（一）虚拟机Vmware的下载安装和CentOS的下载安装（最新版）

史上巨详细了，没有跳过一张图，两个安装一共39张图。此外，附有CentOS的镜像文件百度网盘和VMware的官网安装地址。

overfit同步小助手 2023-11-18 16:06:21 0 收藏

大数据-玩转数据-FLINK(Yarn模式)的安装与部署

在这些容器上，Flink 会部署JobManager 和 TaskManager 的实例，从而启动集群。一个Job会对应一个Flink集群，每提交一个作业会根据自身的情况，都会单独向yarn申请资源，直到作业执行完成，一个作业的失败与否并不会影响下一个作业的正常提交和运行。内存集中管理模式：在Yar

overfit同步小助手 2023-11-18 00:03:37 0 收藏

大数据——技术生态体系

SparkR 是 Apache Spark 生态系统中的一个项目，它提供了一个接口，允许 R 语言用户利用 Spark 的分布式计算能力来进行数据分析和处理。：Spark SQL 可以与其他 Spark 组件（如Spark Streaming、Spark MLlib等）集成，使用户能够在一个统一的

overfit同步小助手 2023-11-17 21:03:23 0 收藏

Hadoop集成Kerberos安全服务器

公司里要给Hadoop配置Kerberos，记录一下过程中遇到的问题。

overfit同步小助手 2023-11-17 12:07:13 0 收藏

关于HBase集群中的Hmaster节点刚启动就挂掉的解决方法

overfit同步小助手 2023-11-17 12:03:46 0 收藏

尚硅谷大数据hadoop教程_mapReduce

mapReduce三类进程。

overfit同步小助手 2023-11-17 11:03:36 0 收藏

大数据Hadoop之——部署hadoop+hive+Mysql环境（window11）

win环境下大数据Hadoop的部署hadoop+hive环境

overfit同步小助手 2023-11-17 10:03:51 0 收藏

【项目实战】基于Web的管理和监控Hadoop集群工具——Ambari入门介绍

Apache Ambari是一种基于Web的工具，它提供了一个易于使用的Web界面，是一个强大的开源的集群管理工具，它可以帮助管理员轻松管理和监控Hadoop集群，支持Apache Hadoop集群的供应、管理和监控。

overfit同步小助手 2023-11-17 07:03:35 0 收藏

hadoop模拟试题

数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)SecondaryNameNode会将edits文件和fsimage复制到本地（HTTP GET方式）他的目的是帮助NameNode 合并编辑日志，减少NameNode 启动时间。第10题

overfit同步小助手 2023-11-17 06:03:40 0 收藏

SQL时间函数

SQL语句时间函数

overfit同步小助手 2023-11-17 00:03:47 0 收藏

分布式集群——搭建Hadoop环境以及相关的Hadoop介绍

本文主要介绍hadoop的相关概念以及在Linux上面配置Hadoop的具体操作。镜像文件实际是存放的目录结构、文件属性等相关信息，是NameNode中关于元数据的镜像。它是在NameNode启动时对整个文件系统的快照。edits：编辑日志文件,记录对文件或者目录的修改信息，比如删除目录，修改文件

overfit同步小助手 2023-11-16 13:03:37 0 收藏

hadoop namenode -format报错显示：命令未找到

这个bug很搞笑，我做分布式搭建时，slaver1和slaver2都可以hadoop name -format，就是master不可以，配置都是一样的，这个第一时间也是想到了环境配置问题。这里的/apps/hadoop是我的hadoop安装路径（根据实际情况改动）然后再执行hadoop nameno

overfit同步小助手 2023-11-15 10:03:15 0 收藏

Hadoop PseudoDistributed Mode 伪分布式

上传本地测试文件 wcdata.txt 到 HDFS 上 /wordcount/input。浏览器访问:http://hadoop102:50090/浏览器访问:http://hadoop102:19888/在 HDFS 上创建目录 /wordcount/input。浏览器访问: http://ha

overfit同步小助手 2023-11-15 06:03:31 0 收藏