hdfs - overfit.cn

《Hadoop篇》------HDFS与MapReduce

Namenode：接受客户端的请求，维护整个HDFS集群目录树，元数据信息的存储由namenode负责Datanode：主要是负责数据块的存储，定期向namenode汇报block：SecondaryNamenode不是第二个namenode，当namenode宕机时，不能由SecondaryNam

overfit同步小助手 2023-03-31 11:04:17 0 收藏

Hadoop集群的搭建（结束）——修改hadoop配置文件以及启动集群服务

（1）修改 hadoop-env.sh 文件（2）修改 yarn-env.sh 文件（3）修改 core-site.xml 文件（4）修改 hdfs-site.xml 文件（5）修改 mapred-site.xml 文件（6）修改 yarn-site.xml 文件（7）修改 masters 文件（8

overfit同步小助手 2023-03-31 10:05:04 0 收藏

大数据：HDFS的Shell常用命令操作

HDFS允许用户数据组织成文件和文件夹的方式，它提供一个叫DFSShell的接口，使用户可以和HDFS中的数据交互。命令集的语法跟其他用户熟悉的shells（bash,csh）相似。Shell在计算机科学中俗称“壳”，是提供给使用者使用界面的进行与系统交互的软件，通过接收用户输入的命令执行相应的操作

overfit同步小助手 2023-03-31 09:04:38 0 收藏

一文了解 HDFS 及其组成框架

介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。

overfit同步小助手 2023-03-31 06:05:16 0 收藏

（超详细）MapReduce工作原理及基础编程

MapReduce编程基础JunLeon——go big or go home前言：Google于2003年在SOSP上发表了《The Google File System》，于2004年在OSDI上发表了《MapReduce: Simplified Data Processing on Large

overfit同步小助手 2023-03-31 03:04:25 0 收藏

6道经典大数据面试题（ChatGPT回答版）

1、HDFS 读写流程是什么？HDFS（Hadoop Distributed File System）的读写流程如下：写流程：客户端向 NameNode 发送写请求，请求在 HDFS 上创建一个新的文件。NameNode 为该文件分配一些数据块（默认情况下为 128 MB）以及在哪些 DataNod

overfit同步小助手 2023-03-31 03:04:21 0 收藏

大数据NiFi（二十二）：Kafka中数据实时导入到HDFS中

连接后，并设置“PutHDFS”处理器“failure”和“success”路由关系为自动终止。此案例使用到“ConsumerKafka_1_0”和“PutHDFS”处理器。“ConsumerKafka_1_0”处理器可以将消费Kafka中的数据。案例：向Kafka某个topic中写入数据，实时导入

overfit同步小助手 2023-03-31 02:05:06 0 收藏

Linux系统下的hadoop常用命令

选项： - f选项将在文件增长时输出附加数据，如在Unix中一样。

overfit同步小助手 2023-03-31 02:04:31 0 收藏

DataX实现mysql全量数据同步到hdfs

DataX是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

overfit同步小助手 2023-03-30 23:04:32 0 收藏

HDFS完全分布式集群搭建与配置

(1)防火墙设置:为了防止发生一些奇奇怪怪的错误，请务必关闭所有节点的防火墙，他可能会导致浏览器无法获取集群信息和文件上传集群失败环境搭建，还有通过.start-dfs.sh命令启动集群失败的很大一个原因就是服务器防火墙未关闭的原因。(2)hosts文件配置和主机名:因为这是完全分布式的集群，所以配

overfit同步小助手 2023-03-30 18:04:40 0 收藏

hadoop理论基础（一）

hadoop理论基础

overfit同步小助手 2023-03-30 17:05:15 0 收藏

Spark 任务提交流程说明

本篇主要阐述 Spark 任务提交的流程，其主要目的在于通过了解 Spark 任务提交可以清楚大概的流程，并知道每一步是做什么；当遇到问题可以快速的知道是什么环节或者哪一步骤出现了问题，及时定位到问题并解决。目前Spark官方支持五中集群管理模式，分别是 Standalone、Yarn、Mesoes

overfit同步小助手 2023-03-30 15:04:40 0 收藏

在Linux系统中安装Hadoop(简易版)

Hadoop安装(简易版)，适合刚入门大数据的朋友，简单好上手，轻松安装Hadoop。

overfit同步小助手 2023-03-30 13:04:55 0 收藏

HBase基于HDFS上是如何完成增删改查功能的

HDFS只支持文件append操作, 而依赖HDFS的HBase如何完成增删改查功能？

overfit同步小助手 2023-03-30 12:04:56 0 收藏

【hadoop】在Mac m1下搭建安装hadoop环境（亲测有效版）

在Mac m1环境下安装hadoop教程亲测有效超简单版

overfit同步小助手 2023-03-30 11:04:50 0 收藏

Hadoop详细集群搭建

Hadoop详细安装环境：在虚拟机上，或者租一个服务器（用学生证可以认证白嫖喔，阿里云服务器等）

overfit同步小助手 2023-03-30 10:05:06 0 收藏

Hadoop 50070端口打不开怎么办？

若已部署成功，请进行第二步排查！Hadoop50070是hdfs的web管理页面，在搭建Hadoop集群环境时，有些大数据开发技术人员会遇到Hadoop 50070端口打不开的情况，引起该问题的原因很多，想要解决这个问题需要从以下方面进行排查！以上是Hadoop 50070端口打不开的正常排查顺序和

overfit同步小助手 2023-03-30 07:05:24 0 收藏

HDFS常用命令操作时

HDFS常用命令的实践操作

overfit同步小助手 2023-03-30 05:05:25 0 收藏

hadoop3.3.4集群安装部署

Hadoop集群安装部署

overfit同步小助手 2023-03-30 04:05:00 0 收藏

大数据技术之Hadoop集群配置

作者简介：大家好我是小唐同学(๑>؂

overfit同步小助手 2023-03-29 23:05:04 0 收藏