hdfs - overfit.cn

大数据技术之Hadoop-入门

Hadoop Distributed File System，简称HDFS，是一个Hadoop分布式文件系统。1）NameNode（老板）：负责数据存在什么位置，整个数据的存储情况。2）DataNode：负责数据具体存在哪，存的什么信息。3）2NN（秘书）：备份，辅助NameNode工作，防止Nam

overfit同步小助手 2023-05-26 14:04:15 0 收藏

大数据学习——HDFS

HDFS是一种分布式文件管理系统，适合一次写入，多次读出的场景。

overfit同步小助手 2023-05-25 03:03:57 0 收藏

Hadoop大数据技术原理与应用课后习题答案汇总

Hadoop大数据技术原理与应用

overfit同步小助手 2023-05-24 19:04:16 0 收藏

hadoop之hdfs生产数据块损坏修复方法

overfit同步小助手 2023-05-24 13:04:15 0 收藏

【大数据】Hadoop高可用集群搭建

一文带你了解Hadoop的HA高可用搭建!

overfit同步小助手 2023-05-24 09:04:28 0 收藏

大数据技术笔试题库

一、单选:1、下列选项中，执行哪一个命令查看Linux系统的IP配置。A、ipconfigB、findC、ifconfigD、arp -a2、在MapReduce程序中，map()函数接收的数据格式是（）。A、字符串B、整型C、LongD、键值对3、下列选项中，关于HDFS的架构说法正确的是（）。A

overfit同步小助手 2023-05-23 12:04:08 0 收藏

sqoop入门简介 | 安装部署 | sqoop案例展示

ETL工具sqoop文章目录ETL工具sqoopsqoop简介sqoop安装sqoop常用命令sqoop案例sqoop简介Sqoop(发音：skup)是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如

overfit同步小助手 2023-05-23 11:04:05 0 收藏

Hadoop之hdfs操作

HDFS的常见Shell操作直接在命令行中输入hdfs dfs，可以查看dfs后面可以跟的所有参数注意：这里面的[]表示是可选项，<>表示是必填项[root@bigdata01 hadoop-3.3.2]# hdfs dfsUsage: hadoop fs [generic option

overfit同步小助手 2023-05-22 09:04:19 0 收藏

（最新版本）hive4.0.0 + hadoop3.3.4 集群安装（无坑版）-大数据学习系列（一）

网上的找的文档大多残缺不靠谱，所以我整理了一份安装最新版本的hive4..0.0+hadoop3.3.4的学习环境，可以提供大家安装一个完整的hive+hadoop的环境供学习。Hive Metastore是Hive的元数据存储服务，需要确保Metastore服务已经启动，并且在Beeline的配置

overfit同步小助手 2023-05-22 07:04:23 0 收藏

大数据——HDFS(分布式文件系统）

我的理解就是，你上传到服务器的数据，为了保证数据的安全性，如果一个服务器出现了问题，那么必须保证你的数据不能丢失，那么在其他服务器上也会备份一份出问题服务器的数据，以保证数据不丢失，就是一个存有你数据的服务器坏掉了，也不会影响你的数据。以上仅仅是我的理解，仅供参考。

overfit同步小助手 2023-05-21 00:04:12 0 收藏

大数据学习-Hadoop

overfit同步小助手 2023-05-20 18:03:51 0 收藏

HDFS的存储机制（读写流程）

HDFS存储机制，包括HDFS的写入过程和读取过程两个部分读取过程客户端向namenode请求上传文件，namenode检查目标文件是否已经存在，父目录是否存在。Namenode向客户端返回是否可以上传。客户端请求第一个block块上传到哪些datanode服务器上。Namenode返回三个data

overfit同步小助手 2023-05-20 17:03:57 0 收藏

大数据框架-Hadoop

大数据通过分布式文件系统来存储大量数据，同时利用分布式计算来高效地处理数据，并提供数据采集、预处理、分析和可视化等服务，

overfit同步小助手 2023-05-20 05:03:55 0 收藏

Hadoop基础命令的使用

搭建好Hadoop环境后，就可以使用Hadoop的一些命令来实现一些功能了。HDFS是Hadoop应用用到的一个最主要的分布式存储系统。本实验用一些常用的命令来熟悉Hadoop对文件的操作。熟练掌握hadoop基础命令的使用，理解HDFS和Hadoop的关系。本次环境是：Ubuntu16.04 +

overfit同步小助手 2023-05-18 10:03:48 0 收藏

解码Hadoop系列——NameNode启动流程

namenode的主要责任是文件元信息与数据块映射的管理。相应的，namenode的启动流程需要关注与客户端、datanode通信的工作线程，文件元信息的管理机制，数据块的管理机制等。其中，RpcServer主要负责与客户端、datanode通信，FSDirectory主要负责管理文件元信息。...

overfit同步小助手 2023-05-18 08:03:47 0 收藏

使用Hadoop 的 Java API 操纵 HDFS 文件系统

出现该报错时需要你引入 winutils 支持，winutil.exe 主要用于模拟linux下的目录环境，你可以在互联网上寻找该配置教程，如果你不想麻烦，也可以选择通过 API 读取文件内容然后在使用 Java 的文件相关API方法将文件流作为文件写入系统。引入依赖完成后如下图所示，但因为版本问题

overfit同步小助手 2023-05-18 06:04:00 0 收藏

Hadoop集群启动后命令JPS没有DataNode或者NameNode

a:进入/opt/module/hadoop-3.1.3/data/dfs目录里面删除掉所有文件。c:进入/opt/module/hadoop-3.1.3/logs目录里面删除掉所有文件。1）需要检查core-site.xml 和 hdfs-site.xml这俩文件，配置没错的话再看第二条。2）可能

overfit同步小助手 2023-05-16 19:04:07 0 收藏

Hadoop HDFS

首先是一个文件系统，就是用来存储文件、存储数据。是大数据最底层一个服务。其次是一个分布式的文件系统。分布式意味着多台机器存储。场景互动：如何模拟实现分布式文件系统。或者说一个成熟的分布式文件系统应该要具备哪些属性、功能呢？分布式多台机器存储记录元数据分块存储副本机制（备份）

overfit同步小助手 2023-05-16 13:03:41 0 收藏

【头歌】大数据从入门到实战 - 第2章分布式文件系统HDFS

在右侧命令行中启动Hadoop，进行如下操作。在HDFS中创建/usr/output/文件夹；在本地创建hello.txt文件并添加内容：“HDFS的块比磁盘的块大，其目的是为了最小化寻址开销。”；将hello.txt上传至HDFS的/usr/output/目录下；删除HDFS的/user/hado

overfit同步小助手 2023-05-15 22:03:55 0 收藏

大数据 | （五）通过Sqoop实现从MySQL导入数据到HDFS

一文带你了解MySQL通过Sqoop导入数据到Hdfs的详细过程。

overfit同步小助手 2023-05-14 08:04:15 0 收藏