hdfs - overfit.cn

大数据：HDFS操作的客户端big data tools和NFS

overfit同步小助手 2023-07-12 21:04:34 0 收藏

启动yarn时，resourcemanager启动失败

使用启动yarn后，再使用jps查看进程，发现只有Notemanager启动了，而resourcemanager没有启动。

overfit同步小助手 2023-07-09 07:03:51 0 收藏

大数据期末要点知识

大数据知识总结

overfit同步小助手 2023-07-09 04:04:31 0 收藏

关于hdfs突然无法上传下载文件的解决方法（Couldn‘t upload the file）

关于hdfs上传文件报Couldn't upload the file的解决方案

overfit同步小助手 2023-07-09 01:03:57 0 收藏

hadoop中jps命令后没有namenode

在Hadoop中，使用jps命令可以列出当前运行的Java进程，包括Hadoop的各个组件。如果jps命令没有显示namenode，那可能是以下几个原因之一：namenode进程没有启动。在运行Hadoop集群之前，需要确保启动了namenode进程，否则jps命令不会显示该进程。可以使用start

overfit同步小助手 2023-07-08 20:04:48 0 收藏

基于Hadoop的豆瓣电影的数据抓取、数据清洗、大数据分析（hdfs、flume、hive、mysql等）、大屏可视化

有需要整个项目的可以私信博主，提供部署和讲解，对相关案例进行分析和深入剖析环境点击顶部下载本研究旨在利用Python的网络爬虫技术对豆瓣电影网站进行数据抓取，并通过合理的数据分析和清洗，将非结构化的数据转化为结构化的数据，以便于后续的大数据分析。具体而言，我们通过分析豆瓣网站的网页结构，设计出规则来

overfit同步小助手 2023-07-08 18:03:51 0 收藏

在虚拟机上安装Hadoop

开启：[root@localhost .ssh]# ssh-copy-id -i ./id_rsa.pub -p22。2，刷新配置文件：[root@localhost soft]# source /etc/profile。3，测试：[root@localhost soft]# java -versi

overfit同步小助手 2023-07-07 10:03:55 0 收藏

Java API 操作HDFS文件

使用JavaAPI操作hdfs 文件的常用操作代码

overfit同步小助手 2023-07-07 08:04:18 0 收藏

hadoop实验

overfit同步小助手 2023-07-03 21:04:06 0 收藏

HDFS中Block size的默认大小

为了确认上述问题的答案，从Hadoop的官网上看了各个版本的说明文档中关于 Data Blocks 的说明，发现是从2.7.3版本开始，官方关于Data Blocks 的说明中，block size由64 MB变成了128 MB的。有的说是Hadoop 1.X版本是64MB，2.X版本是128MB，

overfit同步小助手 2023-07-03 12:05:11 0 收藏

第1关：HDFS 上查看文件块信息

第1关：HDFS 上查看文件块信息在右侧命令行模式操作，将本地的 /opt 目录上传至 HDFS中 /user/hadoop 目录下，并查找文件块的位置和机架信息，将查找出来的信息保存至本地的 /usr/result.txt 中。

overfit同步小助手 2023-07-03 09:04:45 0 收藏

Flume实现Kafka数据持久化存储到HDFS

本文关键字：Flume、Kafka、HDFS、实时数据、存储。对于一些实时产生的数据，除了做实时计算以外，一般还需要归档保存，用于离线数据分析。使用Flume的配置可以实现对数据的处理，并按一定的时间频率存储，本例中将从Kafka中按天存储数据到HDFS的不同文件夹。

overfit同步小助手 2023-07-03 03:04:29 0 收藏

大数据基础考试复习（考试前不停更）——《大数据技术与原理应用》

小题：文章目录小题：选择：判断：填空：大题一、简答题1、Hadoop 生态及各部分的作用2、HDFS的实现目标3、FsImage和EditLog的过程4、HDFS读数据的过程5、HBase Region的定位方式6、MapReduce运行流程7、简述Map函数和Reduce函数的功能二、实验题三、综

overfit同步小助手 2023-07-03 02:04:23 0 收藏

Hadoop基本操作

Hadoop基本操作方法

overfit同步小助手 2023-07-02 10:05:21 0 收藏

大数据Doris（三十二）：HDFS Load和Spark Load的基本原理

因为 Doris 表里的数据是有序的，所以 Broker load 在导入数据的时是要利用doris 集群资源对数据进行排序，对 Doris 的集群资源占用要比较大。Spark load 是利用了 spark 集群的资源对要导入的数据的进行了排序，Doris be 直接写文件，这样能大大降低 Dor

overfit同步小助手 2023-07-01 22:04:24 0 收藏

Hadoop启动正常，能ping通，无法打开hadoop102:9870

浏览器无法打开hadoop102:9870。

overfit同步小助手 2023-07-01 15:04:09 0 收藏

Hadoop集群启动后利用Web界面管理HDFS

Hadoop集群启动后，可以通过自带的浏览器Web界面查看HDFS集群的状态信息，访问IP为NameNode所在服务器的IP地址，在浏览器地址栏中输入192.168.107.131：50070即可打开HDFS的web界面。例如我的NameNode所在服务器的IP地址为192.168.107.131。

overfit同步小助手 2023-06-30 00:04:16 0 收藏

【大数据之路2】分布式文件系统 HDFS

HDFS 是大数据存储的基础，几乎所有的大数据分布式存储需求都会使用到。Node：地址和端口Last Contact：最近通讯时间（正常是 0/1/2 的间隔，若不正常则为最后一次的通讯时间）Admin State：管理员状态Capacity：HDFS 容量Used：已使用容量Non DFS Use

overfit同步小助手 2023-06-29 08:03:03 0 收藏

【大数据原理与技术】期末习题总结大全，建议收藏

📢📢题目来源于B站，慕课网，百度，适用于期末复习，内容仅供参考，祝大家考试顺利！MapReduce体系结构主要由四个部分组成，分别是：Client、JobTracker、TaskTracker以及Task。

overfit同步小助手 2023-06-28 16:04:31 0 收藏

python hdfs远程连接以及上传文件，读取文件内容，删除文件

python hdfs远程连接以及上传，读取，删除文件

overfit同步小助手 2023-06-28 09:04:27 0 收藏