大数据 Hadoop - overfit.cn

hadoop修改配置文件和环境变量

我们要修改的就是主要的自定义配置文件。

overfit同步小助手 2023-09-22 04:03:55 0 收藏

hadoop中ResourceManager 进程或 NodeManager 进程没有启动

如果 ResourceManager 进程或 NodeManager 进程没有启动，可能是由于以下原因导致的:可能是 hadoop 配置文件中的错误导致的。您可以检查 hadoop 配置文件，确保所有参数都设置正确。可能是由于网络问题导致的。您可以检查网络连接是否正常，确保所有节点都能够连接到同一网

overfit同步小助手 2023-09-21 09:03:56 0 收藏

解决WARNING: /opt/hadoop-3.1.1/logs does not exist. Creating.

overfit同步小助手 2023-09-21 09:03:35 0 收藏

HDFS 基本 shell 操作

overfit同步小助手 2023-09-21 07:03:45 0 收藏

hadoop常用命令

9.-copyFromLocal：从本地文件系统中拷贝文件到HDFS路径去，命令：hadoop fs -copyFromLocal linux系统本地文件 hdfs文件系统路径。查看HDFS上存储的数据信息。10.-put：从本地文件系统中拷贝文件到HDFS路径去，命令：hadoop fs -put

overfit同步小助手 2023-09-20 23:03:37 0 收藏

Hadoop的基础操作

HDFS是hadoop的分布式文件系统，它的设计目标是能够在普通硬件上运行，并且能够处理大量的数据。HDFS采用了主从架构，其中有一个NameNode和多个DataNode。NameNode负责管理文件系统的命名空间和客户端的访问，而DataNode则负责存储实际的数据块。HDFS的基本操作包括文件

overfit同步小助手 2023-09-20 20:03:32 0 收藏

头歌｜Hadoop单点部署，安装和管理

需要在第一关的基础上，若重置了需要从头开始。

overfit同步小助手 2023-09-20 19:03:59 0 收藏

Hadoop完全分布式搭建教程（完整版）

Hadoop完全分布式搭建流程（完整版）适合初学者参考！！！基于Linux的大数据Hadoop集群搭建！

overfit同步小助手 2023-09-20 18:04:04 0 收藏

【Hadoop】HDFS API 操作大全

为了提供对不同数据访问的一致接口，Hadoop借鉴了Linux虚拟文件系统的概念，为此Hadopo提供了一个抽象的文件系统模型FileSystem，HDFS 是其中的一个实现。FileSystem是Hadoop中所有文件系统的抽象父类，它定义了文件系统所具有的基本特征和基本操作。

overfit同步小助手 2023-09-20 17:03:23 0 收藏

解决Hadoop完全分布式集群中从节点jps没有datanode节点问题

也是进入这个目录，只不过namenode中的name文件在datanode是变为了data文件，即/tmp/dfs/data/current。当用start-dfs.sh和start-yarn.sh后，在slave节点(从节点)中用jps命令查看进程。有时候可能发现没有Datanode，即只有两项(

overfit同步小助手 2023-09-20 10:03:56 0 收藏

Spark常见报错

shuffle read是container请求external shuffle服务获取数据过程，external shuffle是NodeManager进程中的一个服务，默认端口是7337，或者通过spark.shuffle.service.port指定。解决方案：针对原因(1)，调大spark.

overfit同步小助手 2023-09-20 04:03:45 0 收藏

【大数据毕设】基于Hadoop的音乐推荐系统论文(三)

基于Hadoop的音乐推荐系统的课题研究目的主要包括以下几个方面：音乐数据处理和管理：收集音乐数据，并通过Hadoop的分布式文件系统HDFS对音乐数据进行存储和管理。此外，对音乐数据进行预处理和清洗，包括音乐信息的提取、歌词分析、音乐特征提取等，以便后续的分析和处理。用户行为数据收集：收集用户行为

overfit同步小助手 2023-09-20 01:04:00 0 收藏

hadoop分布式系统复习题选择题

D 、 HDFS 有高容错性的特点，并且设计用来部署在低廉的（low- cost ）硬件上。C 、 HDFS 为海量的数据提供了存储，而 MapReduce 为海量的数据提供了计算。C 、每个文件的 Block 大小和复制（ Replication ）因子都是可配置的。D 、响应客户端的所有读写数据

overfit同步小助手 2023-09-20 00:04:16 0 收藏

大数据平台搭建之hive本地模式安装

hive的基本介绍，hive的架构，hive的本地模式搭建

overfit同步小助手 2023-09-19 22:04:05 0 收藏

HBase入门(一)

HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。

overfit同步小助手 2023-09-19 09:04:39 0 收藏

Hive-安装与配置（1）

Hive在Hadoop生态系统中运行，依赖Hadoop分布式文件系统（HDFS）和YARN资源管理器。元数据存储：Hive使用关系型数据库（如MySQL、Derby等）来存储元数据，包括表的结构、分区信息、数据位置等。Hive服务：Hive提供Hive CLI（命令行界面）和HiveServer2两

overfit同步小助手 2023-09-19 09:03:56 0 收藏

Hadoop格式化时报错，已解决！

Re-format filesystem in Storage Directory root= /usr/local/hadoop/tmp/dfs/name; location= null ? (Y or N) Y

overfit同步小助手 2023-09-19 07:03:49 0 收藏

hive 架构及 metastore 功能简单介绍

hive 内部执行过程以及 Metastore 的作用。

overfit同步小助手 2023-09-19 01:04:08 0 收藏

Sparkthrift Server 启动命令调优及问题报错解决

文章目录1、sparkthrift Server 启动命令2、实际生产过程中的报错解决2.1、Kryo serialization failed: Buffer overflow. Available: 0, required: 2428400. To avoid this, increase sp

overfit同步小助手 2023-09-19 00:05:06 0 收藏

Hadoop支持LZO压缩

LZO（Lempel-Ziv-Oberhumer）是一种高效的压缩算法，适用于Hadoop中的数据压缩。Hadoop支持使用LZO算法对数据进行压缩，以减少存储空间占用和数据传输开销。

overfit同步小助手 2023-09-18 08:03:28 0 收藏