大数据 Hadoop - overfit.cn

Hive部署测试(4.0.0)

hadoop版本3.3.6 mysql版本8.0.20。

overfit同步小助手 2024-11-07 13:03:43 0 收藏

大数据技术原理及应用课实验1 熟悉常用的Linux操作和Hadoop操作

（1）使用hadoop用户登录Linux系统，启动Hadoop（Hadoop的安装目录为“/usr/local/hadoop”），为hadoop用户在HDFS中创建用户目录“/user/hadoop”（2）删除上面创建的目录“a1/a2/a3/a4” （在“/tmp”目录下面），然后查看“/tmp”

overfit同步小助手 2024-11-07 12:03:26 0 收藏

Hive使用与介绍

Hive 提供了一种简化的方式来查询和分析大数据集，通过 HiveQL 让用户能够轻松地与大数据进行交互。如果你有具体的使用场景或遇到的问题，随时可以提供更多详细的帮助。

overfit同步小助手 2024-11-07 10:03:24 0 收藏

【头歌】Hive表DDL操作（一）答案

【头歌】Hive表DDL操作（一）答案第1关：Create/Alter/Drop 数据库第2关：Create/Drop/Truncate 表第3关：Alter 表/列第4关：表分区

overfit同步小助手 2024-11-06 23:03:34 0 收藏

Hadoop/HBase/HDFS 常用默认端口总结列举,以及作用

必须要吐槽一句, 光看这些端口, 就能发现Hadoop设计的复杂性在2020s的今天显得有点格格不入, 如今, 如果没有历史包袱,如果非必要, 还是选择同类替换的应用对需求进行专项专用吧。节点管理器本地化端口（默认为8040）：用于节点管理器与本地化服务进行通信，获取应用程序所需的资源。应用程序

overfit同步小助手 2024-11-06 21:03:53 0 收藏

Python爬虫基于Hadoop的NBA球员大数据分析与可视化系统

在对大数据的深入研究后，根据其前景，包括数据方面的发展与价值，本套系统从用户痛点需求进行分析入手，对系统架构进行了设计，随后完成了系统方面的具体设计，最后为数据入库对DB进行配置和设计，最后到系统搭建和编码实现，分别为后台数据处理，在数据转换方面包括数据的clean、临时存储落地，数据经过完全处理后

overfit同步小助手 2024-11-06 20:03:48 0 收藏

【Hadoop-HA 搭建】hadoop-ha 高可用集群配置

搭建hadoop高可用集群，首先确保搭建了hadoop集群，zookeeper集群。hadoop 三个集群节点分别为主节点 master，两个副节点node01、node02。

overfit同步小助手 2024-11-06 14:03:27 0 收藏

Hive的存储格式

Hive支持的存储数的格式主要有：TEXTFILE(默认格式) 、SEQUENCEFILE、RCFILE、ORCFILE、PARQUET。textfile为默认格式，建表时没有指定文件格式，则使用TEXTFILE，导入数据时会直接把数据文件拷贝到hdfs上不进行处理;sequencefile，rcf

overfit同步小助手 2024-11-06 08:03:45 0 收藏

【Hadoop集群搭建】JDK安装及配置、Hadoop本地模式部署及测试

1. 熟悉 SSH 工具的使用方法2. 掌握 JDK 安装及配置3. 掌握 Hadoop 本地模式部署及测试

overfit同步小助手 2024-11-06 01:03:50 0 收藏

hadoop_hdfs详解

一文读懂HDFS，全程干货无废话

overfit同步小助手 2024-11-05 12:03:49 0 收藏

Hive环境的搭建【详细教程】

Hive是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为类似于数据库中的表，并提供类似于SQL的查询语言（HiveQL）来进行数据查询、分析和管理。Hive的主要优点是可以处理大量的数据，并且可以通过扩展集群来提高处理能力。

overfit同步小助手 2024-11-05 06:03:40 0 收藏

【Hadoop】hadoop的路径分不清？HDFS路径与本地文件系统路径的区别

理解HDFS路径和本地文件系统路径的区别对于有效地使用Hadoop至关重要。通过清晰地区分这些路径，你可以更有效地管理你的数据和作业配置。记住，HDFS路径用于访问集群中存储的数据，而本地文件系统路径用于访问你的服务器或计算机上的文件。：Hadoop软件安装目录（本地文件系统）。：Linux系统中用

overfit同步小助手 2024-11-04 20:03:49 0 收藏

【Hadoop】电脑虚拟机开启/关闭Hadoop的操作

1.在Oracle VM VirtualBox管理器选中三个节点，右键开启

overfit同步小助手 2024-11-04 13:03:53 0 收藏

在ubuntu系统上使用Hadoop搭建集群

修改/etc/hosts文件添加主机名和ip的映射，使得免ip修改~/.ssh/config 文件使得免用户名。

overfit同步小助手 2024-11-04 09:03:47 0 收藏

hadoop入门

开始认真学习大数据方向了，先大概了解一下，基于尚硅谷的视频

overfit同步小助手 2024-11-04 08:03:49 0 收藏

从 Hadoop 迁移到数据 Lakehouse 的架构师指南

从 Hadoop 到数据湖仓一体架构的演变代表了数据基础架构的重大飞跃。虽然 Hadoop 曾经以其强大的批处理能力统治着大数据领域，但如今的组织正在寻求更敏捷、更具成本效益和现代化的解决方案。尤其是当他们越来越多地开始实施 AI 计划时。根本没有办法让 Hadoop 为 AI 服务。相反，越来越多

overfit同步小助手 2024-11-04 07:03:20 0 收藏

一、Hadoop：大数据处理之基石

伴随互联网的广泛普及以及信息技术的飞速发展，数据量以惊人之速度持续增长。传统的数据处理方式在面对如此大规模的数据之时，显得力不从心。为有效解决这一问题，Hadoop应运而生。其设计初衷乃是为了能够在廉价的硬件集群之上运行，从而实现对大规模数据的可靠存储以及高效处理。Hadoop作为大数据处理的基石，

overfit同步小助手 2024-11-03 23:03:42 0 收藏

Hadoop 完全分布式部署（ 3.3.6 ）

解决了mapreduce找不到主类的错误

overfit同步小助手 2024-11-03 21:03:49 0 收藏

Hadoop的搭建流程

hadoop的搭建流程

overfit同步小助手 2024-11-03 12:03:48 0 收藏

hadoop

hadoop是Apache基金会开发的分布式系统基础框架。主要用于分布式的存储与分布式分析。该系统的设计可以扩展至数千台机器共同协作，由每台机器提供局部的运算和存储。同时，通过检测和处理应用层的故障，hadoop可以提供高可用性。

overfit同步小助手 2024-11-03 05:03:46 0 收藏