大数据 Hadoop - overfit.cn

【Hadoop核心技术】

Hadoop 是一个开源的分布式计算平台，主要用于存储和处理大规模数据集。它的设计初衷是为了能够在由普通硬件构建的集群上高效运行，通过分布式存储和分布式处理来应对数据量的增长和复杂的数据处理需求。Hadoop 具有高可扩展性、高可靠性和高效性等特点，被广泛应用于大数据领域，如互联网公司的数据仓库建设

overfit同步小助手 21 天前 0 收藏

django基于Hadoop 的国产电影数据分析与可视化

国产电影数据分析与可视化是对我国电影产业进行深入研究的过程。通过收集和分析电影的票房、评分、观众评价等数据，可以揭示电影市场的发展趋势、观众喜好以及影响电影成功的关键因素。利用数据可视化技术，将这些复杂数字信息转化为直观的图表和图形，有助于电影制作方、发行方和政策制定者更好地理解市场动态，优化决策，

overfit同步小助手 21 天前 0 收藏

Hadoop的三种运行模式：单机模式、伪分布式模式和完全分布式模式

yarn-site.xml：这个文件包含了YARN（Yet Another Resource Negotiator）的相关配置属性，比如NodeManager的内存限制 (yarn.nodemanager.resource.memory-mb)、ApplicationMaster的内存限制 (yar

overfit同步小助手 21 天前 0 收藏

详细教程-Linux上安装单机版的Hadoop

链接：https://pan.baidu.com/s/1u59OLTJctKmm9YVWr_F-Cg。：（这里要改成你自己linux中的jdk路径）这里配置的是单节点，指向本机主机名称。）修改hadoop-env.sh。6）修改yarn-site.xml。至此Hadoop单机版安装完毕。再次重新

overfit同步小助手 22 天前 0 收藏

部署伪分布式 Hadoop集群

Hadoop目录介绍存放内容：Hadoop的各种可执行脚本和程序，如启动和停止Hadoop服务的脚本、Hadoop命令行工具等。功能：用于执行对Hadoop相关服务（如HDFS、YARN、MapReduce等）的操作和管理任务。存放内容：Hadoop的配置文件，如hadoop-env.sh（环境变量

overfit同步小助手 22 天前 0 收藏

Idea在本地环境（Win11）连接虚拟机Hadoop并运行相关程序，超详细！

idea连接虚拟机hadoop并在本地运行详解

overfit同步小助手 22 天前 0 收藏

深入理解 Hadoop - MapReduce 分布式计算框架

Hadoop 是一个开源的分布式计算平台，由 Apache 软件基金会开发和维护。MapReduce 是 Hadoop 的核心组件之一，它提供了一种简单而强大的编程模型，用于在大规模集群上并行处理海量数据。

overfit同步小助手 22 天前 0 收藏

【Hive实战】Hive MetaStore升级调研

Hive MetaStore升级

overfit同步小助手 23 天前 0 收藏

Hadoop3.x完全分布式详细配置

7.1.1 由于克隆过来的spark02与spark03的IP地址都是spark01的IP地址，因此我们可以在修改spark02主机信息的时候，关闭spark01与spark03的虚拟机，依次类推。3.2 打开spark01，将jdk、hadoop、zookeepe上传到spark01的/usr/l

overfit同步小助手 23 天前 0 收藏

在完全分布式hadoop上部署hbase

7. 将集群主节点master的/etc/profile文件和hbase安装目录分发到slave1和slave2子节点，并刷新slave1、slave2的环境变量。5. 编辑/usr/local/src/hbase/conf/hbase-site.xml配置文件。6. 编辑/usr/local/sr

overfit同步小助手 23 天前 0 收藏

Ambari里面添加hive组件

在添加hive组件之前需要做的事情，先在master这个虚拟机里面创建好hive先进入虚拟机里面进入mysql然后输入这个命令看看有没有自己创建的hive数据库有的话会显示下面这个样子没有的同学使用以下命令可以在MySQL中创建hive数据库（本人给的hive数据库密码是hive）

overfit同步小助手 23 天前 0 收藏

Hive 整合 Spark 全教程（Hive on Spark）

分类应用Haddop 2.xHaddop 3.xNNPortsNamenode80209820NNPortsNN HTTP UI500709870NNPorts504709871SNN portsSNN HTTP500919869SNN ports500909868DN portsDN IPC500

overfit同步小助手 23 天前 0 收藏

【Hadoop生态圈】Hadoop 概述

Hadoop Distributed File System，简称 HDFS，是一个分布式文件系统。1）NameNode（nn）：存储文件的元数据，如文件名，文件目录结构，文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。2）DataNode(dn)：在本地文

overfit同步小助手 23 天前 0 收藏

Hadoop面试题01

磁盘IO（正解），CPU，内存，网络带宽。

overfit同步小助手 23 天前 0 收藏

hadoop+Spark+springboot基于大数据的微博舆情监测分析系统(源码+文档+调试+可视化大屏)

Spring Boot基于Hadoop的微博舆情监测分析系统是一款强大的工具，它结合了Spring Boot框架的高效性和Hadoop的大数据处理能力，为微博舆情管理提供了全面的解决方案。以下是对该系统的详细介绍：一、系统背景与意义随着互联网的发展，微博等社交媒体已成为公众表达意见和情绪的重要渠道。

overfit同步小助手 23 天前 0 收藏

每个大数据专业都必须的hive实训教程航空数据分析(附：所要文件）成品快照在最后

使用文本编辑器（如 vi 或 nano）打开 /etc/yum.repos.d/CentOS-Base.repo 文件，并将其内容替换为阿里云提供的 CentOS 8 源。也可以通查看设置中网络配置，查看虚拟机ipv4复制，并在ip之后添加接口：50070就可以通过宿主机，虚拟机等在同一局域网的浏览

overfit同步小助手 23 天前 0 收藏

Hadoop期末复习（完整版）

复习之前我们要有目的性，明确考什么，不考什么。对于hadoop来说，首先理论方面是跑不掉的，而且还是重中之重。例如：hdfs的读写流程，hdfs副本机制等等。其次是hadoop命令,如果学习了hadoop不了解hadoop dfs …和hdfs dfs …那么你可以重修了。最后要明确那一部分会出什么

overfit同步小助手 23 天前 0 收藏

大数据-232 离线数仓 - 新增会员需求、创建与加载DWS 层、ADS 层与小结

DWS 层通常被称为数据仓库服务层或明细层，它是数据仓库架构中的中间层，负责将原始数据经过清洗、转换后进行存储，并提供给下游的数据应用层或分析层使用。ADS 层是面向应用的数据服务层，主要聚焦于业务的直接需求和决策支持，提供高性能和高响应的数据查询能力，通常是直接为应用或决策系统提供服务。DWS 层

overfit同步小助手 24 天前 0 收藏

将hadoop结果（python实现的结果）存入MySQL中

本文档详细介绍了如何在虚拟机中下载并启动 MySQL，创建数据库和表，将 HDFS 结果下载到本地，并使用 Python 脚本将数据插入 MySQL 数据库的整个流程。

overfit同步小助手 24 天前 0 收藏

Hadoop利用mapreduce进行词频统计 & yarn查看统计结果 (0基础手把手教学)

搭建好Hadoop后调用yarn 利用mapreduce 实现简单的词频统计

overfit同步小助手 24 天前 0 收藏

【Hadoop核心技术】

django基于Hadoop 的国产电影数据分析与可视化

Hadoop的三种运行模式：单机模式、伪分布式模式和完全分布式模式

详细教程-Linux上安装单机版的Hadoop

部署伪分布式 Hadoop集群

Idea在本地环境（Win11）连接虚拟机Hadoop并运行相关程序，超详细！

深入理解 Hadoop - MapReduce 分布式计算框架

【Hive实战】Hive MetaStore升级调研

Hadoop3.x完全分布式详细配置

在完全分布式hadoop上部署hbase

Ambari里面添加hive组件

Hive 整合 Spark 全教程（Hive on Spark）

【Hadoop生态圈】Hadoop 概述

Hadoop面试题01

hadoop+Spark+springboot基于大数据的微博舆情监测分析系统(源码+文档+调试+可视化大屏)

每个大数据专业都必须的hive实训教程航空数据分析(附：所要文件）成品快照在最后

Hadoop期末复习（完整版）

大数据-232 离线数仓 - 新增会员需求、创建与加载DWS 层、ADS 层与小结

将hadoop结果（python实现的结果）存入MySQL中

Hadoop利用mapreduce进行词频统计 & yarn查看统计结果 (0基础手把手教学)

作者榜

资讯小助手

内容小助手

Deephub

奕凯