大数据 Hadoop - overfit.cn

Hive基础知识（六）：Hive 配置运行日志信息、打印当前库和表头、参数配置方式

另外，Hive 也会读入 Hadoop 的配置，因为。

overfit同步小助手 2024-07-19 23:03:54 0 收藏

Hadoop的单节点集群设置(独立模式)_hadoop部署独立模式

将hadoop软件包上传到/opt/software目录下，然后解压到/opt/apps/目录下。–4. lib/libexec: hadoop的资源库存储目录。–6. include: hadoop的工具脚本存储目录。–1. bin: hadoop的二进制执

overfit同步小助手 2024-07-19 11:04:01 0 收藏

Hadoop HA ( 3.3.6 ) 保姆级教程，你值得拥有！

master启动journalnode: hdfs --daemon start journalnode。slave1中没有 namenode 则 hdfs namenode -bootstrapStandby。==>目的是：除master的其他namenode节点上同步信息(备份namenode)

overfit同步小助手 2024-07-19 11:03:35 0 收藏

Hadoop-MapReduce

该阶段的编程模型中有一个reduce函数需要开发人员重写，reduce函数的输入也是一个对，reduce函数的输出也是一个对。这里要强调的是，reduce的输入其实就是map的输出，只不过map的输出经过shuffle技术后变成了而已。该阶段的编程模型中会有一个map函数需要开发人员重写，map函数

overfit同步小助手 2024-07-19 09:03:53 0 收藏

hive线程数详解

hive.server2.async.exec.threads 默认100，设置计算线程的数量。hive.exec.input.listing.max.threads 默认值为15，Hive用来监听输入文件的最大线程数。hive.server2.async.exec.wait.queue.size

overfit同步小助手 2024-07-19 05:03:36 0 收藏

基于Hadoop的bilibili每周必看词条分析

这次实验中，对……的数据信息进行研究，通过运用大数据处理框架 Spark、Hadoop 及数据可视化技术，对这些数据进行存储、处理和分析，并对……分类。本实验展示了如何利用Hadoop技术对Bilibili平台的数据进行分析，特别是关注每周的热门词条。这些分析可以帮助理解用户的喜好和趋势，为内容创作

overfit同步小助手 2024-07-18 23:04:01 0 收藏

Hadoop之Ha高可用搭建教程

随着大数据技术的不断发展，Hadoop作为开源的大数据处理框架，已经广泛应用于各种场景中。然而，在大型生产环境中，Hadoop集群的稳定性和可用性显得尤为重要。为了保障Hadoop集群的高可用性（HA），我们需要采用一系列的技术和策略。本文将重点介绍Hadoop集群的HA高可用方案。Hadoop集群

overfit同步小助手 2024-07-18 16:03:48 0 收藏

Hadoop之HDFS重点架构原理简介

Hadoop之HDFS（Hadoop Distributed File System）的重点架构原理主要涉及其分布式文件系统的核心组件、数据存储机制、以及关键的数据读写流程。

overfit同步小助手 2024-07-18 06:03:49 0 收藏

【Hive实战】 HiveMetaStore的指标分析

HiveMetaStore指标采集

overfit同步小助手 2024-07-17 16:03:14 0 收藏

PySpark实战教程：大数据处理与分析案例

在开始使用PySpark之前，首先需要安装Apache Spark。Apache Spark是一个开源的大数据处理框架，它提供了对大规模数据集进行快速处理的能力。PySpark则是Spark的Python API，允许开发者使用Python编写Spark应用程序。

overfit同步小助手 2024-07-17 10:03:52 0 收藏

hadoop3.0高可用分布式集群安装

hadoop高可用，依赖于zookeeper。

overfit同步小助手 2024-07-17 10:03:39 0 收藏

Hive怎么调整优化Tez引擎的查询？在Tez上优化Hive查询的指南

在Tez上优化Hive查询无法采用一刀切的方法。查询性能取决于数据的大小、文件类型、查询设计和查询模式。在性能测试过程中，应评估和验证配置参数及任何SQL修改。建议在工作负载的性能测试过程中一次只进行一项更改，并最好在开发环境中评估调优更改的影响，然后再在生产环境中使用。

overfit同步小助手 2024-07-17 04:03:38 0 收藏

Hive中的数据类型和存储格式总结

Hive中的数据类型和存储格式总结

overfit同步小助手 2024-07-17 04:03:17 0 收藏

Hive概述与基本操作

Hive基本概念，hive架构，hive的数据库操作、表操作，内部表与外部表

overfit同步小助手 2024-07-17 02:03:46 0 收藏

在Hive中编写和注册UDF（用户自定义函数）

在Hive中编写和注册UDF（用户自定义函数）

overfit同步小助手 2024-07-16 19:03:42 0 收藏

深入浅出Hadoop：从零开始搭建与配置你的大数据处理平台

后续学习路径：鼓励读者进一步探索Hadoop生态系统中的其他组件，如Hive、HBase、Spark等，以及如何根据实际业务需求优化集群配置。总结：回顾Hadoop集群搭建与配置的关键步骤，强调掌握这一技能对于处理大数据挑战的价值。

overfit同步小助手 2024-07-16 13:03:55 0 收藏

Hadoop数仓中常用端口详解:(第36天)

在数仓（数据仓库）开发中，不同的组件和服务会使用不同的端口号进行通信。由于数仓的实现可能依赖于多种技术和框架（如Hadoop、Hive、HBase、Spark等），因此涉及的端口号也会有所不同。以下是一些数仓开发中常用端口号及其作用的概述，以及相关的操作指令建议。常用端口号及其作用。

overfit同步小助手 2024-07-16 13:03:33 0 收藏

Flink实战 - 搭建HA高可用集群

一、部署说明

overfit同步小助手 2024-07-16 11:03:23 0 收藏

Hadoop文件上传的步骤

Hadoop文件上传的步骤

overfit同步小助手 2024-07-15 15:03:45 0 收藏

Hadoop完全分布式+spark（python）

大数据学习Hadoop完全分布式+spark搭建

overfit同步小助手 2024-07-15 13:03:53 0 收藏

27
28
29
30
31
32
33
34
35
36

登录可以使用的更多功能哦！登录

BI Flink Hadoop Hive MPP Scala Spark 数据仓库

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈