大数据 - overfit.cn

ZooKeeper UI客户端(zkui) 开源项目FAQ

ZooKeeper UI客户端(zkui) 开源项目FAQ zkui zkui is a GUI client of Apache ZooKeeper. Download:

overfit同步小助手 2024-11-16 10:03:44 0 收藏

【系统设计】提升Kafka系统性能：Spring Boot实现Lag感知的生产者与消费者

本文介绍了如何在Kafka中实现一个Lag Aware的Producer与Consumer，通过监控各分区的Lag值，动态调整消息的生产与消费策略，达到智能的负载均衡效果。具体实现中，Producer在发送消息前会检查各分区的Lag值，并根据Lag情况选择合适的分区进行消息发送；Consumer则在

overfit同步小助手 2024-11-16 10:03:33 0 收藏

Linux系统部署Hive数据仓库

启动前面配置好的hdfs 以及YARN，然后再使用命令bin/hive(完整路径：/export/server/hive/bin/hive)启动Hive。修改/export/server/hadoop/etc/hadoop路径下core-site.xml文件，新增如下配置。切换为hadoop用户，在

overfit同步小助手 2024-11-16 09:03:59 0 收藏

Hadoop(YARN)

YARN是Hadoop集群的资源管理和调度系统，它负责为各种分布式计算任务分配和管理资源,包含以下组件：ResourceManager，NodeManager，ApplicationMaster， Container。

overfit同步小助手 2024-11-16 09:03:55 0 收藏

深入理解 Kafka：分布式消息队列的强大力量

Kafka简介

overfit同步小助手 2024-11-16 08:03:59 0 收藏

【大数据技术基础 | 实验十一】Hive实验：新建Hive表

本实验介绍Hive的DDL操作，能够在Hive中新建，显示，修改和删除表等功能。

overfit同步小助手 2024-11-16 08:03:31 0 收藏

毕业设计项目基于大数据人才岗位数据分析

这里是毕设分享系列，学长分享优质毕业设计项目，今天要分享的是🚩基于大数据人才岗位数据分析毕业设计基于大数据人才岗位数据分析🧿 项目分享:见文末!

overfit同步小助手 2024-11-16 08:03:28 0 收藏

大数据新视界 -- 大数据大厂之 Impala 性能提升：高级执行计划优化实战案例（下）（18/30）

本文围绕 Impala 高级执行计划优化实战案例展开，包括金融风险评估、电商营销分析、医疗疾病预测等，阐述优化过程与效果、面临挑战与应对策略，含丰富代码与表格。

overfit同步小助手 2024-11-16 08:03:24 0 收藏

大数据新视界 -- 大数据大厂之 Impala 性能飞跃：动态分区调整的策略与方法（上）（21 / 30）

本文围绕 Impala 动态分区调整，阐述其意义，对比传统分区，介绍基于时间、业务规则、混合策略，结合社交媒体、电信案例，还有性能监控与优化，含丰富代码，助力性能提升。

overfit同步小助手 2024-11-16 08:03:14 0 收藏

Kafka相关知识点（上）

使用消息队列的主要目的主要记住这几个关键词:解耦、异步、削峰填谷。在一个复杂的系统中，不同的模块或服务之间可能需要相互依赖，如果直接使用函数调用或者 API 调用的方式，会造成模块之间的耦合，当其中一个模块发生改变时，需要同时修改调用方和被调用方的代码。而使用消息队列作为中间件，不同的模块可以将消息

overfit同步小助手 2024-11-16 06:03:45 0 收藏

Hive中分区（Partition）和分桶（Bucket）区别

overfit同步小助手 2024-11-16 06:03:09 0 收藏

GitHub Spark：GitHub 推出零代码开发应用的 AI 编程产品

GitHub Spark 是一个基于 AI 的大模型编程产品，允许用户通过自然语言描述来创建和分享微应用程序，无需编写代码，即可在桌面和移动端使用。

overfit同步小助手 2024-11-16 05:03:48 0 收藏

【大数据】Spark Executor内存分配原理与调优

【大数据】Spark Executor内存管理与调优 Executor内存总体布局统一内存管理堆内内存 (On-heap Memory) 堆外内存 (Off-heap Memory) Execution 内存和 Storage 内存动态占用机制任务内存管理(Task Memory M

overfit同步小助手 2024-11-16 05:03:22 0 收藏

HBase: The Definitive Guide 项目推荐

HBase: The Definitive Guide 项目推荐 hbase-book Contains the code used in the HBase: The Definitive Guide book.

overfit同步小助手 2024-11-16 04:03:21 0 收藏

GH Archive 项目使用教程

GH Archive 项目使用教程 gharchive.orgGH Archive is a project to record the public GitHub timeline, archive it, and make it easily accessible for further ana

overfit同步小助手 2024-11-16 03:03:48 0 收藏

Hive锁表、hive查询表是否被锁、hive解锁表

overfit同步小助手 2024-11-16 03:03:39 0 收藏

【头歌】Hive基本查询操作（二）答案

【头歌】Hive基本查询操作（二）答案第1关：Hive排序第2关：Hive数据类型和类型转换第3关：Hive抽样查询

overfit同步小助手 2024-11-16 03:03:27 0 收藏

大数据-218 Prometheus 插件 exporter 与 pushgateway 配置使用监控服务使用场景

Prometheus Pushgateway 是一个用于帮助 Prometheus 监控短期任务和批处理任务的组件。在 Prometheus 的原生拉取模型中，它通常通过定期从各服务中“拉取”指标。然而，对于一些存在于短时间内的工作任务或批处理任务，比如脚本或批处理作业，它们可能在 Promethe

overfit同步小助手 2024-11-16 02:04:27 0 收藏

kafka基本使用及结合Java使用_java kafka

/kafka-consumer-groups.sh --bootstrap-server 服务器IP地址:9093 --describe --group testGroup1* Currennt-offset: 当前消费组的已消费偏移量 \* Log-end-offset: 主题对应分区消息的结束偏

overfit同步小助手 2024-11-16 01:03:36 0 收藏

RabbitMQ的解耦、异步、削峰是什么？

是指使系统的不同组件间的依赖关系减少或消失。在使用RabbitMQ时，生产者（发送消息的组件）和消费者（接收和处理消息的组件）不直接交互，而是通过消息队列进行通信。通信意味着消息的发送和接收可以不在同一时间进行。当生产者发送消息到RabbitMQ时，它不必等待消费者处理完消息再继续执行。是指在系统负

overfit同步小助手 2024-11-15 23:03:32 0 收藏