分布式 - overfit.cn

深入浅出Hadoop：从零开始搭建与配置你的大数据处理平台

后续学习路径：鼓励读者进一步探索Hadoop生态系统中的其他组件，如Hive、HBase、Spark等，以及如何根据实际业务需求优化集群配置。总结：回顾Hadoop集群搭建与配置的关键步骤，强调掌握这一技能对于处理大数据挑战的价值。

overfit同步小助手 2024-07-16 13:03:55 0 收藏

Hadoop数仓中常用端口详解:(第36天)

在数仓（数据仓库）开发中，不同的组件和服务会使用不同的端口号进行通信。由于数仓的实现可能依赖于多种技术和框架（如Hadoop、Hive、HBase、Spark等），因此涉及的端口号也会有所不同。以下是一些数仓开发中常用端口号及其作用的概述，以及相关的操作指令建议。常用端口号及其作用。

overfit同步小助手 2024-07-16 13:03:33 0 收藏

Kafka 进阶指南

本指南介绍了 Kafka 的进阶主题，包括性能调优、扩展策略、数据复制、日志管理、流处理和安全性。这些高级特性和使用技巧可以帮助您更好地利用 Kafka 提高系统的性能、可扩展性和可靠性。希望这篇文章能够帮助您深入理解 Kafka，并在实际项目中应用这些知识。# Kafka 进阶指南## 引言在掌握

overfit同步小助手 2024-07-16 13:03:13 0 收藏

图解 Kafka 架构

Kafka 是一个可横向扩展，高可靠的实时消息中间件，常用于服务解耦、流量削峰。

overfit同步小助手 2024-07-16 12:03:35 0 收藏

Kafka之Broker原理

本文介绍Broker服务器，主要讲了Broker中日志的存储，从大到小依次为Partition、Segment，副本机制的具体存储形式，是怎么进行负载均衡和容灾保障的，在Segment中我们直到了Segment是由一个Log文件和两个索引文件组成的，索引文件主要起的是一个提升查询效率的作用。随后当k

overfit同步小助手 2024-07-16 00:03:50 0 收藏

rabbitmq

用途● 流量削峰最大处理量如果是一秒一万条订单，一秒钟来了两万条，可以先存在消息队列里面，按照能力去消费处理● 应用解耦下单后，需要去调用很多其他系统，使用我们的发布订阅，让需要接受这条消息的服务监听这个queue● 异步处理在我们一些需要异步调用的场景中，回调核心概念生产者交换机（需要重点理解）接

overfit同步小助手 2024-07-15 22:03:50 0 收藏

Hadoop文件上传的步骤

overfit同步小助手 2024-07-15 15:03:45 0 收藏

Hadoop完全分布式+spark（python）

大数据学习Hadoop完全分布式+spark搭建

overfit同步小助手 2024-07-15 13:03:53 0 收藏

Hadoop简单应用程序实例

Hadoop是一个分布式系统基础架构，主要用于大数据的存储和处理。它允许使用简单的编程模型跨集群处理和生成大数据集。Hadoop主要由HDFS（Hadoop Distributed FileSystem，分布式文件系统）和MapReduce编程模型两部分组成。

overfit同步小助手 2024-07-15 13:03:20 0 收藏

【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！

在深入了解消息确认机制之前，我们先简要回顾一下Kafka的基础架构。Kafka是一个分布式的流处理平台，它主要由三个核心组件构成：Producer（生产者）、Broker（代理）和Consumer（消费者）。生产者负责发送消息到Kafka集群，代理负责存储和管理这些消息，而消费者则从Kafka集群中

overfit同步小助手 2024-07-15 11:03:18 0 收藏

Spark调度底层执行原理详解（第35天）

Spark调度底层执行原理是一个复杂而精细的过程，它涉及到多个组件的交互和协同工作，以实现大数据处理的高效性和灵活性。本文主要对Spark调度底层执行原理进行详细解析。

overfit同步小助手 2024-07-15 08:03:19 0 收藏

kafka--发布-订阅消息系统

kafka是分布式的高并发的基于发布/订阅模式的消息队列软件系统。

overfit同步小助手 2024-07-15 07:03:58 0 收藏

【Kafka专栏 10】Kafka消息压缩机制：从带宽保存到存储成本降低

Kafka的消息压缩机制通过减少网络传输的数据量、降低磁盘存储空间的占用以及减少I/O操作的开销来提高系统的性能和可扩展性。通过选择合适的压缩算法、控制压缩级别、监控压缩效果以及注意消息顺序和一致性等策略，可以确保Kafka在保持高性能的同时实现有效的资源利用。然而，需要注意的是，压缩和解压缩过程也

overfit同步小助手 2024-07-15 07:03:44 0 收藏

1. zookeeper分布式协调者

作用：分布式系统中，用于协调者、集群管理、配置管理、命名服务, 解决分布式系统中一致性的问题开源、Apache组件。

overfit同步小助手 2024-07-14 15:03:34 0 收藏

Kafka详解

Kafka、RabbitMQ、RocketMQ常见消息中间件的介绍和对比。

overfit同步小助手 2024-07-14 12:03:52 0 收藏

RabbitMQ有哪些优缺点

综上所述，RabbitMQ 的高可靠性、灵活的路由、支持多种消息协议、高可用性、插件化扩展、易用性和可管理性、高性能以及广泛的社区支持等优势，使得它成为了一款值得信赖的消息队列服务。需要注意的是，以上缺点并不是RabbitMQ所独有的，其他消息队列系统也可能存在类似的问题。RabbitMQ 作为一款

overfit同步小助手 2024-07-14 11:03:46 0 收藏

Spark底层原理：案例解析（第34天）

Apache Spark是一个快速、通用、基于内存的分布式计算引擎，专为大规模数据处理而设计。其架构设计体现了高度的模块化和可扩展性，支持多种数据处理模式，包括批处理、实时流处理、交互式查询、机器学习和图计算等。以下将详细介绍Spark的架构设计，并结合具体例子进行分析。

overfit同步小助手 2024-07-14 08:03:25 0 收藏

RabbitMQ 的经典问题

当设计和运维消息队列系统时，如 RabbitMQ，有几个关键问题需要特别关注：消息丢失、重复消费、消息堆积、有序消费和延时队列。这些问题直接影响系统的可靠性、性能和数据完整性。本文将深入探讨如何在使用 RabbitMQ 时有效地解决这些问题。

overfit同步小助手 2024-07-14 05:03:52 0 收藏

kafka enable.auto.commit和auto.offset.reset使用说明

【代码】kafka enable.auto.commit和auto.offset.reset使用说明。

overfit同步小助手 2024-07-14 05:03:41 0 收藏

Kafka 3.x.x 入门到精通（02）——对标尚硅谷Kafka教程

Kafka是一个由Scala和Java语言开发的，经典高吞吐量的分布式消息发布和订阅系统，也是大数据技术领域中用作数据交换的核心组件之一。以高吞吐，低延迟，高伸缩，高可靠性，高并发，且社区活跃度高等特性，从而备受广大技术组织的喜爱。

overfit同步小助手 2024-07-13 18:03:31 0 收藏