分布式 - overfit.cn

Git——分布式版本控制工具详解

bash是一个命令处理器, 运行在文本窗口中, 并能执行用户直接输入的命令.bash还能从文件中读取Linux命令, 称之为脚本.bash支持通配符, 管道, 命令替换, 条件判断等逻辑控制语句文件切莫导入，直接open即可。

overfit同步小助手 2024-06-30 10:05:11 0 收藏

大数据之Hadoop的特点是什么？有什么优缺点？有哪些发行版本？

Hadoop 是一个开源的分布式存储和计算框架，由 Apache 软件基金会维护。Hadoop 的这些特点使其成为处理大规模数据集的理想选择，广泛应用于互联网、金融、医疗、科研等领域。

overfit同步小助手 2024-06-30 09:03:51 0 收藏

Hadoop一课一得

本文详细介绍了Hadoop课程的内容和学习路径，希望能够帮助读者更好地理解和应用这一强大的大数据处理工具。

overfit同步小助手 2024-06-30 06:03:29 0 收藏

kafka-消费者组（SpringBoot整合Kafka）

kafka-消费者组。

overfit同步小助手 2024-06-30 04:03:52 0 收藏

深度分析Kafka与RocketMQ：定义、优缺点、使用场景及选型指南

Apache Kafka是一个分布式流处理平台，最初由LinkedIn开发，并于2011年开源。Kafka的设计初衷是用于高吞吐量、低延迟的数据流处理和实时数据管道。Kafka的核心组件包括生产者、消费者、主题和分区。Apache RocketMQ是由阿里巴巴开发的一款分布式消息中间件，2016年捐

overfit同步小助手 2024-06-30 04:03:41 0 收藏

zookeeper + kafka消息队列

消费者组成员消费者组由多个消费者实例（Consumer Instance）组成。每个消费者实例通常运行在不同的进程或者不同的计算机上。主题分区分配消费者组的每个实例会订阅一个或多个主题。每个主题被分为多个分区（Partitions），每个分区只能由消费者组中的一个实例进行消费。Kafka 通过分区的

overfit同步小助手 2024-06-30 03:03:48 0 收藏

RocketMQ 和 Kafka 关于消息队列的推拉模式是怎么做的？

总的而言推拉模式各有优劣，而我个人觉得一般情况下拉模式更适合于消息队列。RocketMQ 和 Kafka 都是功能强大的消息队列系统，各自在不同的应用场景中有着显著的优势和适用性。选择合适的系统取决于具体的业务需求，包括数据处理的速度、可靠性要求以及整体架构设计等方面的考量。

overfit同步小助手 2024-06-30 03:03:24 0 收藏

Hadoop在win11安装

更改jre和jdk路径，不要包含空格和中文。

overfit同步小助手 2024-06-30 02:03:32 0 收藏

Hadoop 2.0 大家族（四）

本文讲解Hadoop2.0大家族，介绍Flume和Mahout。

overfit同步小助手 2024-06-29 20:03:17 0 收藏

【spark数据处理】文件上传+文件读取+文件筛选

对多列进行分组，并对每组进行聚合计数,这段代码首先创建了一个SparkSession实例，然后创建了一个包含三列（"columnName1", "columnName2", "col"）的DataFrame。hadoop fs -put /data/wenjian1.csv /data //上传

overfit同步小助手 2024-06-29 11:03:16 0 收藏

Zookeeper：分布式系统中的协调者

在当今的分布式系统环境中，服务的协调和管理是一个复杂且关键的问题。Zookeeper，作为一个开源的分布式协调服务，为这个问题提供了一个高效的解决方案。它是许多分布式应用和服务的基础设施，例如Hadoop、HBase和Kafka等。本文将探讨Zookeeper的核心概念、功能以及它在分布式系统中的作

overfit同步小助手 2024-06-29 07:03:46 0 收藏

Kafka 实战 - Kafka优化之解决消息积压问题

在 Apache Kafka 中，消息积压问题通常是指由于消费者消费能力不足或系统故障等原因，导致消息在主题分区中累积，无法及时处理，进而形成大量未消费的消息。

overfit同步小助手 2024-06-29 01:03:40 0 收藏

ZooKeeper 面试题

chubby 是 google 的，完全实现 paxos 算法，不开源。新时代）用来标识 leader 周期，如果有新的 leader 产生出来，epoch。对于第一类，我们将 zookeeper 上的一个 znode 看作是一把锁，通过 createznode。提出的时候加上了 zxid，zxid

overfit同步小助手 2024-06-28 22:03:48 0 收藏

Kafka的安装、管理和配置

overfit同步小助手 2024-06-28 19:03:47 0 收藏

消息队列的 6 种经典使用场景和 Kafka 架构设计原理详细解析

今天来聊一聊 Kafka 消息队列的使用场景和核心架构实现原理，帮助你全面了解 Kafka 其内部工作原理和设计理念。。Apache Kafka 是一个高吞吐量、分布式的流处理平台，广泛应用于实时数据管道和流处理应用中。Kafka 以其高性能、低延迟、扩展性和可靠性，成为了大数据生态系统中的重要组件

overfit同步小助手 2024-06-28 14:03:55 0 收藏

Kafka入门使用教程

消息队列（MQ）是消息传递中间件解决方案的一个组件，旨在支持独立的应用和服务之间的信息交换。消息队列按发送顺序存储“消息”（由应用所创建、供其他应用使用的数据包），直到使用方应用能够处理它们为止。这些消息安全地等待接收方应用做好准备，因此，即使网络或接收方应用出现问题，消息队列中的消息也不会丢失。系

overfit同步小助手 2024-06-28 13:03:13 0 收藏

RabbitMQ开启MQTT协议支持_rabbitmq 开启mqtt功能

/参数为true表示清除缓存，也就是非持久化订阅者，这个时候只要参数设为true，一定是非持久化订阅者。System.out.println(“收到消息，topic：”+topic + “, msg:” + new String(message.getPayload()));System.out.p

overfit同步小助手 2024-06-28 12:03:25 0 收藏

RabbitMQ系统监控、问题排查和性能优化实践

在上面的代码中，setConcurrentConsumers(3)设置了并发消费者的初始值为3，setMaxConcurrentConsumers(5)设置了最大的并发消费者数为5，setAcknowledgeMode(AcknowledgeMode.AUTO)设置了消息确认消费的方式为自动确认。在

overfit同步小助手 2024-06-28 10:03:38 0 收藏

ubuntu22 部署zookeeper + kafka集群 & 配置开机自启动

ufw disabled #关闭防火墙或者放开指定端口vim /etc/hosts #配置ip host映射关系。

overfit同步小助手 2024-06-28 09:03:57 0 收藏

基于Spark3.3.4版本，实现Spark On Yarn 模式部署

企业中的海量数据都会使用大数据相关计算框架进行分析处理，在早期大数据处理中，我们会选择使用MapReduce分析处理海量数据，MapReduce存在计算慢、代码编写复杂、不支持流式计算及性能上的一些问题，Apache Spark计算框架的出现解决了MapReduce计算框架以上各种问题，Apache

overfit同步小助手 2024-06-28 09:03:48 0 收藏