分布式 - overfit.cn

Kafka【九】如何实现数据的幂等性操作

为了解决Kafka传输数据时，所产生的数据重复和乱序问题，Kafka引入了幂等性操作，。注意，。默认幂等性是不起作用的，所以如果想要使用幂等性操作，只需要在生产者对象的配置中开启幂等性配置即可。

overfit同步小助手 2024-11-14 14:03:28 0 收藏

Hadoop框架及应用场景说明

Hadoop是一个开源的分布式系统基础架构。由多个组件组成，组件之间协同工作，进行大规模数据集的存储和处理。本文将探讨Hadoop的架构以及应用场景。

overfit同步小助手 2024-11-14 11:03:38 0 收藏

RabbitMQ系列学习笔记（八）--发布订阅模式

本文介绍了RabbitMQ的发布订阅模式，为作者在学习RabbitMQ时的笔记，特此记录，以便后续学习中能够查漏补缺。

overfit同步小助手 2024-11-14 09:03:39 0 收藏

@KafkaListener 消费注解解读

kafka ConsumerRecord消费、批量消费、监听topic中指定分区、注解方式获取消息头消息体、ack机制、常用属性及解释：

overfit同步小助手 2024-11-14 08:06:53 0 收藏

RabbitMQ实现轮询形式消息最大发送失败次数，及详细解析

【代码】RabbitMQ实现轮询形式消息最大发送失败次数，及详细解析。

overfit同步小助手 2024-11-14 02:03:41 0 收藏

RabbitMQ 持久化与不公平分发

持久化是指将消息或队列保存在磁盘上，以确保即使 RabbitMQ 服务器宕机或重启，数据也不会丢失。队列持久化意味着即使 RabbitMQ 重启后，队列依然存在，但它不会保证队列中的消息仍然存在。其中，true表示队列持久化。消息持久化是在生产者发送消息时指定的，确保消息在服务器重启后依然能够保留在

overfit同步小助手 2024-11-14 00:04:24 0 收藏

kafka（启动集群，使用spring方法，自定义配置）

Apache Kafka 是一个开源的分布式流处理平台，最初由 LinkedIn 开发，后来成为 Apache 项目。Kafka 主要用于高吞吐量、低延迟的实时数据流处理，常用于日志收集、实时分析、消息传递等场景。

overfit同步小助手 2024-11-13 23:03:21 0 收藏

RabbitMQ

集群模式提供了横向扩展和容错能力。镜像队列确保队列及其消息在多个节点上复制，防止单点故障。队列分片（Quorum Queues）提供了高效的队列管理和更高的容错性。网络分区管理帮助处理集群中网络故障时的分区问题。心跳检测与自动恢复确保节点或客户端故障时的快速检测和恢复。负载均衡和自动重连提供了客户端

overfit同步小助手 2024-11-13 21:03:48 0 收藏

Spark环境搭建

本文是使用VMware Workstation搭建Spark环境，操作系统为CentOS 7的详细步骤

overfit同步小助手 2024-11-13 17:03:23 0 收藏

Kafka 基础入门

一个kafka架构包括若干个Producer（服务器日志、业务数据、web前端产生的page view等），若干个Broker（kafka支持水平扩展，一般broker数量越多集群的吞吐量越大），若干个consumer group，一个Zookeeper集群（kafka通过Zookeeper管理集群

overfit同步小助手 2024-11-13 07:03:46 0 收藏

Zookeeper未授权访问的漏洞处理

这个命令可以用于获取Zookeepr（下面有zk代替）目标服务器的环境信息、部署路径、版本等敏感信息。如果这些信息被恶意利用，确实可能导致安全漏洞，进而对网络和服务器安全构成威胁。设置权限后，不同的IP服务器还是能访问到,zookeeper相应的路径,版本,还是有安全隐患.1.执行zkCli.sh

overfit同步小助手 2024-11-13 07:03:37 0 收藏

RabbitMQ如何保证消息不被重复消费

综上所述，RabbitMQ通过消息幂等性、消息去重、消息确认机制、设置消息过期时间、使用第三方消息去重插件以及合理配置消费者数量和重试机制等多种策略来尽量避免消息的重复消费。然而，需要注意的是，完全避免重复消费在分布式系统中是非常困难的，因此在设计系统时需要考虑如何处理重复消费的情况以及如何进行消息

overfit同步小助手 2024-11-13 02:03:52 0 收藏

Kafka 与 MQTT 的区别与对比

适合大规模、高吞吐的数据流处理。支持消息的持久化与回放。可扩展性强，适用于分布式系统。提供较强的消息一致性保障。

overfit同步小助手 2024-11-13 01:03:37 0 收藏

Hadoop YARN：现代大数据集群资源管理与作业调度

介绍大数据时代背景下，如何有效管理集群资源和调度作业的重要性，引入 Hadoop YARN 作为解决方案，并说明本文将深入探讨 YARN 的原理、架构和应用。

overfit同步小助手 2024-11-12 23:03:16 0 收藏

大数据之hive(分布式SQL计算工具)加安装部署

解压:命令: tar -zxvf /export/server/apache-hive-4.0.1-bin.tar.gz -C /export/server/设置软连接:ln -s /export/server/apache-hive-4.0.1-bin /export/server/hive。:

overfit同步小助手 2024-11-12 22:03:49 0 收藏

Hadoop3.x伪分布式详细配置

伪分布式模式也是只需要一台机器，但是与本地模式的不同，伪分布式使用的是分布式的思想，具有完整的分布式文件存储和分布式计算的思想。4.1.1 由于克隆过来的hadoop102与hadoop103的IP地址都是hadoop101的IP地址，因此我们可以在修改hadoop102主机信息的时候，关闭hado

overfit同步小助手 2024-11-12 01:03:55 0 收藏

【Kafka：概念、架构与应用】

Kafka是一种分布式的流处理平台和消息队列系统，由 LinkedIn 开发，并开源于 Apache 基金会。Kafka 设计为高吞吐量、可持久化的消息中间件，适用于实时数据流的处理和分析，常用于构建实时流式数据处理应用和数据管道。Kafka 支持发布-订阅模式和队列模式，并通过分区、复制等机制实现

overfit同步小助手 2024-11-11 22:03:44 0 收藏

RabbitMQ几大应用问题

所以幂等性保障，就是可以正确的处理相同重复的消息。当消费者收到消息后，就可以根据唯一ID判断该消息是否已经被消费过，如果已经被消费观过，则可以不做处理，进而可以避免重复消费的问题。消费者消费完成后没有及时对消息进行确认，或者确认丢失，MQ可能认为消息未发送成功进而重试，也会导致消息处理的顺序性问题。

overfit同步小助手 2024-11-11 21:03:32 0 收藏

Docker：LXC容器操作实战

通过LXC来完成容器的创建、体会什么是容器。利用LXC容器技术来隔离特定的应用，提供虚拟执行环境，从而优化资源管理和部署效率。LXC为Linux Container的简写，是一种可以提供轻量级虚拟化的技术，用于隔离进程和资源。LXC利用Linux内核的命名空间（Namespaces）和控制组（CGr

overfit同步小助手 2024-11-11 08:06:36 0 收藏

RabbitMQ 篇-深入了解延迟消息、MQ 可靠性（生产者可靠性、MQ 可靠性、消费者可靠性）

如果消息的延迟时间设置较长，可能会导致堆积的延迟消息非常多，会带来较大的 CPU 开销，同时延迟消息的时间会存在误差。不过 SpringAMQP 提供的重试机制时阻塞式的重试，也就是说多次重试等待的过程中，当前线程式被阻塞的。该插件的原理是设计了一种支持延迟消息功能的交换机，当消息投递到交换机后可以

overfit同步小助手 2024-11-11 08:02:07 0 收藏