kafka - overfit.cn

Kafka原理之消费者

主题的1号分区，在哪个broker上，就选择这个节点的coordinator作为这个消费者组的老大，消费者组下所有的消费者提交offset的时候，就往这个分区去提交offset。这个只是针对一个topic而言，C0消费者多消费一个分区影响不是很大，但是如果这个消费者组消费多个topic，容易产生数据

overfit同步小助手 2023-09-09 05:03:33 0 收藏

分布式 - 消息队列Kafka：Kafka生产者发送消息的方式

具体来说，当生产者成功发送消息时，回调函数会被传递一个RecordMetadata对象，该对象包含了发送消息的相关信息，如消息所在的分区、消息在分区中的偏移量等。回调函数会在 producer 收到 ack 时调用，该方法有两个参数，分别是元数据信息（RecordMetadata）和异常信息（Exc

overfit同步小助手 2023-09-09 00:04:05 0 收藏

Kafka入门，消费者工作流程（十八）

pull(拉)模式：consumer采用从broker中主动拉取数据。Kafka采用这种方式。push(推)模式：Kafka没有采用这种方式，因为由broker决定消息发送速率，很难适应所有消费者的速率。例如推送速度是50m/s，consumer1，consumer2就来不及处理消息pull模式不足

overfit同步小助手 2023-09-08 19:03:28 0 收藏

Kafka3.0.0版本——Leader故障处理细节原理

overfit同步小助手 2023-09-08 13:04:12 0 收藏

大数据之Kafka————java来实现kafka相关操作

生产者多线程是一种常见的技术实践，可以提高消息生产的并发性和吞吐量。通过将消息生产任务分配给多个线程来并行地发送消息，可以有效地利用系统资源，加快消息的发送速度。Java中写在生产者输入内容在kafka中可以让消费者提取。（2）、Producer进行多线程操作。一、在java中配置pom。通过jav

overfit同步小助手 2023-09-08 10:03:27 0 收藏

kafka服务端允许生产者发送最大消息体大小

overfit同步小助手 2023-09-08 06:03:20 0 收藏

kafka的rebalance机制

再平衡：Reblance是一种协议，规定了一个ConsumerGroup下所有Consumer如何达成一致，来分配订阅Topic的每个分区，尽量让每个消费者分配到相对均匀的分区，使Consumer的资源都能得到充分利用，防止有些Consumer比较忙，有的Consumer比较闲。

overfit同步小助手 2023-09-07 23:04:04 0 收藏

springboot整合kafka入门

Kafka实际环境有可能会出现Consumer全部宕机，虽然基于Kafka的高可用特性，消费者群组中的消费者可以实现再均衡，所有Consumer不处理数据的情况很少，但是还是有可能会出现，此时就要求Consumer重启的时候能够读取在宕机期间Producer发送的数据。msg=web world31

overfit同步小助手 2023-09-07 21:03:40 0 收藏

【消息队列】细说Kafka消费者的分区分配和重平衡

kafka 分区分配和重平衡

overfit同步小助手 2023-09-07 19:03:14 0 收藏

Kafka-副本数量设置

ISR 机制的另外一个相关参数是, 可以在 broker 或者主题级别进行配置，代表 ISR 列表中至少要有几个可用副本。这里假设设置为 2，那么当可用副本数量小于该值时，就认为整个分区处于不可用状态。此时客户端再向分区写入数据时候就会抛出异常。

overfit同步小助手 2023-09-07 03:04:21 0 收藏

Kafka如何解决消息丢失的问题

在以上这三步中每一步都可能会出现丢失数据的情况，那么 Kafka 到底在什么情况下才能保证消息不丢失呢？

overfit同步小助手 2023-09-06 22:04:15 0 收藏

zookeeper和kafka

Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。主要原因是由于在高并发环境下，同步请求来不及处理，请求往往会发生阻塞。比如大量的请求并发访问数据库，导致行锁表锁，最后请求线程会堆积过多，从而触发 too many connection 错误，引发雪崩效应。我们使用

overfit同步小助手 2023-09-06 18:04:08 0 收藏

docker中快速安装Kafka(单节点)

docker中快速安装Kafka_单节点

overfit同步小助手 2023-09-06 18:04:03 0 收藏

kafka启动、状态监控、日常操作

overfit同步小助手 2023-09-06 13:04:26 0 收藏

30、Flink SQL之SQL 客户端（通过kafka和filesystem的例子介绍了配置文件使用-表、视图等）

SQL 客户端允许用户创建用户自定义的函数来进行 SQL 查询。当前，这些自定义函数仅限于 Java/Scala 编写的类以及 Python 文件。为提供 Java/Scala 的自定义函数，你首先需要实现和编译函数类，该函数继承自 ScalarFunction、 AggregateFunction

overfit同步小助手 2023-09-06 08:04:09 0 收藏

分布式 - 消息队列Kafka：Kafka 消费者的消费位移

再考虑一种情况，当有新的消费者加入时，那么必然会有再均衡的动作，对于同一分区而言，它可能在再均衡动作之后分配给新的消费者，如果不持久化保存消费位移，那么这个新的消费者也无法知晓之前的消费位移。如下图，x 表示某一次拉取操作中此分区消息的最大偏移量，假设当前消费者已经消费了 x 位置的消息，那么我们就

overfit同步小助手 2023-09-06 07:04:15 0 收藏

如何查看Kafka的Topic消费情况

2.10为Scala版本，0.10.0.2.5.3.0为kafka版本。进入kafka安装目录，然后执行以下命令。从某一时间开始消费某一topic。从最开始开始消费某一topic。或者不指定日志输出位置和设置。

overfit同步小助手 2023-09-05 21:04:35 0 收藏

Docker 搭建 zookeeper、kafka 集群

docker 容器部署 kafka 集群

overfit同步小助手 2023-09-05 19:03:47 0 收藏

Kafka怎么保证数据不丢失，不重复

Kafka是一个分布式消息队列系统，具有高可靠性、高性能和高扩展性等特点。在数据传输过程中，Kafka采用了多种措施来保证数据的可靠性，包括数据复制、数据持久化、数据备份等。本文将从各个阶段深入分析Kafka如何保证数据不丢失、不重复，并提供代码实例来验证过程。

overfit同步小助手 2023-09-05 11:04:27 0 收藏

kafka：broker、producer、consumer常用配置

摘要 kafka参数官方文档为：https://kafka.apache.org/documentation/#producerconfigs，这里记下常用配置。broker 我们在kafka官网下载的文件比如kafka_2.11-2.4.0.tgz解包启动后就是就是kafka节点，主要

overfit同步小助手 2023-09-05 10:04:33 0 收藏