kafka - overfit.cn

消息队列选型：Kafka 如何实现高性能？

在分布式消息模块中，我将对消息队列中应用最广泛的 Kafka 和 RocketMQ 进行梳理，以便于你在应用中可以更好地进行消息队列选型。另外，这两款消息队列也是面试的高频考点。所以，本文我们就一起来看一下，Kafka 是如何实现高性能的。

overfit同步小助手 2024-01-25 09:03:42 0 收藏

Kafka中的enable-auto-commit和auto-commit-interval配置

overfit同步小助手 2024-01-25 07:03:48 0 收藏

ELK+kafka+filebeat企业内部日志分析系统

是一个基于Lucene的搜索服务器。提供搜集、分析、存储数据三大功能。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，

overfit同步小助手 2024-01-25 06:03:50 0 收藏

【Kafka-3.x-教程】-【七】Kafka 生产调优、Kafka 压力测试

那么当生产者向一个未创建的主题发送消息时，会自动创建一个分区数为 num.partitions（默认值为1）、副本因子为 default.replication.factor（默认值为 1）的主题。：默认是 none，不压缩，但是也可以使用 lz4 压缩，效率还是不错的，压缩之后可以减小数据量，提升

overfit同步小助手 2024-01-25 04:05:56 0 收藏

【Kafka】Suppressed: java.nio.file.AccessDeniedException问题的解决

overfit同步小助手 2024-01-25 02:03:15 0 收藏

Kafka（二）【文件存储机制 & 生产者】

Kafka 文件存储机制、生产者发送数据、分区、数据的容错与一致性保证

overfit同步小助手 2024-01-24 12:03:43 0 收藏

kafka处理大量消息积压tips —— 筑梦之路

场景：1. 如果是Kafka消费能力不足，则可以考虑增加 topic 的 partition 的个数，同时提升消费者组的消费者数量，消费数 = 分区数（二者缺一不可）2. 若是下游数据处理不及时，则提高每批次拉取的数量。批次拉取数量过少（拉取数据/处理时间 < 生产速度），使处理的数据小于生产的数

overfit同步小助手 2024-01-24 12:03:22 0 收藏

阿里技术官亲笔：Kafka限量笔记，一本书掌握Kafka的精髓

我们常常仰望那些大厂的大神们，但要知道，他们也不过是平凡的人，只是比菜鸟程序员多付出了几分心思。如果你不努力，差距只会越拉越大。作为程序员，充实自己的知识和技能是至关重要的。在我看来，付出的努力和回报是成正比的。学习Kafka并不难，这份Kafka限量笔记的内容将会对你的学习大有裨益。如果你想要这份

overfit同步小助手 2024-01-24 11:03:24 0 收藏

【flink番外篇】9、Flink Table API 支持的操作示例（8）- 时态表的join（scala版本）

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-01-24 06:03:50 0 收藏

Kafka学习笔记三(生成数据发送与分区)

分区器相比会减少时延。即使在linger.ms为0并立即发送的情况下，也可以看到StickPartitioner会减少时延。发送一系列batches后，粘性分区将发生更改。随着时间的推移，记录应该均匀地分布在所有分区中。

overfit同步小助手 2024-01-23 21:03:39 0 收藏

Golang中常用的kafka库

golang中常用的kafka库

overfit同步小助手 2024-01-23 09:03:37 0 收藏

【flink番外篇】9、Flink Table API 支持的操作示例（1）-完整版

一、Flink 专栏Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。

overfit同步小助手 2024-01-23 08:03:42 0 收藏

深入剖析：Kafka流数据处理引擎的核心面试问题解析75问（5.7万字参考答案）

Kafka 是一款开源的分布式流处理平台，被广泛应用于构建实时数据管道、日志聚合、事件驱动的架构等场景。本文将深入探究 Kafka 的基本原理、特点以及其在实际应用中的价值和作用。 Kafka 的基本原理是建立在发布-订阅模式之上的。生产者将消息发布到主题（Topic）中，而消费者则可以订阅这些主

overfit同步小助手 2024-01-23 08:03:18 0 收藏

大数据系统常用组件理解（Hadoop/hive/kafka/Flink/Spark/Hbase/ES）

Spark streaming接收kafka、Flume、HDFS、套接字等各种来源实时输入数据，进行处理，处理后结构数据可存储到文件系统、数据库，或显示在可视化图像中；Hive 是构建在Hadoop HDFS上的数据仓库，可以将结构化的数据文件映射成一张数据库表，并提供类SQL查询功能，主要完成海

overfit同步小助手 2024-01-23 06:03:44 0 收藏

【Kafka】Kafka客户端认证失败：Cluster authorization failed.

1. kafka客户端是公司内部基于spring-kafka封装的2. spring-boot版本：3.x3. spring-kafka版本：2.1.11.RELEASE4. 集群认证方式：SASL_PLAINTEXT/SCRAM-SHA-5125. 经过多年的经验，以及实际验证，配置是没问题的，但

overfit同步小助手 2024-01-23 01:03:45 0 收藏

2023_Spark_实验三十二：消费Kafka数据并保存到MySQL中

使用shell模拟实时数据，flume采集实时数据到kafka中，通过scala开发spark代码实现消费kafka数据存储到MySQL中

overfit同步小助手 2024-01-22 22:03:30 0 收藏

Kafka（七）可靠性

min.insync.replicas(默认值为1)代表了正常写入生产者数据所需要的最少ISR个数, 当ISR中的副本数量小于min.insync.replicas时，Leader停止写入生产者生产的消息，并向生产者抛出NotEnoughReplicas异常，阻塞等待更多的 Follower 赶上并

overfit同步小助手 2024-01-22 16:03:31 0 收藏

【flink番外篇】13、Broadcast State 模式示例（完整版）

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-01-22 15:03:42 0 收藏

Kafka消息存储

本文介绍了Kafka关于日志存储相关的目录结构, 日志内容结构, 日志删除策略以及Kafka使用的高性能IO策略。

overfit同步小助手 2024-01-22 10:03:25 0 收藏

Kafka详解及常见面试问题解析（值得珍藏）

Kafka是一个分布式消息队列，它对消息保存时根据Topic进行归类。发送消息者称为Producer，消息接受者称为Consumer。此外，Kafka集群由多个Kafka实例组成，每个实例（server）成为broker。无论是Kafka集群，还是Producer和Consumer都依赖于Zooke

overfit同步小助手 2024-01-22 03:03:44 0 收藏