kafka - overfit.cn

阿里技术官亲笔：Kafka限量笔记，一本书掌握Kafka的精髓

我们常常仰望那些大厂的大神们，但要知道，他们也不过是平凡的人，只是比菜鸟程序员多付出了几分心思。如果你不努力，差距只会越拉越大。作为程序员，充实自己的知识和技能是至关重要的。在我看来，付出的努力和回报是成正比的。学习Kafka并不难，这份Kafka限量笔记的内容将会对你的学习大有裨益。如果你想要这份

overfit同步小助手 2024-02-21 20:03:51 0 收藏

【shell-10】shell实现的各种kafka脚本

因为经常要用kafka环境参与测试，所以写了不少脚本。在很多时候可以大大提高测试的效率。topic数据传输【file数据录入到topic,topic数据下载到本地文件】此文件是个额外的日志文件主要用于打印日志，该文件会被下面的shell文件引用。topic信息查看【topic列表，topic gro

overfit同步小助手 2024-02-21 10:04:02 0 收藏

59、Flink CEP - Flink的复杂事件处理介绍及示例（3）- 模式选取及超时处理

Flink 系列文章一、Flink 专栏Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用

overfit同步小助手 2024-02-21 00:03:36 0 收藏

Sqoop与Kafka的集成：实时数据导入

SqoopSqoop是一个开源工具，用于在Hadoop生态系统中传输数据和关系型数据库之间进行数据导入和导出。它使数据工程师能够轻松将结构化数据从关系型数据库导入到Hadoop集群中，以供进一步的数据处理和分析。Kafka是一个分布式流处理平台，用于构建实时数据流应用程序和数据管道。Kafka提供了

overfit同步小助手 2024-02-20 22:03:22 0 收藏

37、Flink 的CDC 格式：debezium部署以及mysql示例（1）-debezium的部署与示例

Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka 中。Debezium 为变更日志提供了统一的格式

overfit同步小助手 2024-02-20 20:03:47 0 收藏

springboot、spring-kafka、kafka-client的版本对应关系

在使用springboot集成kafka的时候需要注意springboot版本、引用的依赖spring-kafka版本和kafka中间件版本的对应关系，否则可能会因为版本不兼容导致出现错误。

overfit同步小助手 2024-02-20 14:03:30 0 收藏

Flink Upsert Kafka SQL Connector 介绍

overfit同步小助手 2024-02-20 09:02:24 0 收藏

Kafka——管理Kafka(命令行工具)详解

有时候，我们需要知道提交的消费者群组偏移量是多少，比如某个特定的群组是否在提交偏移量，或者偏移量提交的频度。也就是说，如果集群里有 5 个 broker，生产者的配额是 10MB/s，那么它可以以 10MB/s 的速率在单个 broker 上生成数据，总共的速率可以达到 50MB/s。根据分区

overfit同步小助手 2024-02-20 08:03:49 0 收藏

Flink与Kafka集成：实时数据流处理

1.背景介绍1. 背景介绍Apache Flink 是一个流处理框架，用于处理大规模、实时的数据流。它支持流式计算和批处理，可以处理各种数据源和数据接收器，如 Kafka、HDFS、TCP 流等。Kafka 是一个分布式流处理平台，用于构建实时数据流管道和流处理应用。Flink 与 Kafka 的集

overfit同步小助手 2024-02-20 04:03:54 0 收藏

Kafka(一)

Kafka传统定义：Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。Kafka最新定义： Kafka是一个开源的分布式事件流平台（Event Streaming Platform），被数千家公司用于高性能数据管道、流分析、

overfit同步小助手 2024-02-20 04:03:44 0 收藏

Kafka 生产调优

100 万日活，每人每天 100 条日志，每天总共的日志条数是 100 万 * 100 条 = 1 亿条。1 亿 / 24 小时 / 60 分 / 60 秒 = 1150 条/每秒钟。每条日志大小：0.5k ~ 2k（约1k）。1150 条/每秒钟 * 1k ≈ 1m/s。高峰期每秒钟：1150 条

overfit同步小助手 2024-02-19 22:03:20 0 收藏

从kafka如何保证数据一致性看通常数据一致性设计

在数据库系统中有个概念叫事务，事务的作用是为了保证数据的一致性，意思是要么数据成功，要么数据失败，不存在数据操作了一半的情况，这就是数据的一致性。在很多系统或者组件中，很多场景都需要保证数据的一致性，有的是高度的一致性。特别是在交易系统等这样场景。有些组件的数据不一定需要高度保证数据的一致性，比如日

overfit同步小助手 2024-02-19 10:03:50 0 收藏

jmx_exporter监控kafka和zk的jvm

介绍了jmx_exporter怎么监控kafka和zk的jvm

overfit同步小助手 2024-02-18 17:03:51 0 收藏

【Kafka】手把手SASL，SSL教学

kafka的SASL和SSL配置全指南

overfit同步小助手 2024-02-18 04:03:51 0 收藏

Docker下的Kafka

在上一篇文章中我们已经成功地拉取了3.5.9版本的zookeeper官方镜像以及bitnami镜像，下面将通过使用bitnami的Kafka镜像搭配使用bitnami的zookeeper镜像来体验Kafka的使用。Kafka是一个分布式流处理平台和消息队列系统，旨在实现高吞吐量、持久性的日志型消息传

overfit同步小助手 2024-02-18 04:03:44 0 收藏

【flink番外篇】18、通过数据管道将table source加入datastream示例

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-02-18 01:03:41 0 收藏

Kafka运维相关知识

Consumer 端还有一个参数，用于控制 Consumer 实际消费能力对 Rebalance 的影响，即 max.poll.interval.ms 参数，默认5min，Consumer 端应用程序两次调用 poll 方法的最大时间间隔，表示你的 Consumer 程序如果在 5 分钟之内无法消费

overfit同步小助手 2024-02-18 00:03:23 0 收藏

消息中间件：Puslar、Kafka、RabbigMQ、ActiveMQ

消息队列：它主要用来暂存生产者生产的消息，供后续其他消费者来消费。

overfit同步小助手 2024-02-17 22:03:14 0 收藏

Centos7.9安装kafka_2.12-3.6.1

目录一、安装 JDK 1.安装jdk

overfit同步小助手 2024-02-17 20:03:47 0 收藏

Kafka 社区KIP-382中文译文（MirrorMaker2/集群复制/高可用/灾难恢复）

译者：对于Kafka高可用的课题，我想每个公司都有自己的方案及思考，这是一个仁者见仁智者见智的命题，而社区给出了一个较大的特性，即MirrorMaker 2.0，不论是准备做高可用还是单纯的数据备份，都不能绕过这个重大特性。而关于MirrorMaker 2.0的文章，网络上真是多如牛毛，质量也是参差

overfit同步小助手 2024-02-17 17:03:58 0 收藏