kafka - overfit.cn

Sqoop与Kafka的集成：实时数据导入

SqoopSqoop是一个开源工具，用于在Hadoop生态系统中传输数据和关系型数据库之间进行数据导入和导出。它使数据工程师能够轻松将结构化数据从关系型数据库导入到Hadoop集群中，以供进一步的数据处理和分析。Kafka是一个分布式流处理平台，用于构建实时数据流应用程序和数据管道。Kafka提供了

overfit同步小助手 2024-02-20 22:03:22 0 收藏

37、Flink 的CDC 格式：debezium部署以及mysql示例（1）-debezium的部署与示例

Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka 中。Debezium 为变更日志提供了统一的格式

overfit同步小助手 2024-02-20 20:03:47 0 收藏

springboot、spring-kafka、kafka-client的版本对应关系

在使用springboot集成kafka的时候需要注意springboot版本、引用的依赖spring-kafka版本和kafka中间件版本的对应关系，否则可能会因为版本不兼容导致出现错误。

overfit同步小助手 2024-02-20 14:03:30 0 收藏

Flink Upsert Kafka SQL Connector 介绍

overfit同步小助手 2024-02-20 09:02:24 0 收藏

Kafka——管理Kafka(命令行工具)详解

有时候，我们需要知道提交的消费者群组偏移量是多少，比如某个特定的群组是否在提交偏移量，或者偏移量提交的频度。也就是说，如果集群里有 5 个 broker，生产者的配额是 10MB/s，那么它可以以 10MB/s 的速率在单个 broker 上生成数据，总共的速率可以达到 50MB/s。根据分区

overfit同步小助手 2024-02-20 08:03:49 0 收藏

Flink与Kafka集成：实时数据流处理

1.背景介绍1. 背景介绍Apache Flink 是一个流处理框架，用于处理大规模、实时的数据流。它支持流式计算和批处理，可以处理各种数据源和数据接收器，如 Kafka、HDFS、TCP 流等。Kafka 是一个分布式流处理平台，用于构建实时数据流管道和流处理应用。Flink 与 Kafka 的集

overfit同步小助手 2024-02-20 04:03:54 0 收藏

Kafka(一)

Kafka传统定义：Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。Kafka最新定义： Kafka是一个开源的分布式事件流平台（Event Streaming Platform），被数千家公司用于高性能数据管道、流分析、

overfit同步小助手 2024-02-20 04:03:44 0 收藏

Kafka 生产调优

100 万日活，每人每天 100 条日志，每天总共的日志条数是 100 万 * 100 条 = 1 亿条。1 亿 / 24 小时 / 60 分 / 60 秒 = 1150 条/每秒钟。每条日志大小：0.5k ~ 2k（约1k）。1150 条/每秒钟 * 1k ≈ 1m/s。高峰期每秒钟：1150 条

overfit同步小助手 2024-02-19 22:03:20 0 收藏

从kafka如何保证数据一致性看通常数据一致性设计

在数据库系统中有个概念叫事务，事务的作用是为了保证数据的一致性，意思是要么数据成功，要么数据失败，不存在数据操作了一半的情况，这就是数据的一致性。在很多系统或者组件中，很多场景都需要保证数据的一致性，有的是高度的一致性。特别是在交易系统等这样场景。有些组件的数据不一定需要高度保证数据的一致性，比如日

overfit同步小助手 2024-02-19 10:03:50 0 收藏

jmx_exporter监控kafka和zk的jvm

介绍了jmx_exporter怎么监控kafka和zk的jvm

overfit同步小助手 2024-02-18 17:03:51 0 收藏

【Kafka】手把手SASL，SSL教学

kafka的SASL和SSL配置全指南

overfit同步小助手 2024-02-18 04:03:51 0 收藏

Docker下的Kafka

在上一篇文章中我们已经成功地拉取了3.5.9版本的zookeeper官方镜像以及bitnami镜像，下面将通过使用bitnami的Kafka镜像搭配使用bitnami的zookeeper镜像来体验Kafka的使用。Kafka是一个分布式流处理平台和消息队列系统，旨在实现高吞吐量、持久性的日志型消息传

overfit同步小助手 2024-02-18 04:03:44 0 收藏

【flink番外篇】18、通过数据管道将table source加入datastream示例

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-02-18 01:03:41 0 收藏

Kafka运维相关知识

Consumer 端还有一个参数，用于控制 Consumer 实际消费能力对 Rebalance 的影响，即 max.poll.interval.ms 参数，默认5min，Consumer 端应用程序两次调用 poll 方法的最大时间间隔，表示你的 Consumer 程序如果在 5 分钟之内无法消费

overfit同步小助手 2024-02-18 00:03:23 0 收藏

消息中间件：Puslar、Kafka、RabbigMQ、ActiveMQ

消息队列：它主要用来暂存生产者生产的消息，供后续其他消费者来消费。

overfit同步小助手 2024-02-17 22:03:14 0 收藏

Centos7.9安装kafka_2.12-3.6.1

目录一、安装 JDK 1.安装jdk

overfit同步小助手 2024-02-17 20:03:47 0 收藏

Kafka 社区KIP-382中文译文（MirrorMaker2/集群复制/高可用/灾难恢复）

译者：对于Kafka高可用的课题，我想每个公司都有自己的方案及思考，这是一个仁者见仁智者见智的命题，而社区给出了一个较大的特性，即MirrorMaker 2.0，不论是准备做高可用还是单纯的数据备份，都不能绕过这个重大特性。而关于MirrorMaker 2.0的文章，网络上真是多如牛毛，质量也是参差

overfit同步小助手 2024-02-17 17:03:58 0 收藏

Kafka 集群如何实现数据同步？

如果 follower 发现自己的 LEO（Log End Offset，日志结束偏移量）与 Leader 的 LEO 有差距时，会触发同步数据请求，以便将自身日志同步至 Leader 的对应位置，确保与 Leader 的数据保持一致。当一个副本被选举成为 follower 后，会启动副本的 fet

overfit同步小助手 2024-02-17 17:03:52 0 收藏

KAFKA监控方法以及核心指标

探讨kafka的监控数据采集方式以及需要关注的核心指标，便于日常生产进行监控和巡检。

overfit同步小助手 2024-02-17 13:03:49 0 收藏

怎样查看kafka写数据送到topic是否成功

属性来控制确认级别。当设置为 1 或 all 时，生产者会等待主题的 leader 和副本确认消息的写入，从而确保消息被成功写入到 Kafka。如果写入失败，生产者将会重试发送消息，直到达到确认级别。请注意，Kafka 是一种分布式消息系统，消息的写入和确认可能涉及多个节点和异步操作。：创建一个 K

overfit同步小助手 2024-02-17 06:03:56 0 收藏