kafka - overfit.cn

Kafka SASL/PLAIN加密及Kafka-Python整合

SASL/PLAIN是kafka中一种使用用户名/密码的身份验证机制，本文使用Kafka-Python2.02 及kafka3.2.0进行简单的整合操作。

overfit同步小助手 2022-10-11 07:22:50 0 收藏

[Spark、hadoop]spark Streaming的核心DStream

1.SparkStreaming提供了一个高级抽象的流，即DStream(离散流)。2.DStream的内部结构是由一系列连续的RDD组成，每个RDD都是一小段由时间分隔开来的数据集。

overfit同步小助手 2022-10-04 07:06:01 0 收藏

[平台运维、Hadoop]kafka streams概述

Kafka Streams是Apache Kafka开源项目的一个流处理框架，它是基于Kafka的生产者和消费者,为开发者提供了流式处理的能力,具有低延迟性.高扩展性、高弹性、高容错性的特点，易于集成到现有的应用程序中。KafkaStreams是一套处理分析Kafka中存储数据的客户端类库，处理完的

overfit同步小助手 2022-10-02 07:06:00 0 收藏

Docker搭建Kafka集群

详细讲解docker如何搭建Kafka集群

overfit同步小助手 2022-09-30 07:06:05 0 收藏

kafka是啥？虽然很难学，但是实验入门很简单

Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。kafka的三个基本组成是生产者、消费者、broker（生产者和消费者之间的消息队列服务器）。发布/订阅：消息的发布者不会将消息直接发送给特定的订阅者，而是将发布的消息分为不同的类别，订

overfit同步小助手 2022-09-27 07:05:48 0 收藏

Zookeeper和Kafka on k8s 部署

Apache ZooKeeper 是一个集中式服务，用于维护配置信息、命名、提供分布式同步和提供组服务，ZooKeeper 致力于开发和维护一个开源服务器，以实现高度可靠的分布式协调，其实也可以认为就是一个分布式数据库，只是结构比较特殊，是树状结构。Kafka是最初由 Linkedin 公司开发，是

overfit同步小助手 2022-09-26 09:06:20 0 收藏

湖仓一体电商项目（二十）：业务实现之编写写入DM层业务代码

DM层主要是报表数据，针对实时业务将DM层设置在Clickhouse中，在此业务中DM层主要存储的是通过Flink读取Kafka “KAFKA-DWS-BROWSE-LOG-WIDE-TOPIC” topic中的数据进行设置窗口分析，每隔10s设置滚动窗口统计该窗口内访问商品及商品一级、二级分类分析

overfit同步小助手 2022-09-25 08:02:28 0 收藏

图解Kafka消费者客户端分区分配策略

我们先看一下分区策略的类图/*** 返回序列化后的自定义数据} /*** 分区分配的计算逻辑/*** 当组成员从领导者那里收到其分配时调用的回调} /*** 指明使用的再平衡协议* 默认使用RebalanceProtocol.EAGER协议, 另外一个可选项为 RebalanceProtocol.C

overfit同步小助手 2022-09-24 14:02:34 0 收藏

湖仓一体电商项目（十八）：业务实现之编写写入DWD层业务代码

另外，在Flink处理此topic中每条数据时都有获取对应写入后续Kafka topic信息，本业务对应的每条用户日志数据写入的kafka topic为“KAFKA-DWD-BROWSE-LOG-TOPIC”，所以代码可以复用。以上代码执行后在，在对应的Kafka “KAFKA-DWD-BROWSE

overfit同步小助手 2022-09-23 07:22:33 0 收藏

湖仓一体电商项目（十六）：业务实现之编写写入ODS层业务代码

这里也可以不设置从头开始消费Kafka数据，而是直接启动实时向MySQL表中写入数据代码“RTMockDBData.java”代码，实时向MySQL对应的表中写入数据，这里需要启动maxwell监控数据，代码才能实时监控到写入MySQL的业务数据。以上代码执行后在，在对应的Kafka “KAFKA-

overfit同步小助手 2022-09-20 07:26:18 0 收藏

Kafka 生产者和消费者实例

基于命令行使用Kafka类似scala，mysql等，命令行是初学者操作Kafka的基本方式，kafka的模式是生产者消费者模式，他们之间通讯是通过，一个公共频道完成。指定消费者组ID，在同一时刻同一消费组中只有一个线程可以去消费一个分区数据，不同的消费组可以去消费同一个分区的数据。(查看Kafka

overfit同步小助手 2022-09-18 08:14:27 0 收藏

Flink - Kafka 下发消息过大异常分析与 Kafka Producer 源码浅析

Flink / Kafka 下发消息过大异常分析与 Kafka Producer 源码浅析。

overfit同步小助手 2022-09-14 07:24:36 0 收藏

Kafka集群部署与测试

Kafka集群部署与测试安装Kafka①、Alt+P 拷贝安装包 cd /opt/moduletar -zxvf /opt/software/kafka_2.11-2.0.0.tgz -C /opt/module/②、修改配置文件vi /opt/module/kafka_2.11-2.0.0/co

overfit同步小助手 2022-09-13 10:24:35 0 收藏

湖仓一体电商项目（十一）：编写写入DWS层业务代码

DWS层主要是存放大宽表数据，此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBase中“ODS_PRODUCT_CATEGORY”商品分类表与“ODS_PRODUCT_INFO”商品表维度数据获取浏览商品主题大宽表。Fl

overfit同步小助手 2022-09-11 11:24:37 0 收藏

湖仓一体电商项目（十二）：编写写入DM层业务代码

DM层主要是报表数据，针对实时业务将DM层设置在Clickhouse中，在此业务中DM层主要存储的是通过Flink读取Kafka “KAFKA-DWS-BROWSE-LOG-WIDE-TOPIC” topic中的数据进行设置窗口分析，每隔10s设置滚动窗口统计该窗口内访问商品及商品一级、二级分类分析

overfit同步小助手 2022-09-11 11:24:29 0 收藏

湖仓一体电商项目（十）：业务实现之编写写入DWD层业务代码

编写处理Kafka ODS层数据写入Iceberg-DWD层数据时，由于在Kafka “KAFKA-ODS-TOPIC”topic中每条数据都已经有对应写入kafka的topic信息，所以这里我们只需要读取“KAFKA-ODS-TOPIC”topic中的数据写入到Iceberg-DWD层中，另外动态

overfit同步小助手 2022-09-09 07:53:57 0 收藏

Kakfa怎么保证消息的一致性

Kafka的也存在Leader和Follow节点，这样就会有一致性问题。

overfit同步小助手 2022-09-08 07:54:13 0 收藏

Ubuntu 安装启动 Kafka

先关闭生产者和消费者客户端，再关闭kafka broker，最后关闭zookeeper。3.2 配置/config/zookeeper.properties。3.1 配置/config/server.properties。(1).存活时间(默认168)(2).配置IP与端口号。10.2 关闭zook

overfit同步小助手 2022-09-08 07:54:04 0 收藏

湖仓一体电商项目（九）：业务实现之编写写入DIM层业务代码

编写代码读取Kafka “KAFKA-DIM-TOPIC” topic维度数据通过Phoenix写入到HBase中，我们可以通过topic中每条数据获取该条数据对应的phoenix表名及字段名动态创建phoenix表以及插入数据，这里所有在mysql“lakehousedb.dim_tbl_conf

overfit同步小助手 2022-09-03 07:53:46 0 收藏

Kafka知识点总结

kafka最全总结

overfit同步小助手 2022-08-31 07:55:32 0 收藏