overfit同步小助手

2023-08-28 04:04:22

Kafka数据倾斜到某一个分区解决方案

1、原因：

我们使用Kafka时，某时需要消息消费是有序的，因此在生产者投递消息时，可能会指定分区，或者指定Key，此时可能会导致数据倾斜到某一个分区。

由于Kafka消费的特性，即一个消费组，那怕此时消费组有2个以上消费者，此时同一个主分区，只能被一个消费者消费，当生产消息大于消费消息时，就会出现单一分区数据倾斜。

2、解决：

根本原因，当指定分区，或者指定Key投递消息时。生产消息大于消费消息时，出现单一分区数据倾斜，此时消费端不能水平扩展。解决方案：

1、优化消费端的消费能力，如原来是200ms，优化后是50ms，当然可能无法优化;

2、二次消费用多个topic分摊分流消息，详细如下：

在消费端判定是哪个分区发生倾斜；
为这个发生倾斜的分区，建多个topic分摊分流，二次投递消费，水平扩展服务器；
topic分摊分流，根据指定的Key，弄一个算法，以确保相同的Key落在同一个分区；

标签： kafka 分布式大数据

本文转载自: https://blog.csdn.net/weixin_36741151/article/details/128732985
版权归原作者 D-小白兔 所有，如有侵权，请联系我们删除。

发表评论

登录后发布评论

“Kafka数据倾斜到某一个分区解决方案”的评论:

还没有评论

关于作者

overfit同步小助手

文章同步

相关阅读

网络安全法-网络运行安全

使用selenium/drissionpage时如何阻止chrome自动跳转http到https

docker desktop 里部署的Open WebUI 管理员密码忘记了的处理方法

在ubuntu20.04中搭建onsite比赛运行环境

利用开源的低代码表单设计器FcDesigner高效管理和渲染复杂表单结构

Kafka学习笔记

【前端】浏览器输入url到页面呈现发生了什么？

文章导航